Фундаментальные исследования


Выше уже отмечалось, что понятие онтологии предполагает определение и использование взаимосвязанной и взаимосогласованной совокупности трех

компонент: таксономии терминов, определений терминов и правил их обработки. Учитывая это, введем следующее определение понятия модели онтологии:

Под формальной моделью онтологии О будем понимать упорядоченную тройку вида:

X - конечное множество концептов (понятий, терминов) предметной области, которую представляет онтология О;

Конечное множество отношений между концептами (понятиями, терминами) заданной предметной области;

Ф - конечное множество функций интерпретации (аксиоматизация), заданных на концептах и/или отношениях онтологии О.

Заметим, что естественным ограничением, накладываемым на множество X, является его конечность и непустота. Иначе обстоит дело с компонентами Ф и 91 в определении онтологии О. Понятно, что и в этом случае Ф и 91 должны быть конечными множествами. Рассмотрим, однако, граничные случаи, связанные с их пустотой.

Пусть Тогда онтология О трансформируется в простой словарь:

Такая вырожденная онтология может быть полезна для спецификации, пополнения и поддержки словарей ПО, но онтологии-словари имеют ограниченное использование, поскольку не вводят эксплицитно смысла терминов. Хотя в некоторых случаях, когда используемые термины принадлежат очень узкому (например, техническому) словарю и их смыслы уже заранее хорошо согласованы в пределах определенного (например, научного) сообщества, такие онтологии применяются на практике. Известными примерами онтологий этого типа являются индексы машин поиска информации в сети Интернет.

Иная ситуация в случае использования терминов обычного естественного языка или в тех случаях, когда общаются программные агенты. В этом случае необходимо характеризовать предполагаемый смысл элементов словаря с помощью подходящей аксиоматизации, цель использования которой - в исключении нежелательных моделей и в том, чтобы интерпретация была единой для всех участников общения.

Другой вариант соответствует случаю но Ф 0. Тогда каждому элементу множества терминов из X может быть поставлена в соответствие функция интерпретации из Ф. Формально это утверждение может быть записано следующим образом.

где - множество интерпретируемых терминов;

Множество интерпретирующих терминов.

такие что

Пустота пересечения множеств исключает циклические интерпретации, а введение в рассмотрение функции к аргументов призвано обеспечить более полную интерпретацию. Вид отображения из Ф определяет выразительную мощность и практическую полезность этого вида онтологии. Так, если предположить, что функция интерпретации задается оператором присваивания значений где - имя интерпретации то онтология трансформируется в пассивный словарь

Такой словарь пассивен, так как все определения терминов из берутся из уже существующего и фиксированного множества Практическая ценность его выше, чем простого словаря! но явно недостаточна, например, для представления знаний в задачах обработки информации в Интернете в силу динамического характера этой среды.

Для того чтобы учесть последнее обстоятельство, предположим, что часть интерпретирующих терминов из множества задается процедурно, а не декларативно. Смысл таких терминов «вычисляется» каждый раз при их интерпретации. Ценность такого словаря для задач обработки информации в среде Интернет выше, чем у предыдущей модели, но все еще недостаточна, так как интерпретируемые элементы из никак не связаны между собой и, следовательно, играют лишь роль ключей входа в онтологию.

Для представления модели онтологии, которая нужна для решения задач обработки информации в Интернете, очевидно, требуется отказаться от предположения

Итак, предположим, что множество отношений на концептах онтологии не пусто, и рассмотрим возможные варианты его формирования.

Для этого введем в рассмотрение специальный подкласс онтологий - простую таксономию следующим образом:

Под таксономической структурой будем понимать иерархическую систему понятий, связанных между собой отношением («бытьэлементом класса»).

Отношение имеет фиксированную заранее семантику и позволяет организовывать структуру понятий онтологии в виде дерева. Такой подход имеет свои преимущества и недостатки, но в общем случае является адекватным и удобным для представления иерархии понятий.

Результаты анализа частных случаев модели онтологии приведены в таблице 8.1.

Таблица 8.1. Классификация моделей онтологии

Представления множества концептов X в виде сетевой структуры;

Использования достаточно богатого множества отношений , включающего не только таксономические отношения, но и отношения, отражающие специфику конкретной предметной области, а также средства расширения множества ;

Использования декларативных и процедурных интерпретаций и отношений, включая возможность определения новых интерпретаций.

Тогда можно ввести в рассмотрение модель расширяемой онтологии и исследовать ее свойства. Однако, учитывая техническую направленность данной книги, мы не будем делать этого здесь, а желающих познакомиться с такой моделью отсылаем к работе . Как показано в этой работе, модель расширяемой онтологии является достаточно мощной для спецификации процессов формирования пространств знаний в среде Интернет. Вместе с тем и эта модель является неполной в силу своей пассивности даже там, где определены соответствующие процедурные интерпретации и введены специальные функции пополнения онтологии. Ведь единственной точкой управления активностью в такой модели является запрос на интерпретацию определенного концепта. Этот запрос выполняется всегда одинаково и инициирует запуск соответствующей процедуры. А собственно вывод ответа на запрос и/или поиск необходимой для этого информации остается вне модели и должен реализовываться другими средствами.

Учитывая вышесказанное, а также необходимость эксплицитной спецификации процессов функционирования онтологии, введем в рассмотрение понятие онтологической системы

Под формальной моделью онтологической системы будем понимать триплет вида:

Онтология верхнего уровня (метаонтология);

Множество предметных онтологий и онтологий задач предметной области;

Е - модель машины вывода, ассоциированной с онтологической системой

Использование системы онтологий и специальной машины вывода позволяет решать в такой модели различные задачи. Расширяя систему моделей можно учитывать предпочтения пользователя, а изменяя модель машины вывода, вводить специализированные критерии релевантности получаемой в процессе поиска информации и формировать специальные репозитории накопленных данных, а также пополнять при необходимости используемые онтологии, о

В модели имеются три онтологические компоненты:

Метаонтология;

Предметная онтология;

Онтология задач.

Как указывалось выше, метаонтология оперирует общими концептами и отношениями, которые не зависят от конкретной предметной области. Концептами метауровня являются общие понятия, такие как «объект», «свойство», «значение» и т. д. Тогда на уровне метаонтологии мы получаем интенсиональное описание свойств предметной онтологии и онтологии задач. Онтология метауровня является статической, что дает возможность обеспечить здесь эффективный вывод.

Предметная онтология содержит понятия, описывающие конкретную предметную область, отношения, семантически значимые для данной предметной области, и множество интерпретаций этих понятий и отношений (декларативных и процедурных). Понятия предметной области специфичны в каждой прикладной онтологии, но отношения - более универсальны. Поэтому в качестве базиса обычно выделяют такие отношения модели предметной онтологии, как partjof, kindjof, contained_in, member_of, seealso и некоторые другие.

Отношение определено на множестве концептов, является отношением принадлежности и показывает, что концепт может быть частью других концептов. Оно является отношением типа «часть-целое» и по свойствам близко к отношению и может быть задано соответствующими аксиомами. Аналогичным образом можно ввести и другие отношения типа «часть-целое».

Иначе обстоит дело с отношением see also. Оно обладает другой семантикой и другими свойствами. Поэтому целесообразно вводить его не декларативно, а процедурно, подобно тому, как это делается при определении новых типов в языках программирования, где поддерживаются абстрактные типы данных;

Заметим, что и отношение see_also «не вполне» транзитивно. Действительно, если предположить, что (XI то можно считать, что (XI Однако по мере увеличения длины цепочки объектов,

связанных данным отношением, справедливость транзитивного переноса свойства connected_with падает. Поэтому в случае отношения see also мы имеем дело не с отношением частичного порядка (как, например, в случае отношения is_a), а с отношением толерантности. Однако для простоты это ограничение может быть перенесено из определения отношения в функцию его интерпретации.

Анализ различных предметных областей показывает, что введенный выше набор отношений является достаточным для начального описания соответствующих онтологий. Понятно, что этот базис является открытым и может пополняться в зависимости от предметной области и целей, стоящих перед прикладной системой, в которой такая онтология используется.

Онтология задач в качестве понятий содержит типы решаемых задач, а отношения этой онтологии, как правило, специфицируют декомпозицию задач на подзадачи. Вместе с тем, если прикладной системой решается единственный тип задач (например, задачи поиска релевантной запросу информации), то онтология задач может в данном случае описываться словарной моделью, рассмотренной выше. Таким образом, модель онтологической системы позволяет описывать необходимые для ее функционирования онтологии разных уровней. Взаимосвязь между онтологиями показана на рис. 8.6.

Рис. 8.6. Взаимосвязь между онтологиями онтологической системы

Машина вывода онтологической системы в общем случае может опираться на сетевое представление онтологий всех уровней. При этом ее функционирование будет связано:

С активацией понятий и/или отношений, фиксирующих решаемую задачу (описание исходной ситуации);

Определением целевого состояния (ситуации);

Выводом на сети, заключающемся в том, что от узлов исходной ситуации распространяются волны активации, использующие свойства отношений, с ними связанных. Критерием остановки процесса является достижение целевой ситуации или превышение длительности исполнения (time-out).

Введение

В последнее время использование онтологий для моделирования предметных областей автоматизированных информационных систем получает все более широкое распространение . Наиболее часто такой подход применяется для интеллектуальных систем , в частности, предназначенных для функционирования в сети Интернет. Это связано с тем, что онтологическая модель позволяет разработать модель метаданных, что значительно улучшает использование системы широким кругом пользователей с точки зрения организации взаимодействия.

Онтология - это структура, описывающая значения элементов некоторой системы, попытка структурировать окружающий мир, описать какую-то конкретную предметную область в виде понятий и правил, утверждений об этих понятиях, с помощью которых можно формировать отношения, классы, функции и пр. Онтологии предметных областей ограничиваются описанием мира в рамках конкретной предметной области.

Задача построения онтологической модели предметной области информационной системы для поддержки коммерциализации результатов инновационных разработок в научных исследованиях является актуальной и сложной научно-практической задачей. Сложность поставленной задачи определяется, в частности, наличием множества межпредметных и междисциплинарных связей и различными целями конечных пользователей системы: ученых, экспертов, бизнесменов, политиков, сотрудников общественных и коммерческих организаций.

Целью настоящей работы является разработка и создание онтологической модели предметной области информационной системы для поддержки коммерциализации результатов научных исследований.

Краткий обзор стандарта CERIF 2008

Во всех странах мира проводится множество различных научных исследований, причем схема проведения научных исследований в разных странах похожа. Как правило, сначала осуществляется стратегическое планирование, потом объявляется программа исследований, проходит поиск предложений, подходящие предложения принимаются к работе, результаты исследований отслеживаются, анализируются и впоследствии используются в тех или иных целях.

Исследования в одной и той же области знаний могут производиться одновременно в нескольких научных организациях, в том числе и в одной стране. Кроме того, в век глобализации исследовательские организации одной страны могут опираться в своей работе на результаты, полученные в других странах. Поэтому важно обеспечить обмен полной и достоверной информацией, наборами данных между различными странами и фондами на всех этапах проведения исследований, начиная с этапа подачи заявки и заканчивая этапом публикации рецензии на инновационную разработку. Проблема стандартизации данных научных исследований возникла ещё в 80-е годы прошлого века, и в качестве решения этой проблемы сначала появлялись варианты обобщения схем баз данных для хранения результатов научных исследований, на основе которых позднее возник стандарт CERIF (Common European Research Information Format - общий европейский формат для исследовательской информации) .

Моделированием предметной области научных исследований на основе этого стандарта в последние 14 лет в Евросоюзе активно занимается организация euroCRIS. Основные свойства этого стандарта:
1) стандарт поддерживает концепцию объектов или сущностей с атрибутами: например, таких как проект, человек, организация;
2) стандарт поддерживает n:m отношения между объектами, используя «связывающие отношения», и таким образом обеспечивает богатую семантику, включающую роли и временные характеристики;
3) стандарт полностью интернационален с точки зрения языкового или знакового набора;
4) стандарт расширяем без повреждения основной модели данных, что предоставляет возможность оперирования на основном уровне, не препятствуя ещё более широкому взаимодействию.

Основные объекты в стандарте CERIF - это Person, OrganisationUnit и Project (Человек, Организация и Проект), каждый из которых рекурсивно связан сам с собой и поддерживает отношения с другими объектами. Стандарт описывает множество дополнительных объектов, с помощью которых полностью описываются исследовательские проекты, их участники, результаты их совместной работы и пр. Семантика данных задается на специальном семантическом уровне, в таблицах, описывающих возможные роли и взаимодействия между отдельными объектами.

Взаимоотношения между проектом, человеком, организацией показываются в стандарте CERIF при помощи специальных связей, и их считают одной из сильных сторон модели CERIF. Связь всегда соединяет два объекта. Все связи строятся по одинаковой схеме: они наследуют названия и идентификаторы от объектов-родителей и дополнительно обладают атрибутами даты начала и конца действия связи, в каждой связи отражается семантика через ссылку на семантический слой CERIF посредством специальных идентификаторов. Таким образом, все возможные взаимоотношения между проектами, людьми и организациями задаются с помощью этих связей, а характер взаимоотношений подчиненности (кто чей автор, кто чей подданный, что часть чего и т.д.) показывается благодаря семантическому слою, в котором все эти роли расписаны.

Для отображения результатов научной деятельности в стандарте CERIF предусмотрены специальные объекты: ResultPublication, ResultPatent, ResultProduct (Публикация, Патент, Продукт). Помимо основных и результирующих объектов в CERIF также используется множество так называемых объектов второго уровня, таких как: FundProg - программа финансирования, Event - событие, Prize - вознаграждение, Facil - средства обслуживания, Equip - оборудование и т.д. Объекты второго уровня позволяют представить контекст исследования посредством связей с основными и результирующими объектами.

Модель CERIF поддерживает возможность многоязычности для имен, названий, описаний, ключевых слов, обобщений и даже для семантики. Используемый язык хранится в атрибуте LangCode с максимум пятизначными значениями (например, en, de, fr, si, en-uk, en-us, fr-fr, fr-be, fr-nl). Атрибут Trans предоставляет информацию о типе перевода: o=original (язык оригинала), h=human (перевод человеком), или m=machine (машинный перевод). Помимо основных, результирующих и объектов второго уровня многоязычность поддерживают также и классификаторы на семантическом уровне CERIF. Таким образом, становится возможным поддерживать классификационные схемы на различных языках.

Стандарт CERIF рекомендован к использованию в системах CRIS (Current Research Information Systems - информационные системы по актуальным научным исследованиям) , которые собирают воедино всю информацию, лежащую в основе научных исследований. Использование подобных систем значительно облегчает взаимодействие инвесторов и исследователей. Исследовательские группы получают лёгкий доступ к информации, необходимой для разработки инновационных идей, руководители и управляющий персонал получают возможность проще отслеживать и оценивать текущую исследовательскую деятельность, инвесторы и исследовательские советы могут оптимизировать процесс финансирования инновационных проектов.

Реальный пример использования стандарта - это портал IST World, построенный на основе стандарта CERIF. Он предоставляет информацию об экспертах, исследовательских группах, центрах и компаниях, задействованных в создании технологий для растущего информационного сообщества. Главный акцент сервиса - экспертиза и опыт основных участников процесса в европейских странах. Репозиторий содержит информацию по проектам пятой, шестой и седьмой рамочных программ Европейской Комиссии, а также информацию, связанную с этими научно-исследовательскими проектами, собранную в Болгарии, Кипре, Чехии, Эстонии, Венгрии, Латвии, Литве, Мальте, Польше, Румынии, России, Сербии, Словении, Словакии и Турции.

В России единой системы по текущим научным исследованиям не существует. Все попытки создания таких систем проходят разобщено в рамках различных программ и проектов. В Черноголовке в рамках Российской академии наук по гранту HAAB реализуется проект, целью которого является создание и разработка информационной системы для поддержки коммерциализации результатов интеллектуальной деятельности для предоставления заинтересованным юридическим и физическим лицам данных об инновационных разработках институтов РАН с возможной их последующей коммерциализацией. В этой системе под инновационными разработками понимаются информационные образы объектов интеллектуальной собственности, технических решений, а также технологические запросы, идеи и иные нематериальные активы, полученные в результате научно-технической деятельности.

Анализируя стандарт CERIF, обнаруживаем, что он не охватывает предметные области, связанные с работой экспертов и подготовкой инновационной разработки к процессу коммерциализации. Поэтому авторами было предложено расширение модели, предлагаемой этим стандартом на указанные выше предметные области.

Инновационный процесс со структурной точки зрения представляет собой комплекс последовательно взаимосвязанных действий по созданию, освоению и распространению инновации. Инновационный процесс предполагает эволюционное изменение состояния инновационного продукта, его превращение из идеи в товар, а также мониторинг его дальнейшей рыночной судьбы.

Модель предметной области для поддержки инновационных разработок

Предметная область информационной системы для поддержки коммерциализации результатов научных исследований является суммой объединения совокупности нескольких предметных областей, а именно предметной области научных исследований, предметной области по возможным областям внедрения и предметной области экспертов по коммерциализации инновационных разработок. При этом последнее слагаемое должно помогать решать следующую задачу: динамически формировать пути взаимодействия в отношении «многие-ко-многим» между первыми двумя слагаемыми.

Онтология области научно-исследовательской деятельности представляет собой структуру системы, отображающей процесс научной деятельности. Научные исследования возможны только при наличии полной и достоверной информации и наборов данных: начиная с этапа подачи заявки и заканчивая этапом публикации рецензии на разработку. Информационные системы по текущим исследованиям должны собирать воедино всю информацию, лежащую в основе научных исследований. Подобные системы могут использоваться широким кругом лиц: от исследователей до инвесторов. Научно-исследовательские организации могут размещать через интернет информацию о своих инновационных разработках и выполнять поиск предложений потенциальных инвесторов и заказчиков, потенциальные инвесторы и заказчики могут размещать заказы на выполнение НИОКР и предложения об инвестициях в сфере высоких технологий и выполнять поиск инновационных разработок.

В предметной области по научным исследованиям можно выделить следующие основные классы (Рис.1):


Рисунок 1. Основные классы предметной области по научным исследованиям

Проект содержит информацию о проектах, исследованиях, результатом которых будут инновационные разработки в том или ином виде, а также об их сроках. Проекты могут быть связаны с другими проектами, связаны с людьми, организациями, патентами, публикациями, продуктами и др. объектами системы.

Организация содержит информацию об организациях, имеющих отношение к проектам. Содержит описание организации: валюту расчётов, численность сотрудников, оборот и т.д. Организации также могут быть взаимосвязаны и связаны с другими объектами системы.

Человек содержит информацию о людях, задействованных в научных проектах. Люди также могут быть взаимосвязаны и связаны с другими объектами.

Дополнительный объект Имена содержит информацию о различных вариантах написания имени одного человека, в том числе и на разных языках.

Публикация содержит информацию о результатах исследований в виде публикаций. Содержит выходные данные о публикации: о дате выхода, издании, серии, страницах, ISBN, ISSN, краткое содержание, комментарии и пр. Публикации могут быть взаимосвязаны и связаны с другими результатами исследований, а также с другими объектами системы: проектом, организациями, людьми и т.д.

Патент содержит информацию о патентах, выданных на результаты исследований. Содержит сведения о стране выдачи патента, дате регистрации и краткое содержание. Патенты могут быть связаны с публикациями, проектами, организациями и людьми.

Продукт содержит информацию о продуктах, полученных в результате исследований, т.е. об инновационных разработках, а также описание продукта. Продукты могут быть связаны с публикациями, проектами, людьми, организациями.

Дополнительные объекты, предусмотренные стандартом CERIF, также оказываются задействованными в подсистеме: Язык служит для отображения информации о языке представления данных в системе, Адрес - для отображения информации о физических адресах людей и организаций, ЭлектронныйАдрес - для отображения информации об электронных адресах людей и организаций, Страна - для отображения информации о странах, Валюта - для информации о валютах, ПрограммаФинансирования - для информации о программе, в рамках которой выполняется проект, и т.д.

При помощи объектов семантического уровня Класс и КлассификационнаяСхема характеризуются типы отношений, формы заявлений, классификация субъектов. Например, для обозначения типов публикаций или видов продуктов и т.д.

В предметной области возможных областей внедрения можно выделить следующие классы (Рис.2):
Организация содержит информацию об организациях, заинтересованных в инвестировании в инновационные разработки, в проведении НИОКР. Содержит описание организации: валюту расчётов, численность сотрудников, оборот и т.д.

Человек содержит информацию о людях, занятых в организациях, или об индивидуальных потенциальных инвесторах. Люди могут быть взаимосвязаны и связаны с другими объектами. Для данной предметной области также применим объект Имена, который содержит информацию о различных вариантах написания имени одного человека. Предложение содержит информацию о предложениях от потенциальных инвесторов на проведение НИОКР, на инвестиции, на разработку определённой темы. Содержит описания предложений, а так же информацию об их сроках. Предложения могут быть взаимосвязаны, а так же связаны с людьми, организациями и др. объектами системы. Патент содержит информацию о патентах на разработки, в которые организация хочет инвестировать. Продукт содержит информацию об интересных инвесторам продуктах.

По аналогии с предметной областью научных исследований в предметной области возможных областей внедрения можно выделить дополнительные объекты: Язык, Адрес, ЭлектронныйАдрес, Страна, Валюта и др. Для характеристики типов отношений между объектов и для классификации самих объектов также можно использовать объекты семантического уровня Класс и КлассификационнаяСхема.

Рисунок 3. Основные классы предметной области экспертов.

В предметной области по экспертной оценке возможности коммерциализации инновационных разработок можно выделить следующие классы (Рис.3):

Человек содержит информацию об экспертах, проводящих оценку и анализ инновационных разработок и выносящих решение о возможности их коммерциализации. Тот же дополнительный объект Имена содержит информацию о различных вариантах написания имени одного человека.

Организация содержит информацию об организациях, в которых заняты эксперты. Продукт содержит информацию о научно-технических разработках, оценкой которых занимаются эксперты. Отдельно можно выделить объект Оценка для хранения заключений экспертов о возможности коммерциализации разработок.

По аналогии с предметными областями научных исследований и возможных областей внедрения в предметной области экспертов можно выделить дополнительные объекты: Язык, Адрес, ЭлектронныйАдрес, Страна, Валюта и др.

Общая структура, объединяющая все три подсистемы, в полной мере отражает процесс проведения научных исследований и оценки возможности их коммерциализации (Рис.4).



Рисунок 4. Предметная область информационной системы для поддержки коммерциализации результатов научных исследований

Основные принципы построения информационной системы и ее пользователи

В информационной системе для поддержки коммерциализации результатов научных исследований РАН можно выделить три подсистемы: подсистема научных исследований, проводимых в институтах РАН (подсистема институтов), подсистема возможных областей внедрения (подсистема потенциальных инвесторов) и подсистема экспертной оценки возможности коммерциализации инновационных разработок (подсистема экспертов). Соответственно, в каждой подсистеме можно выделить три группы пользователей - группа владельцев интеллектуальной собственности (исследователей), группа экспертов и группа инвесторов.

В информационной системе каждый пользователь - владелец объекта интеллектуальной собственности (исследователь) - независимо от степени завершенности своей разработки (патент, решение, идея и т. п.) может представить информацию об ОИС, о своих научно-технических разработках в виде совокупного информационного образа инновационной разработки, в которую могут быть включены резюме, технологическое предложение, информация о владельце и пр. Кроме того, он может добавить сведения о патентной защищенности своих разработок, а также разместить дополнительную информацию о них. Потенциальные инвесторы, заказчики НИОКР или их представители могут разместить в системе свои предложения об инвестициях, информацию о своих потребностях (интересах) и заказы на проведение НИОКР, на экспертную оценку инновационной разработки, проводить поиск инновационных разработок, ознакомиться с уже имеющимися экспертными оценками разработок. В системе может быть предусмотрена отдельная виртуальная площадка для экспертов, которые могут разрабатывать опросный лист (оформить технологический аудит), проводить анализ бизнес-идей и оценивать инвестиционную привлекательность инновационных разработок. Каждый пользователь информационной системы в зависимости от своих интересов имеет возможность проводить поиск информационных объектов и сопутствующей информации, их отбор, анализ, чтобы впоследствии принять решение о целесообразности дальнейших контактов.

Незарегистрированный в системе пользователь, используя возможности гостевого входа, может также принять заочное участие в работе информационной системы. Ознакомившись с открытыми к просмотру резюме инновационных разработок, предложениям инвесторов, оценками экспертов, он может решить, имеются ли в системе интересующие его разработки или предложения для исследований, понять, по каким критериям идет оценка инвестиционной привлекательности экспертами, а затем принять решение о регистрации и дальнейшей работе в информационной системе по поддержке коммерциализации научных исследований.

Заключение

Авторы считают, что в данной работе новыми являются следующие положения и результаты: онтологическая модель предметной области информационной системы поддержки жизненного цикла инновационных разработок институтов РАН.

Разработанная модель позволяет разработать программную архитектуру такой системы, разработать метаданные и построить совокупность взаимосвязанных тезаурусов для поддержки семантики запросов конечных пользователей.

Литература:
1. Лапшин В.А. Онтологии в компьютерных системах. - М.: Научный мир, 2010.- 222 с.
2. Gruber T.R. The role of common ontology in achieving sharable, reusable knowledge bases // Principles of Knowledge Representation and Reasoning. Proceedings of the Second International Conference. J.A. Allen, R. Fikes, E. Sandewell - eds. Morgan Kaufmann, 1991, P.601-602.
3. Константинова Н.С. Онтологии как системы хранения знаний [Электронный ресурс] / Н.С. Константинова, О.А. Митрофанова. - Режим доступа: http://www.sci-innov.ru/icatalog_new/index.php?action=send_att&entry_id=68352&fname=68352e2-st08_(Митрофанова О.А.).pdf
4. CERIF 2008 - 1.2 Full Data Model (FDM). Introduction and Specification [Электронный ресурс] - Режим доступа: http://www.eurocris.org/Uploads/Web%20pages/CERIF2008/Release_1.2/CERIF2008_1.2_FDM.pdf
5. Кулагин М.В., Лопатенко А.С. Научные информационные системы и электронные библиотеки. Потребность в интеграции // Сборник трудов Третьей Всероссийской конференции по электронным библиотекам. RCDL"2001 Петрозаводск, 11-13 сентября 2001 г., с. 14-19.

НАЧАЛО — Онтологии в корпоративных системах. Часть I

Онтологические системы могут применяться для решения задач в сфере бизнеса, создания интеллектуальных систем, представления знаний в Интернет. Круг технологий, связанных с этим вопросом, весьма широк и включает в себя мультиагентные системы, автоматическое извлечение знаний из текстов на естественном языке, поиск информации, интеллектуальное аннотирование, автоматическое составление авторефератов и прочее.

Во второй части статьи вкратце рассмотрены теоретические понятия, инструментальные средства, практические примеры применения.

ФОРМАЛЬНАЯ МОДЕЛЬ ОНТОЛОГИИ

Онтология состоит из терминов (понятий), их определений и атрибутов, а также связанных с ними аксиом и правил вывода.

Формальная модель онтологии O= — это упорядоченная тройка конечных множеств, где:

  • Т — термины прикладной области (ПрО), которую описывает онтология O;
  • R — отношения между терминами заданной ПрО;
  • F — функции интерпретации, заданные на терминах и/или отношениях онтологии O.

Модели онтологий классифицируются таким образом:

  • простые (имеют лишь концепты);
  • на основе фреймов (имеют лишь концепты и свойства);
  • на основе логик (например Ontolingua, DAML+OIL).

Отношения представляют тип взаимодействия между концептами ПрО . Пример бинарного отношения — «является частью». Следует заметить, что отношения, которые целесообразно использовать при создании онтологии, значительно менее разнообразны, чем термины, и, как правило, не специфичны для конкретной ПрО («часть-целое», «является подклассом», «оказывает воздействие», «похоже на» и т. п.).

Аксиомы используются для моделирования утверждений, которые всегда являются истинными.

Между концептами могут быть установлены определенные виды связей. Словарь терминов в определенной прикладной области, тезаурус со своими понятиями (концептами) и связи, которые определяют термины естественного языка, могут рассматриваться как онтологии. Для установления связи между вербально определенными концептами и поиском концептов релевантных запросов используются методы получения информации. Известными примерами онтологии такого типа являются индексы поисковых машин информации в Интернет.

Для описания более сложных систем вводят такие понятия, как модель расширяемой онтологии .

ЯЗЫКИ ОПИСАНИЯ ОНТОЛОГИЙ

Для того чтобы реализовывать различные онтологии, необходимо разработать языки их представления, имеющие достаточную выразительную мощность и позволяющие пользователю избежать «низкоуровневых» проблем.

Ключевым моментом в проектировании онтологии является выбор соответствующего языка спецификации онтологий (Ontology specification language). Цель таких языков — дать возможность указывать дополнительную машинно-интерпретируемую семантику ресурсов, сделать машинное представление данных более похожим на положение вещей в реальном мире, существенно повысить выразительные возможности концептуального моделирования слабо структурированных Web-данных.

Распространение онтологического подхода к представлению знаний оказало содействие при создании разнообразных языков представления онтологии и инструментальных средств, предназначенных для их редактирования и анализа.

Существуют традиционные языки спецификации онтологий: Ontolingua, CycL, языки, основанные на дескриптивных логиках (такие как LOOM), языки, основанные на фреймах (OKBC, OCML, Flogic).

Более поздние языки основаны на Web-стандартах (XOL, SHOE, UPML). Специально для обмена онтологиями через Web были созданы RDF(S), DAML, OIL, OWL, которые будут рассмотрены далее.

В целом, различие между традиционными и Web-языками спецификации онтологии заключается в выразительных возможностях описания предметной области и некоторых возможностях механизма логического вывода для этих языков. Типичные примитивы языков дополнительно включают:

  • конструкции для агрегирования, множественных иерархий классов, правил вывода, аксиом;
  • различные формы модуляризации для записи онтологий и взаимоотношений между ними;
  • возможность мета-описания онтологии, что полезно при установлении отношений между различными видами онтологий. Сегодня некоторые из таких языков приобрели большую популярность и широко применяются (в частности для описания информационных ресурсов и сервисов Интернет).

Язык RDF . В рамках проекта семантической интерпретации информационных ресурсов Интернет (Semantic Web) был предложен стандарт описания метаданных о документе Resource Description Framework, использующий XML-синтаксис.

RDF использует базовую модель данных «объект — атрибут — значение» и способен сыграть роль универсального языка описания семантики ресурсов и взаимосвязей между ними. Ресурсы описываются в виде ориентированного размеченного графа — каждый ресурс может иметь свойства, которые в свою очередь также могут быть ресурсами или их коллекциями. Все словари RDF используют базовую структуру, описывающую классы ресурсов и типы связей между ними. Это позволяет использовать разнородные децентрализованные словари, созданные для машинной обработки по разным принципам и методам. Важной особенностью стандарта является расширяемость: можно задать структуру описания источника, используя и расширяя такие встроенные понятия RDF-схем, как классы, свойства, типы, коллекции. Модель схемы RDF включает наследование классов и свойств.

RDF уже получил поддержку многих ведущих производителей ПО. Разработан ряд программных продуктов, позволяющих создавать RDF-описания для разного рода систем. Предполагаются возможности интеграции существующих хранилищ информации в общую базу семантического описания и интеграции концепции RDF-базы с форматом MPEG. RDF Schema — стандарт, предложенный по инициативе W3C для представления онтологических знаний. Он специфицирует множество всевозможных допустимых схем данных. Модели предметных областей описываются посредством ресурсов, свойств и их значений. RDFS предоставляет хорошие базовые возможности для описания словарей типов предметных областей. Одно из ограничений — невозможность с помощью RDFS выразить аксиоматические знания, т. е. задать аксиомы и правила вывода, построенные на них.

DAML+OIL — семантический язык разметки Web-ресурсов, расширяющий стандарты RDF и RDF Schema за счет более полных примитивов моделирования. Последняя версия DAML+OIL обеспечивает богатый набор конструкций для создания онтологии и разметки информации таким образом, чтобы их могла читать и понимать машина.

Первыми предложениями по описанию онтологии на базе RDFS были DARPA DAML-ONT (DARPA Agent Markup Language) и European Commission OIL (Ontology Inference Layer). Эти стандарты спецификации и обмена онтологиями были разработаны для поддержки процесса обмена знаниями и интеграции знаний. На базе этих предложений и возникло совместное решение DAML+OIL. Онтология DAML+OIL состоит из: заголовков (headers); элементов классов (class elements); элементов свойств (property elements); экземпляров (instances).

OWL (Web Ontology Language) — язык представления онтологий, расширяющий возможности XML, RDF, RDF Schema и DAML+OIL. Этот проект предусматривает создание мощного механизма семантического анализа. Планируется, что в нем будут устранены ограничения конструкций DAML+OIL.

Онтологии OWL — это последовательности аксиом и фактов, а также ссылок на другие онтологии. Они содержат компоненту для записи авторства и другой подробной информации, являются документами Web, на них можно ссылаться через URI.

В упоминавшемся уже проекте Semantic Web «машинная обработка смысла» контента будет сделана максимально четкой при помощи пометки документов указателем «с полным смыслом» на основе использования онтологических терминов. Таким образом, онтологии рассматриваются как ключевая технология для использования в Semantic Web (рис. 1).

Онтологии играют важную роль в организации обработки знаний на основе Web, а также для их совместного использования. Онтологии, определяемые как совместно используемые формальные концепции конкретных предметных областей, дают общее представление о темах, информацией о которых могут обмениваться и люди, и приложения. Онтологии отличаются от XML-схем тем, что это представления знаний, а не форматы сообщений (большинство Web-стандартов состоят из комбинации форматов сообщений и спецификаций протоколов).

ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ОБРАБОТКИ ОНТОЛОГИЙ

Одним из достоинств онтологии является наличие для них инструментального ПО, обеспечивающего общую доменно-независимую поддержку онтологического анализа. Существует целый ряд инструментов для онтологического анализа, поддерживающих редактирование, визуализацию, документирование, импорт и экспорт онтологий разных форматов, их представление, объединение, сравнение.

Редакторы

Ontolingua. Кроме собственно редактора онтологии, эта система содержит сетевой компонент Webster, предназначенный для определения концептов, сервер, обеспечивающий доступ к онтологиям Ontolingua по протоколу OKBC (Open Knowledge Base Connectivity), и Chimaera — инструментарий для анализа и объединения онтологий.

Protégé — свободно распространяемая Java-программа, предназначенная для построения (создания, редактирования и просмотра) онтологий той или иной прикладной области. Она включает редактор онтологии, позволяющий проектировать онтологии, разворачивая иерархическую структуру абстрактных и конкретных классов и слотов. На основе сформированной онтологии Protégé позволяет генерировать формы получения знаний для введения экземпляров классов и подклассов.

Инструмент поддерживает использование языка OWL и позволяет генерировать html-документы, отображающие структуру онтологий. Поскольку он использует фреймовую модель представления знаний ОКВС, это позволяет адаптировать его и для редактирования моделей ПрО, представленных не в OWL, а в других форматах (UML, XML, SHOE, DAML+OIL, RDF и RDFS и т. п.).

DOE — простой редактор, который позволяет пользователю создавать онтологии. Процесс спецификации онтологии состоит из трех этапов.

На первом этапе пользователь строит таксономию понятий и отношений, явным образом очерчивая позицию каждого элемента (понятие) в иерархии. Затем пользователь указывает, в чем специфика понятия относительно его «родителя», и в чем это понятие подобно или отлично от его «братьев». Пользователь может также прибавить синонимы и энциклопедическое определение на нескольких языках для всех понятий.

На втором этапе две таксономии рассматриваются с разных точек зрения. Пользователь может расширить их новыми объектами или добавить ограничения на области отношений.

На третьем этапе онтология может быть переведена на язык представления знаний.

OntoEdit — инструментальное средство, обеспечивающее просмотр, проверку и модификацию онтологии. Оно поддерживает языки представления онтологии OIL и RDFS, а также внутренний язык представления знаний OXML, основанный на XML. Как и Protégé, это автономное Java-приложение, но его коды закрыты. Свободно распространяемая версия OntoEdit Free ограничена 50 концептами, 50 отношениями и 50 экземплярами.

OilEd -автономный графический редактор онтологии, разработанный в рамках проекта Оп-То-Knowledge. Он свободно распространяется по общедоступной лицензии GPL. Инструмент использует для представления онтологий язык OIL. В OilEd отсутствует поддержка экземпляров классов.

WebOnto разработан для просмотра, создания и редактирования онтологий. Для моделирования онтологий он использует язык OCML (Operational Conceptual Modeling Language). Пользователь может создавать различные структуры, в том числе классы со множественным наследованием. Инструмент имеет ряд полезных особенностей: просмотр отношений, классов и правил, возможна совместная работа над онтологией нескольких пользователей.

ODE (Ontological Design Environment) взаимодействует с пользователями на концептуальном уровне, обеспечивает их набором таблиц для заполнения (концептов, атрибутов, отношений) и автоматически генерирует код на языках LOOM, Ontolingua и FLogic. Инструмент получил свое развитие в WebODE, который интегрирует все сервисы ODE в единую архитектуру, сохраняя свои онтологии в реляционной БД.

Сложные инструментальные средства

Эти средства нужны для того, чтобы не только вводить и редактировать онтологическую информацию, но и анализировать ее, выполняя типичные операции над онтологиями, например:

  • выравнивание (alignment) — установка различного вида соответствий между двумя онтологиями для того, чтобы они могли использовать информацию друг друга;
  • отображение (mapping) — нахождение семантических связей между подобными элементами разных онтологий;
  • объединение (merging) — операция, которая по двум онтологиям генерирует третью, объединяющую информацию из первых двух.

PROMPT служит для объединения и группировки онтологий. Это дополнение к системе Protégé, реализованное в виде плагина. По двум онтологиям, которые надо объединить, PROMPT строит список операций (например, объединение терминов или их копирование в новую онтологию) и передает его пользователю, который может выполнить одну из предлагаемых операций. Затем список операций модифицируется, и создается список конфликтов и их возможных решений. Это повторяется до тех пор, пока не будет готова новая онтология.

Chimaera — интерактивный инструмент для объединения онтологии, базирующийся на редакторе онтологий Ontolingua.

В OntoMerge исходные онтологии транслируются в общее представление на специальном языке.

OntoMorph определяет набор операторов преобразования, которые можно применить к онтологии.

OBSERVER объединяет онтологии с информацией об отображении между ними и находит синонимы в исходных онтологиях.

ONION базируется на алгебре онтологии и предоставляет инструменты для определения правил артикуляции (соединения) между онтологиями.

МЕТОДОЛОГИЯ СОЗДАНИЯ ОНТОЛОГИЙ

Практическая разработка онтологии включает:

  • определение классов в онтологии;
  • расположение классов в таксономическую иерархию (подкласс — надкласс);
  • определение слотов и описание допускаемых значений этих слотов;
  • заполнение значений слотов экземпляров.

После этого можно создать базу знаний, определив отдельные экземпляры этих классов, введя в определенный слот значение и дополнительные ограничения для слота.

Выделим некоторые фундаментальные правила разработки онтологии. Они выглядят довольно категоричными, но во многих случаях помогут принять верные проектные решения.

  • Не существует единственно правильного способа моделирования предметной области — всегда существуют жизнеспособные альтернативы. Лучшее решение почти всегда зависит от предполагаемого приложения и ожидаемых расширений.
  • Разработка онтологии — это обязательно итеративный процесс.
  • Понятия в онтологии должны быть близки к объектам (физическим или логическим) и отношениям в интересующей предметной области. Скорее всего, это существительные (объекты) или глаголы (отношения) в предложениях, которые описывают предметную область.

Знание того, для чего предполагается использовать онтологию, и того, насколько детальной или общей она будет, может повлиять на многие решения, касающиеся моделирования.

Нужно определить, какая из альтернатив поможет лучше решить поставленную задачу и будет более наглядной, более расширяемой и более простой в обслуживании. Следует помнить, что онтология — это модель реального мира, и понятия в онтологии должны отражать эту реальность.

После того как определена начальная версия онтологии, мы можем оценить и отладить ее, используя ее в каких-то приложениях и/или обсудив ее с экспертами предметной области. В результате начальную онтологию скорее всего нужно будет пересмотреть. И этот процесс итеративного проектирования будет продолжаться в течение всего жизненного цикла онтологии.

Повторное использование существующих онтологии может быть необходимым, если системе нужно взаимодействовать с другими приложениями, которые уже вошли в отдельные онтологии или контролируемые словари. Многие полезные онтологии уже доступны в электронном виде и могут быть импортированы. Существуют библиотеки повторно используемых онтологий, например Ontolingua или DAML . Существует также ряд общедоступных коммерческих онтологий, например UNSPSC , RosettaNet , DMOZ .

ОРГАНИЗАЦИОННЫЕ ОНТОЛОГИИ И ПОРТАЛЫ ЗНАНИЙ

Несмотря на то что разработано уже много онтологии, отражающих знания о самых разнообразных объектах, при описании конкретных субъектов экономической деятельности надо учитывать их специфику и вносить ее в соответствующие онтологические модели.

Онтологическое представление знаний о субъектах экономической деятельности, которые входят в состав какой-либо системы, можно использовать для объединения их информационных ресурсов в единое информационное пространство (рис. 2).

Онтология предприятия содержит классы понятий с заданными на них семантическими отношениями. Она состоит из набора технологических онтологий и организационной онтологии , отражающей организационно-функциональную структуру предприятия: состав штатного расписания (работники, администрация, обслуживающий персонал), партнеры, ресурсы и т. п. и отношения между ними. Онтологии технологий содержат понятия, описывающие производственные процессы. Общие знания ПрО, к которой относятся субъекты экономической деятельности, отображает онтология отрасли .

Разработанные онтологии позволят сотрудникам одной отрасли или корпорации использовать общую терминологию и избежать взаимных недоразумений, которые могут усложнить сотрудничество и привести к серьезным убыткам (например, организационная онтология четко отражает взаимную иерархию и связи между подразделениями предприятия, а также сферы их компетенции, а ссылки на определенные нормативные документы обеспечивают одинаковую базу для переговоров). Они обеспечат работу со структурированными источниками данных, для которых может быть построена схема данных, то есть описаны типы данных и связи между ними, и существует формальный способ получения отдельных элементов данных. Примерами структурированных источников данных можно считать различные базы данных (например реляционные и объектные), а также слабо структурированные ресурсы, описанные в форматах XML, RDF, OWL, DAML+OIL.

В качестве примера практического использования онтологических моделей технологий приведем систему ONTOLOGIC , предназначенную для создания и поддержки распределенных систем нормативно-справочной информации (НСИ), ведения словарей, справочников и классификаторов и поддержки системы кодирования объектов учета (см. рис. 3).

Основу системы составляет технологическая среда для постоянного, в режиме реального времени, взаимодействия пользователей: потребителей информации (сотрудников служб и функциональных подразделений) и экспертов, отвечающих за ведение нормативно-справочной информации.

Для обеспечения однозначной идентификации и классификации объектов в системах НСИ разработана методика, использующая онтологическую модель формального описания классифицируемых данных, обеспечивающая выделение ключевых свойств объектов классификации и построение на их основе классификационного кода. Выделяются классы (группы однородной продукции) по принципу однородности набора технических и потребительских характеристик, и для каждого материала формируется классификационный код, включающий код класса и коды всех свойств и их значений для данного материала.

Онтология обеспечивает непротиворечивое накопление любого количества информации в стандартной структуре классификации. Такой подход гарантирует однозначную идентификацию ресурсов независимо от различных трактовок их наименований разными производителями.

Данная технология предусматривает создание типового решения для управления основными данными и НСИ для промышленных предприятий, холдингов и государственных структур. В качестве технологической платформы используется SAP MDM (Master Data Management), предназначенный для интеграции различных (в том числе разноплатформенных) приложений в масштабе компании, холдинга, отрасли, госструктуры и т. п., а также для организации и управления отраслевой или корпоративной нормативно-справочной информацией (мастер-данными).

ПРИМЕРЫ ПРИМЕНЕНИЯ ОНТОЛОГИЙ

TOVE (Toronto Virtual Enterprise). Цель проекта — создание модели данных, которая должна:

  • обеспечить общую терминологию для предметной области, приложения которой могут совместно использоваться и пониматься каждым участником общения;
  • дать точное и по возможности непротиворечивое определение значения каждого термина на основе логики первого порядка;
  • обеспечить задание семантики с помощью множества аксиом, которые автоматически позволяют получать ответ на множество вопросов о предметной области.

TOVE должно обеспечить построение интегрированной модели некоторой предметной области, состоящей из следующих онтологии: операций, состояний и времени, организации, ресурсов, продуктов, сервиса, производства, цены, количества.

Ontolingua — система, разработанная в Стэнфордском университете, которая обеспечивает распределенную совместную среду для просмотра, создания, редактирования, модификации и использования онтологии. Сервер системы поддерживает до 150 активных пользователей, некоторые из которых дополняют систему описанием своих проектов.

Среди множества других проектов Ontolingua использует проект Enterprise project.

Enterprise Project. Целью проекта является улучшение (где необходимо, замена) существующих методов моделирования при помощи набора средств, позволяющих интегрировать различные методы и средства моделирования предприятия. Предполагается создание таких инструментальных средств, которые обеспечат: фиксирование и описание конкретной предметной области; определение задач и требований (согласующихся с онтологией); определение и оценку вариантов решений и альтернативных проектов, реализацию выбранной стратегии.

При независимой разработке инструментальных средств возможно использование разной терминологии, что может привести к конфликтам и неоднозначности при их интегрировании. Для решения этой проблемы была построена онтология, в которой задан набор часто используемых и общепринятых терминов, таких как деятельность, процесс, организация, стратегия, маркетинг.

KACTUS. Цель проекта — построение методологии многократного применения знаний о технических системах во время их жизненного цикла. Это необходимо, чтобы использовать одни и те же базы знаний для проектирования, оценки, функционирования, сопровождения, перепроектирования и обучения.

KACTUS поддерживает интегрированный подход, включающий производственные и инженерные методы и методы инженерии знаний, на основе создания онтологической и вычислительной основы для многократного использования полученных знаний параллельно с различными приложениями технической области. Это достигается при помощи построения онтологии предметной области и ее многократного использования в различных прикладных областях. Кроме того, делается попытка объединить эти онтологии с существующими стандартами (например STEP), применяя онтологии там, где возможно фиксирование данных о конкретной области.

Основным формализмом в KACTUS является CML (Conceptual Modeling Language).

Инструментарий KACTUS представляет собой интерактивную среду, в которой можно экспериментировать с теоретическими результатами (организовывать библиотеки онтологии, преобразовывать данные между онтологиями, делать преобразования для различных формализмов), а также осуществлять практические действия (просмотр, редактирование и уточнение онтологии в разных формализмах).

OntoSeek — информационно-поисковая система, которая разработана для семантически ориентированного поиска информации, комбинируя управляемый онтологией механизм установления соответствия смысла и мощные системы моделирования.

SHOE (Simple HTML Ontology Extensions) позволяет авторам аннотировать свои Web-страницы, внося в них семантическое содержание. Основным компонентом SHOE является онтология, которая содержит информацию о некоторой области. Используя эту информацию, средства поиска и построения запросов обеспечивают более релевантный ответ на запрос по сравнению с существующими поисковыми машинами, так как предоставляется возможность включать в Web-страницы знания, которые интеллектуальные агенты могут действительно прочитать. Для этого SHOE дополняет HTML набором специальных тэгов для представления знаний. SHOE позволяет находить знания с помощью таксономии и правил вывода, существующих в онтологии.

Plinus. Целью проекта является полуавтоматическое извлечение знаний из текстов на естественном языке, в частности, литературы о механических свойствах керамических материалов. Так как тексты охватывают широкий диапазон понятий, требуется множество интегрированных онтологии для охвата таких понятий, как керамические материалы и их свойства, способы их обработки, различные дефекты материалов, например, такие как трещины и поры. Онтология определяет язык, при помощи которого выражается семантическая часть словаря.

ЗАКЛЮЧЕНИЕ

Деятельность отдельных людей и организаций сейчас все в большей степени зависит от имеющейся у них информации и способности ее эффективно использовать (извлекать знания). При этом одни группы людей, занимающихся обработкой информации, используют специальные термины, которые другими организациями используются в ином контексте. В то же время в разных организациях часто применяются разные обозначения для одних и тех же понятий.

Все это значительно усложняет взаимопонимание. Поэтому необходимо разрабатывать формализованные модели представления знаний, которые обеспечивали бы обработку информации на семантическом уровне в системах управления знаниями (СУЗ).

В настоящее время существует значительный интерес к СУЗ со стороны промышленных компаний, которые осознают высокий прикладной потенциал систем, базирующихся на знаниях и используемых для решения целого ряда практических задач предприятия (организации). Вопросы управления знанием приобретают решающее значение для развивающейся экономики, где знание капитализируется и, поэтому, приобретает совершенно иной статус.

Онтологии играют решающую роль в модели описания знания, без которой, как утверждают специалисты, вход в любую предметную область запрещен. Проектирование онтологии — это творческий процесс, и поэтому потенциальные приложения онтологии, а также понимание разработчиком предметной области и его точка зрения на нее будут, несомненно, влиять на принятие решений.

    Гладун Анатолий Ясонович — канд. техн. наук, с.н.с. Международного НУЦ информационных технологий и систем НАНУ,

    Рогушина Юлия Витальевна — канд. физ-мат. наук, с.н.с. Института программных систем НАНУ.

Эта страница представляет собой главу из нашего методического пособия
"Введение в онтологическое моделирование "
(нажмите для перехода к полной версии пособия в формате PDF).

Писателям-фантастам XX века казалось, что развитие вычислительных машин приведет к появлению интеллектуальных помощников человека, которые будут решать за него многие мыслительные задачи. Возможности сегодняшней техники превышают самые смелые прогнозы многих из этих авторов: компьютер умещается на ладони, всемирная сеть доступна практически везде. При этом для решения аналитических задач мы в большинстве случаев по-прежнему пользуемся в лучшем случае электронными таблицами вроде Excel. Это особенно заметно в бизнес-среде, где цена (не)правильно принятого решения имеет совершенно осязаемый эквивалент в виде многомиллиардных прибылей или убытков. Тем не менее, развитие информационной инфраструктуры бизнеса завязло на пути создания крупных «трехбуквенных систем» (ERP, CRM и т.д.), на которые тратятся огромные средства, но которые не способны дать организации-владельцу ничего особенно «интеллектуального». Современные системы «бизнес-аналитики» (BI) в основном заняты вычислением значений количественных показателей, часто имеющих весьма слабое отношение к описанию реальности, и манипулированию ими.

Отличным примером служит любимый бизнесом показатель EBITDA: он характеризует прибыль, и по этой причине часто используется, например, в качестве базы для начисления бонусов топ-менеджерам. Однако он не характеризует эффективность работы менеджера в том смысле, в каком ее интуитивно оценивает собственник: ведь путем уменьшения расходов можно увеличить значение EBITDA. Это всегда интересно менеджеру, но не всегда верно с точки зрения стратегического развития предприятия. А уж при расчете этого показателя по подразделениям компании возможности манипуляции открываются широчайшие. В большинство статей доходов и расходов вносят вклад сразу несколько подразделений, настройкой алгоритма расчета можно легко «награждать» фаворитов и «наказывать» неугодных. Разумеется, подобные маневры не имеют ничего общего с достижением реальной эффективности работы предприятия.

Еще рельефнее видны методологические проблемы при попытках решать оптимизационные задачи количественными методами. Типичный подход к этому вопросу состоит в формулировании «целевой функции», которая представляет собой описание какого-либо качественного состояния системы, представленного в виде числа – например, «обеспеченность населения такими-то услугами». Далее, также в количественной форме, задаются ограничения, варьируемые параметры, и после вычислений получается некий набор «оптимальных» решений. Однако их практическое воплощение часто приводит к результатам, противоположным поставленным целям, или имеет серьезные побочные последствия. Например, легко может оказаться, что «средняя температура по больнице» – обеспеченность услугами – достигла нужных значений, но определенным группам населения они стали вовсе недоступны. Или же качество этих услуг снизилось настолько, что они практически потеряли смысл для потребителей. Легко понять, что корень проблемы лежит в слишком серьезных модельных допущениях, которые были сделаны при формализации целевого параметра.

Указанные методические проблемы напрямую связаны с вычислительными возможностями – точнее, с ограниченностью той их части, которую освоило бизнес-сообщество. Ведь если более сложный и достоверный алгоритм расчета какого-либо показателя нельзя, по мнению бизнес-заказчика, реализовать в информационной системе – это обосновывает применение неверного, грубого, но технологически понятного способа расчета. Таким образом, в сущности, в сфере бизнеса человек пока по-настоящему доверил компьютеру только одну функцию – складывать и вычитать числа. Все остальное он по-прежнему делает сам, и делает, в большинстве случаев, не слишком качественно.

Разумеется, мы говорим только об общей тенденции; есть немало контрпримеров реализации по-настоящему эффективных систем, помогающих оптимизировать те или иные процессы, но почти все такие системы имеют узкую отраслевую направленность, и содержат жестко запрограммированные алгоритмы решения задач. Таким образом, системного влияния на положение дел они не оказывают.

Что же нужно сделать для того, чтобы компьютер стал по-настоящему помогать нам в решении интеллектуальных бизнес-задач, смог поддерживать принятие решений в любых сферах? Необходимо вдохнуть в него «искру разума», то есть научить его «думать», как мы. Фактически, для этого нужно воспроизвести в цифровом представлении те информационные структуры и процессы, которыми мы сами пользуемся в процессе мышления: понятийный аппарат, логические рассуждения. Тогда мы сможем реализовать и процессы обработки этих структур, то есть имитировать на компьютере отдельные фрагменты наших когнитивных способностей. После этого, получив определенные результаты, мы сможем критически посмотреть на смоделированные структуры и процессы, и улучшить их. В сочетании с недоступной человеку способностью вычислительных машин к быстрой обработке огромных объемов информации, такой подход обещает дать небывало высокий уровень качества поддержки принятия решений со стороны информационных систем.

Мы не случайно привели именно логическое мышление в качестве примера когнитивного процесса, который можно воспроизвести в вычислительной среде. Существуют и другие подходы, наиболее популярным из которых является использование нейросетей – то есть имитация процессов, происходящих при взаимодействии нейронов в головном мозгу. При помощи такого рода средств успешно решаются задачи распознавания образов, речи и т.д. Можно «обучить» нейросети и для применения в качестве средства поддержки принятия решений. Однако с ростом числа факторов, требуемых для оценки ситуации, сложности их структуры, способов влияния на ситуацию, возможности нейросетей становятся все менее убедительными: на обучение требуется больше времени, получаемые результаты носят вероятностный характер, не обеспечивают логической доказуемости. Выход за пределы заранее ограниченного круга ситуаций приводит к невозможности получить от нейросети результат, пригодный для практического использования. Имитация же логического мышления свободна от большинства этих недостатков, а коррекция логической схемы при изменении условий требует куда меньше усилий, чем переобучение нейросети. Зато при составлении логических моделей принципиально важным становится их корректность, непротиворечивость, релевантность, зависящая от человека – автора модели.

Одна из главных особенностей человеческого сознания состоит в том, что оно лениво. Наш мозг отсекает все «лишнее», сводя наше представление о событиях и явлениях к довольно простым определениям. Мы видим только черное и белое, и принимаем решения, исключив из рассмотрения подавляющее большинство объективной информации.

Этим же грехом человек страдает при анализе бизнес-процессов и сред. Вместо того, чтобы воспринимать бизнес как сложную систему, не поддающуюся упрощению дальше определенного предела без критической потери достоверности результатов аналитики, человек старается свести все критерии оценки и управления к нескольким числовым показателям. Таким образом удается упростить получаемую модель, снизить затраты на ее создание. Но поступающим так не следует удивляться, когда их прогнозы не оправдываются, а решения, принятые на основании моделирования оказываются неверными.

Главный принцип качественной аналитики, управления, основанного на знаниях, звучит так: НЕ УПРОЩАТЬ модель без необходимости.

Онтологическое моделирование: цели и средства

К сожалению, распространенные сегодня компьютерные технологии не благоприятствуют реализации этого принципа. Если в качестве инструмента анализа нам доступен только Excel или реляционные базы данных – описание бизнеса неизбежно придется сводить к ограниченному набору числовых показателей. Поэтому одной из наиболее актуальных проблем развития ИТ в настоящий момент является доведение до широкой промышленной эксплуатации таких технологий, которые позволяют строить действительно сложные и комплексные информационные модели, и решать с их помощью те оптимизационные, аналитические, оперативные задачи, перед которыми другие технические средства оказываются бессильны.

Многообещающим, но несколько недооцененным на сегодняшний день направлением решения этой задачи является использование так называемых семантических технологий. Идеи автоматизированной обработки концептуализированного знания неоднократно выдвигались мыслителями начиная с эпохи Возрождения, ограниченно использовались в лучшие годы советской плановой экономики, но до действительно функционального воплощения доросли только сейчас. На сегодняшний день созданы все необходимые компоненты методики и технологий, необходимых для работы с онтологическими моделями, которые являются предметом обработки с помощью семантических технологий. Слово «онтология» означает совокупность знаний; термин «семантические технологии» подчеркивает тот факт, что они обеспечивают работу со смыслом информации. Таким образом, переход с традиционных ИТ на семантические технологии является переходом от работы с данными к работе со знаниями. Разница между этими двумя терминами, которые здесь мы используем исключительно в применении к содержанию информационных систем, подчеркивает отличие в способе использования информации: для восприятия и использования данных необходим человек, субъект, которому приходится выполнять при этом операцию осмысления, выявления смысла данных, и его переноса на интересующую часть реальности. Знания же могут восприниматься непосредственно, так как они уже представлены при помощи того понятийного аппарата, которым пользуется человек. Кроме того, с представленными в электронном виде знаниями (онтологиями) могут выполняться и полностью автоматические операции – получение логических выводов. Результатом этого процесса являются новые знания.

Аналитики Gartner называли семантические технологии одним из наиболее многообещающих ИТ-трендов 2013 года, однако их оптимизм оказался преждевременным. Почему? Все по той же причине – человек ленив, а создание семантических моделей требует серьезных умственных усилий. Тем больше выгод и преимуществ перед конкурентами получат те, кто предпримет эти усилия, и трансформирует их в реальный бизнес-результат.

Понятие субстанции в онтологических системах. Понятие субстанции и бытие. Поиски субстанциальной основы бытия в истории философии. Субстанция как самодетерминирующаяся основа бытийных процессов. Общее представление о соотношении духа и материи, души и тела. Субстанция, дух и разум. Категории «абсолютное», «относительное», «всеобщее», «единичное», «сущность» и «явление» для решения вопроса о соотношении субстанции и форм ее проявления. Материализм и идеализм о природе сознания и мышления и их соотношения с материей.

Материалистический субстанциализм. Разновидности построения материалистической онтологии. Чувственно-материальный Космос как основная черта античной натурфилософии. Диалектический материализм как один из вариантов материалистического субстанциализма и его место в современной философии. Понимание материи как объективной реальности и как субстанции всех процессов в мире. Принцип материалистического единства мира. Наука и материалистическая философия. Современные представления о структуре материи, веществе и полях. Иерархия материальных систем в мире. Структурная бесконечность и вечность материи в качестве субстанции. Всеобщие атрибуты материи. Взаимоотношение всеобщих и специфических свойств материи. Структурные уровни материи и формы ее системной организации. Методы выявления всеобщих свойств материи и доказательство их универсальности. Взаимодействие и движение как атрибуты материи. Соотношение взаимодействия и связи. Типы взаимосвязей в мире. Асимметрия причинных связей в необратимых изменениях. Проблема распространения связей и взаимодействий в пространстве и времени. Является ли мир бесконечным или представляет собой связанное целостное образование, целостную систему? Взаимодействие и автономность материальных систем. Основные формы движения материи и критерии их классификации. Взаимосвязь живой и неживой природы.

Идеалистический субстанциализм. Разновидности идеалистического субстанциализма в истории философии. Идея универсализма мира и чувственно-воспринимающий Космос в античной философии. Античный идеализм. Религиозно-философские модели идеалистического субстанциализма. Особенности построения онтологической системы в логическом идеализме. Духовно-идеальные начала бытия. Соотношение идеального и материального в идеалистической интерпретации. Атрибуты идеальной субстанции: сознание, целеполагание, свобода, творчество. Сознание как идеальная субстанциальная основа мира. Понятие эйдоса как причинно-целевой конструкции мира, как самомыслящего существа в античной философии. Античное понятие Космоса как "мирового субъекта". Абсолютный дух в философии Гегеля. Концепция мирового космического разума. Понятие Бога в истории религии и философии в качестве идеальной субстанциальной основы мира. Логос и Бог.



Креационистские варианты онтологии. Соотношение Бога и Мира в онтологических системах средневековья. Разум и воля. Божественный дух и душа человека. Развитие представлений о душе. Душа как носитель сознания и всего духовного мира человека. Понятие духовности. Духовность и религиозность. Идеально-смысловое содержание сознания и его онтологический статус. Достижения и ограниченности идеалистической онтологии.

Персоналистский субстанциализм. Человек как микрокосм в философии эпохи Возрождения. Ценности человеческого существования и место Человека в Космосе. Творчество как главный признак особого места человека в мире. Монадология Лейбница и идеал-реализм Н.О. Лосского. Динамическое понимание материи. Антропный принцип в космологии. Космический подход к человеку и сознанию. Особенности онтологических исканий в русской философии.

Кризис онтологизма и антисубстанциалистские модели философии. Кризис онтологизма в истории философии, тезис о «смерти метафизики» (предпосылки, мотивы, декларации и аргументы). Бытие и сознание: проблема соответствия философских онтологических построений объективной реальности. Онтологическая картина мира, реальный мир и индивид. Конструктивная и творческая активность человеческого "Я" и критика онтологизма.

Онтологические модели в современной философии. Программы реабилитации метафизики и проекты «новой онтологии». Иерархические модели онтологии: Бытие как совокупность форм движения материи Ф. Энгельса. Слои бытия Н. Гартмана. Региональные онтологии Э.Гуссерля. Проблема выделения региональных онтологий: онтология социума. Онтология сознания и самосознания. Онтология языка. Онтология личного существования (экзистенция). Онтология телесности. Онтология культуры. Варианты экзистенциальной метафизики: фундаментальная онтология М. Хайдеггера. Мир трансцендентного бытия К. Ясперса.

Диалектико-материалистическая модель онтологии. Материалистическое решение основного вопроса философии. Понятие материи как объективной реальности. Структурные уровни бытия.

Проблема типологизации онтологических моделей. Монистическая, плюралистическая и дуалистическая онтологии. Эссенциалистские и антиэссенциалистские онтологии. Иерархические и неиерархические онтологические построения. Натурфилософские модели. Теистические модели. Экзистенциально-антропологические модели. Феноменолого-герменевтические модели.

Бытие и развитие

Проблема движения в истории философии. Соотношение движения, изменения и развития. Основные свойства движения. Философские модели развития: креационизм, теория эманации, преформизм, эмерджентизм, эволюционизм. Многообразие форм движения и структурные уровни бытия. Изменяющееся и неизменяющееся бытие. Проблема движения в истории философии. Проблема всеобщности движения. Парадоксы движения.

Развитие и возникновение новых форм бытия. Развитие и диалектика. Диалектические концепции развития. Их структура, законы, принципы, основные понятия. Парадокс возникновения нового. Проблема соотношения актуального и потенциального в развитии. Нелинейность развития. Законы и категории развития.

Виды диалектики. Источник, механизм и направленность развития. Философские законы, описывающие развитие мира (Г.В.Ф.Гегель, К.Маркс, диалектический материализм). Закон единства, взаимодействия и борьбы противоположностей. Закон взаимного перехода количественных и качественных изменений. Закон диалектического отрицания.

Современные взгляды на эволюцию человека, общества и Вселенной. Человек, природа, космос. Феномен жизни и ее место во Вселенной. Проблема иных форм жизни во Вселенной и гипотеза об уникальности человеческого разума (В.Шкловский). Глобальный кризис техногенно-потребительской цивилизации и концепция ноосферы. Черты антропокосмического поворота в современной науке и культуре.

Человек как "био-логосное" существо.

"Логосная" компонента человека. Человек как присутствие. Понятие "культурных машин". Основные феномены человеческого бытия. Человек как "символическое" существо. Структура "символического пространства". Исторические типы ментальности. Трансцендентальные условия порождения символов: декларативность и способность человека к синтетическим актам. Право человека на ошибку. Прогресс и обострение глобальных проблем человечества. Синергетика и процессы самоорганизации в открытых нелинейных системах. Глобальный эволюционизм в структуре современного сознания. Процессы самоорганизации в открытых нелинейных системах. Синергетика и ее основные понятия (аттракторы, точки бифуркации, флуктуации, фракталы). Глобальный эволюционизм.

Роль информации в процессах развития. Изменение системы коммуникационных средств в современном мире как важнейшее условие ускорения темпов развития.

Выбор редакции
Технологии Новые идеи появляются каждый день. Одни из них остаются на бумаге, другие же получают зеленый свет - их тестируют и при...

Пояснительная записка Данное занятие было составлено и проведено к 69-летию победы, т. е., относится к лексической теме «День Победы»....

К сожалению, в школе нас не всегда этому учат. А ведь очень многих интересуют правила поведения в кругу друзей и в обществе малознакомых...

Одной из самых актуальных проблем для простых интернет-пользователей и владельцев сайтов / форумов является массовая рассылка . Со спамом...
Вопрос, касающийся ритуалов на кладбище – колдовской закуп. Я маг Сергей Артгром расскажу что такое закуп в ритуалах черной магии....
б. еТЛЙО нБЗЙС ОЕЧЕТПСФОЩИ УПЧРБДЕОЙК оБЫБ ЦЙЪОШ УПУФПЙФ ЙЪ УПВЩФЙК. зМПВБМШОЩИ, ВПМШЫЙИ, НБМЕОШЛЙИ Й УПЧУЕН НЙЛТПУЛПРЙЮЕУЛЙИ. хРБМ...
К огромному сожалению, такое явление, как повышенная нервная возбудимость, стало на сегодняшний день нормой. Эта проблема встречается как...
В настоящее время мышцы классифицируют с учетом их формы, строения, расположения и функции. Форма мышц . Наиболее часто встречаются...
Зевота – это безусловный рефлекс, проявляющийся в виде особого дыхательного акта происходящего непроизвольно. Все начинается с...