УДК: 004.4’244, 004.436.4.
Шапкин П. А., аспирант, ассистент
Национальный исследовательский ядерный университет «МИФИ»,
каф. Кибернетики (22)
Модели и методы разработки веб-приложений на основе онтологии предметной области
Аннотация
В статье описываются модели и методы, применимые для обработки информации, представленной в виде RDF-графов и оснащенной онтологией предметной области. Модели строятся таким образом, чтобы приблизить структуру системы к механизмам, используемым при обработке данных в формате XML, а также к принципам объектно-ориентированного программирования. Рассматривается архитектура информационной системы, использующей описываемые подходы.
Ключевые слова: онтологии, веб-программирование, дескрипционная логика.
Развитие интернет-технологий привело к появлению новых форматов, направленных на представление смысла, или семантики данных. Данные форматы составляют основу инициативы «семантического интернета».
Для представления данных с учетом их семантики используется язык RDF [], позволяющий описывать данные в виде семантических сетей, строящихся из троек . При этом одна и та же сеть может быть по-разному записана на языке RDF, но одинаково воспринята при интерпретации этих записей. Эта особенность делает RDF более подходящим средством для описания данных в среде Веб, чем XML []: в XML также существуют различные способы описания семантически эквивалентных сущностей, однако не существует способов установления данной эквивалентности при интерпретации этих описаний.
При использовании RDF для представления данных схема данных может быть определена в виде онтологии на языке OWL []. Онтология представляет собой формальное описание предметной области в виде определений используемых понятий (концептов) и их свойств (ролей).
Концепция семантического интернета получила большое развитие, но все еще не нашла широкого применения. Во многом это связано с дефицитом инструментария, необходимого для разработки приложений, полностью ориентированных на семантическое представление данных. В данной работе описываются модели и методы, с помощью которых проводится разработка веб-ориентированной информационной системы, на всех этапах использующей формат RDF для представления данных. Настройка системы на предметную область осуществляется с помощью онтологий.
Статья организована следующим образом: в разделе 2 описывается принцип построения модели и метамодели предметной области на основе онтологии; в разделе 3 описываются модели и методы, используемые при обработке онтологии и RDF-данных; в разделе 4 описывается структура системы, основанной на принципах, описываемых в данной работе.
Каждая информационная система позволяет выполнять операции над некоторым множеством объектов (сущностей) , используемых для представления информации. Онтология представляет собой формальную модель предметной области, в которой типы сущностей описываются в виде концептов (понятий). Концепты определяются при помощи дескрипций (описаний). Каждому концепту ставится в соответствие некоторый предикат на множестве , а, следовательно, некоторое множество значений, удовлетворяющих этому предикату. Функция, реализующая такое соответствие, называется интерпретацией и обозначается как . В общем случае множество зависит от выбранной интерпретации, что обозначается как .
В основе языка описания онтологий OWL лежит формальная система, называемая дескрипционной логикой (ДЛ) []. Дескрипционная логика определяет правила построения дескрипций концептов. Помимо концептов в рассмотрение вводятся роли и индивиды. Роли понимаются как типы связей между объектами предметной области, интерпретация ставит в соответствие каждой роли множество упорядоченных пар значений из . Индивиды трактуются как объекты предметной области; интерпретацией индивида является отдельное значение из . При этом делается соглашение о том, что различные индивиды имеют различные интерпретации.
Дескрипции в ДЛ строятся по следующей схеме:
1) базовыми строительными блоками являются универсальный и пустой концепты, атомарные концепты и роли, а также индивиды;
2) более сложные концепты и роли строятся из атомарных при помощи конструкторов концептов и ролей.
Универсальный и пустой концепт, обозначаемые и , описывают, соответственно, любую сущность, и пустую. Атомарные концепты — первичные, неделимые концепты, специфичные для каждой предметной области.
Существуют различные варианты дескрипционных логик, отличающиеся предоставляемым набором конструкторов. OWL DL основан на разновидности под названием . Списки основных конструкторов концептов, определяемых для , представлены в табл. 1. Помимо конструкторов, перечисленных в таблице, включает в себя конструкторы, реализующие работу с простыми («конкретными») типами данных, такими как строки, числа и т. п. Для каждого конкретного типа может быть задан набор дополнительных предикатов, напр., предикаты сравнения чисел и т. п.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.