Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
49
Добавлен:
23.05.2015
Размер:
1.6 Mб
Скачать

Критика (проблемы)

Практическая реализуемость

Несмотря на все преимущества, предоставляемые семантической паутиной в случае её внедрения, существуют сомнения в возможности её полной реализации.

    • 1) Начиная с человеческого фактора (люди склонны избегать работы по поддержке документов с метаданными, открытыми остаются проблемы истинности метаданных),

    • 2) И заканчивая косвенным указанием Аристотеля на отсутствие очевидного способа деления мира на концепты, что ставит под сомнение возможность существования онтологии верхнего уровня, критической для семантической паутины (понятие differentia specifica).

      • Возможно ли используя единый универсальный язык (OWL, RDF) построить концептуальное описание мира (человек, медицина, биология, промышленность, физика и т.д.). Очевидно, что это возможно в рамках определенной сферы! А ведь ГЛАВНАЯ ЦЕЛЬ – Semantic WEB, опираясь на RDF и OWL, выявлять знания из любой сферы человеческой деятельности.

Дублирование информации

Необходимость описания метаданных так или иначе приводит к дублированию информации. Каждый документ должен быть создан в двух экземплярах: размеченным для чтения людьми, а также в машинно-ориентированном формате. Этот недостаток семантической паутины был главным толчком к созданию так называемых микроформатов.

Архитектура

Техническую часть семантической паутины составляет семейство стандартов на языки описания, включающее XML, XML Schema, RDF, RDF Schema, OWL, а также некоторые другие. Располагая их в порядке повышения уровня абстракции, реализуемого тем или иным языком, получаем:

(1) Первый уровень – объекты

URI и Unicode – адресация всех объектов, представленных (упоминаемых) в WEB. Кодировка Unicode (2-х байтная кодировка) обеспечивает стандартную поддержку всех существующих национальных кодировок (языков).

Внизу пирога находятся уникальные идентификаторы ресуров (URI). Предназначение URI:

  • Создать пространство имён виртуальных ресурсов, достаточное для представления в web всех важных объектов реального мира.

  • Избежать неоднозначности в именовании ресурсов в web.

Semantic Web предоставляет средства для того, чтобы говорить об объектах. Возьмем, к примеру, следующее высказывание: Иванов Павел Сергеевич знает Губанову Марфу Андреевну. Данное высказывание можно интерпретировать по-разному, ведь никто не гарантирует уникальность имен объектов (Павел и Марфа) и отношений между ними (знать). URI нужны именно для такой гарантии.

http://ivanovpavel.spb.ru –> http://xmlns.com/foaf/0.1/knows --> http://marphaemc.com

Делится на два семейства:

  • URN (Uniform Resource Name) - позволяет идентифицировать ресурс, но не указывает на его местоположение.

  • URL (Uniform Resource Locator) - указывает на способ получения доступа к ресурсу.

(2) Второй уровень – описание данных и их представлений.

XML — текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных форматов обмена данными. На сегодня в семействе XML есть целая куча форматов, предназначенных для различных целей.

    • XML предоставляет синтаксис для определения структуры документа, подлежащего машинной обработке. Синтаксис XML не несёт семантической нагрузки.

    • XML Schema определяет ограничения на структуру XML-документа. Стандартный синтаксический анализатор языка XML в состоянии проверить произвольный XML-документ на соответствие его структуры так называемой схеме документа, описанной в XML Schema.

(3) Третий уровень - задача построить максимально полную модель отношений всех объектов, описанных URI и представленных в Web

RDF представляет собой простой способ описания данных в формате субъект-отношение-объект, в котором в качестве любого элемента этой тройки используются только идентификаторы ресурсов.

    • Существует стандартизованное отображение этих троек на XML-документы предопределённой структуры (т.е. консорциумом W3 определена схема XML-документов, содержащих RDF-описания), а также на другие форматы представления (например, в нотацию N3).

(4) Уровень 4. Формирование онтологий (понятий и терминов) на основе троек RDF

OWL - это логический язык для формального описания онтологий. OWL предоставляет средства для логического описания семантики (т.е. смысла) понятий, благодаря чему последние могут согласованно использоваться как людьми, так и приложениями в различных информационных системах (Web-сайтах, базах данных, экспертных системах, системах поддержки принятия решений и т.д.).

Выражаясь неформально, OWL позволяет гарантировать, что в условиях высокой гетерогенности современных информационных систем, термины, объявленные в одной системе, будут корректно интерпретированы в другой системе, причем независимо от технических особенностей систем и сценариев работы с ними

Русский перевод описания OWL тут: http://zajtcev.org/docs/w3c/ru/REC-owl2 … 91027.html

(5-7) Уровни 5-7 (пока только прорабатываются на концептуальном уровне).

Цифровые подписи

Для того, чтобы контролировать целостность передаваемых документов, защищаться от подделки данных, доказывать авторство документа в семантическом вебе существует слой цифровых подписей. Мы не будем про него много говорить, так как здесь пользователи семантик веба удовлетворяются уже существующими алгоритмами и ПО.

    • (5) ЛОГИКА

Когда мы говорим о представлении знаний и разрабатываем языки представления, надеясь, что из одних фактов мы будем получать другие, нам недостаточно неформальных определений семантики. Логический слой семантического веб служит именно для того, чтобы предоставить однозначную трактовку для языков представления знаний.

Здесь была выбрана так дескрипционная логика - формализм, позволяющий описывать объекты в терминах объектов, свойств объектов и их классов. OWL базируется именно на этом формализме, а уровень Logic представлен программами, позволяющими осуществлять логический вывод одних фактов из других

    • (6) На уровне Proof должны находиться средства, позволяющие дать объяснения выведенных фактов на RDF.

    • (7) На уровне Trust должны находиться средства, позволяющие для пользователя доверять одним источникам и не верить другим.