Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
240
Добавлен:
10.05.2015
Размер:
13.19 Mб
Скачать

20. Семантический веб и микроформаты

В данной лекции описывается концепция "Семантической паутины", рассматриваются микроформаты и поисковые механизмы в Сети. В заключение лекции характеризуются дополнительные темы: раскрутка сайтов и использование служб статистики.

Содержание

20.1. Семантический веб

20.1.1. Введение

20.1.2. История

20.1.3. Основные идеи

20.1.4. Технологии и инструменты

20.1.4.1. Стек стандартов Semantic Web

20.1.4.2. Компоненты Semantic Web

20.1.4.2.1. RDF

20.1.4.2.2. RDF Schema

20.1.4.2.3. OWL

20.1.4.2.4. SPARQL

20.1.4.3. Логический вывод

20.1.4.4. Инструментальные средства

20.1.4.4.1. Jena

20.1.5. Проекты

20.1.5.1. Дублинское ядро

20.1.5.2. RSS (версий 0.90 и 1.0)

20.1.5.3. FOAF

20.1.5.4. DBin

20.1.5.5. Семантические WEB-сервисы

20.1.6. Критика

20.1.6.1. Практическая реализуемость

20.1.6.2. Дублирование информации

20.1.6.3. Проблемы для бизнеса

20.1.6.4. Анонимность и сохранение авторских прав

20.1.7. Перспективы формирования Semantic Web

20.1.8. Ключевые термины

20.2. Применение микроформатов

20.2.1. Общие сведения

20.2.2. Ключевые термины

20.3. Поиск в Веб

20.3.1. Общие сведения

20.3.2. Ключевые термины

20.4. Дополнительная тема: раскрутка сайтов

20.4.1. Общие сведения

20.4.2. Белая оптимизация

20.4.3. Серая оптимизация

20.4.4. Черная оптимизация

20.4.5. Несколько рецептов по раскрутке сайта

20.4.6. Ключевые термины

20.5. Дополнительная тема: использование служб статистики

20.5.1. Общие сведения

20.5.2. Ключевые термины

20.6. Краткие итоги

20.1. Семантический веб

20.1.1. Введение

Семантическая паутина (Semantic Web) – часть глобальной концепции развития сети Интернет, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, однозначно характеризующими свойства и содержание ресурсов Всемирной паутины, вместо используемого в настоящее время текстового анализа документов. Термин впервые введен сэром Тимом Бернерсом-Ли в мае 2001 года в журнале "Scientific American" [1], и называется им "следующим шагом в развитии Всемирной паутины". В семантической паутине предполагается повсеместное использование, во-первых, универсальных идентификаторов ресурсов (URI), а во-вторых – онтологий и языков описания метаданных.

Эта концепция была принята и продвигается Консорциумом W3 [2]. Для ее внедрения предполагается создание сети документов, содержащих метаданные о ресурсах Всемирной паутины и существующей параллельно с ними. Тогда как сами ресурсы предназначены для восприятия человеком, метаданные используются машинами (поисковыми роботами и другими интеллектуальными агентами) для проведения однозначных логических заключений о свойствах этих ресурсов.

20.1.2. История

Semantic Web был задуман консорциумом W3 достаточно давно. С середины 90-х писались разные статьи и заметки, которые не привлекали особого внимания широкой общественности. Переломным моментом стала статья, опубликованная 17 мая 2001 г. в журнале Scientific American Тимом Бернерса-Ли, Джеймсом Хэндлером и Орой Лассила "The Semantic Web"

У этой статьи было одно назначение – привлечь внимание к Semantic Web всех, кого только можно было. Интерес к Semantic Web в 2001 году, конечно, появился, но профессиональные разработчики после прочтения этой статьи поняли, что до прихода Semantic Web еще должно пройти много времени, т.к. W3C не разработал к тому времени совершенно никаких технологий (кроме языка RDF), которые могли бы хоть как-то помочь осуществить задуманное.

10 февраля 2004 г. на сайте W3C появляется описание языка "OWL" (язык описания онтологий).

Через полгода новый язык описания онтологий OWL стал поддерживать редактор онтологий Protege – разработка Стенфордского Университета. В это же время Semantic Web начало активно интересоваться международное научное сообщество. В разных изданиях появляется вал статей по Semantic Web. Председатель Консорциума W3 Тим Бернерс-Ли получает орден Сера из рук Королевы Соединенного Королевства.

В 2005 г. на сайте W3 появляется описание RDF/A – синтаксиса, который уже сейчас позволяет встраивать метаданные RDF в документы XHTML.

10 марта 2006 г. выходит RDF/A Primer. Таким образом, уходя по цепочке XML-RDF-RDFS-OWL все дальше и дальше от существующей в сети HTML разметки Semantic Web был "привязан" к XHTML.

В 2006 г. также завершилась разработка языка запросов к RDF документам с SQL-подобным синтаксисом, его окончательное название – SPARQL.