
- •20. Семантический веб и микроформаты
- •20.1. Семантический веб
- •20.1.1. Введение
- •20.1.2. История
- •20.1.3. Основные идеи
- •20.1.4. Технологии и инструменты
- •20.1.4.1. Стек стандартов Semantic Web
- •20.1.4.2. Компоненты Semantic Web
- •20.1.4.2.2. Rdf Schema
- •20.1.4.2.3. Owl
- •20.1.4.2.4. Sparql
- •20.1.4.3. Логический вывод
- •20.1.4.4. Инструментальные средства
- •20.1.4.4.1. Jena
- •20.1.5. Проекты
- •20.1.5.1. Дублинское ядро
- •20.1.5.2. Rss (версий 0.90 и 1.0)
- •20.1.5.3. Foaf
- •20.1.5.4. DBin
- •20.1.5.5. Семантические web-сервисы
- •20.1.6. Критика
- •20.1.6.1. Практическая реализуемость
- •20.1.6.2. Дублирование информации
- •20.1.6.3. Проблемы для бизнеса
- •20.1.6.4. Анонимность и сохранение авторских прав
- •20.1.7. Перспективы формирования Semantic Web
- •20.1.8. Ключевые термины
- •20.2. Применение микроформатов
- •20.2.1. Общие сведения
- •20.2.2. Ключевые термины
- •20.3. Поиск в Веб
- •20.3.1. Общие сведения
- •20.3.2. Ключевые термины
- •20.4. Дополнительная тема: раскрутка сайтов
- •20.4.1. Общие сведения
- •20.4.2. Белая оптимизация
- •20.4.3. Серая оптимизация
- •20.4.4. Черная оптимизация
- •20.4.5. Несколько рецептов по раскрутке сайта
- •20.4.6. Ключевые термины
- •20.5. Дополнительная тема: использование служб статистики
- •20.5.1. Общие сведения
- •20.5.2. Ключевые термины
- •20.6. Краткие итоги
20.1.5. Проекты
20.1.5.1. Дублинское ядро
Одним из первых серьезных и популярных проектов, основанным на принципах семантической паутины, стал проект "Дублинское ядро" (Dublin Core) [7], реализуемый инициативной организацией Dublin Core Metadata Initiative (DCMI) [12]. Это открытый проект, цель которого – разработать стандарты метаданных, которые были бы независимы от платформ и подходили бы для широкого спектра задач. Конкретнее, DCMI занимается разработкой словарей метаданных общего назначения, стандартизирующих описания ресурсов в формате RDF.
20.1.5.2. Rss (версий 0.90 и 1.0)
Версии 0.90 и 1.0 формата RSS основаны на RDF. Информация в нем представляется, как и в RDF, тройками субъект-отношение-объект [7]. Необходимо отметить, несмотря на то, что ему присущи многие недостатки Семантической паутины (дублирование информации, например), этот простейший формат быстро стал чрезвычайно популярным за счет узкой категоризации подмножества используемых метаданных. Отличие RSS от RDF состоит в том, что субъектом тройки всегда является сайт-источник RSS-файла, а в качестве отношений используются самые очевидные свойства документов, имеющие отношение к часто обновляющимся источникам информации: дата написания, автор, постоянная ссылка, и т. д. Другими словами, RSS – узкоспециализированное подмножество RDF.
Помимо недостатков, RSS унаследовал и все достоинства форматов из семейства семантической паутины: гибкость RSS позволяет использовать его не только для проверки на наличие новой информации на регулярно обновляющихся сайтах, но и для подкастов, и торренткастов.
Заметим, что формат RSS версии 2.0, хотя и не является форматом, основанным на RDF, позволяет внедрение произвольного XML-содержимого, находящегося в собственных пространствах имен XML. Это позволяет использовать RDF-описания также и в нем (используя пространство имен RDF).
20.1.5.3. Foaf
Проект "Friend of a Friend" ("Друг друга") позволяет описывать отношение знакомства с помощью RDF [7]. Любой его участник может идентифицировать себя уникальным образом с помощью URI (например, mailto-адресом электронной почты, адресом блога, и т. п.), создать свой профиль, используя предопределенные для FOAF отношения на языке RDF, и перечислить идентификаторы людей, которых этот участник знает. Это описание может обрабатываться автоматически; на его основе можно строить сети доверия, анализировать структуру социальных групп, и т. д.
20.1.5.4. DBin
DBin работает примерно также, как и файлообменные сети (emule, kazaa, и т.д.), но для метаданных [9]. В этой системе вместо того, чтобы обмениваться данными (музыкой, файлами, видео, и т.д.), пользователи обмениваются "упорядоченными метаданными", такими как: "X является автором Y", "Z родился в K", или "моя фотография в R, в прошлом декабре опубликована по адресу P". С помощью DBin можно обмениваться информацией о том, что пользователи знают о разных вещах. Это может быть что угодно: песни, фотографии, WEB-сайты. Метаданные передаются в специальном формате – RDF, при этом система поддерживает развитые средства для работы с онтологиями, а это позволяет очень быстро и эффективно находить нужную информацию.
По способу взаимодействия пользователя и системы DBin чем-то напоминает Wiki, однако использование технологий Semantic Web выводит этот проект на совершенно новый уровень. Средства для поиска информации, возможности для кооперации среди участников сообщества позволяют организовать работу значительно более эффективно.
Когда пользователь DBin вводит те или иные данные, система сохраняет их в базе данных вместе с цифровой подписью автора. Это позволяет надежно идентифицировать источник информации. Поэтому система достаточно хорошо защищена от спама, недостоверной или, заведомо ложной информации. Если пользователь начинает злоупотреблять своим правом добавлять данные в DBin, то он лишается доверия, и его информация просто отфильтровывается.
DBin имеет развитый пользовательский интерфейс для редактирования, просмотра, поиска и вообще, использования информации. Если пользователь является продвинутым пользователем и экспертом в какой-нибудь области, то он может создавать специальные расширения для DBin (так называемые "брейнлеты"), ориентированные на работу в данной области знаний. Такие брейнлеты обычно включают в себя пользовательский интерфейс, онтологии, правила, типы аннотаций предопределенные запросы к системе, и, тем самым, предоставляют удобные средства для работы в рамках заданной предметной области.
Кроме брейнлетов DBin поддерживает и другие модули расширения – плагины. Плагины позволяют организовать взаимодействие DBin с внешними приложениями, с файловой системой и с рабочим столом пользователя, с базами данных. С помощью плагинов можно обеспечить более сложное отображение информации. Например, географические данные могут быть продемонстрированы пользователю на карте.
DBin реализует очень интересный способ организации совместной работы, позволяет, с одной стороны эффективно обмениваться информацией, а с другой накапливать семантически размеченные данные.