

Архитектуры и модели программ и знаний
Лекция 23
Представление знаний. Интеграция методов инженерии знаний и инженерии программ. Semantic Web, Web 2.0
Сафонов Владимир Олегович
Профессор кафедры информатики Заведующий лабораторией Java-технологии
(http://polyhimnie.math.spbu.ru/jtl)
Санкт-Петербургский государственный университет
Email: vosafonov@gmail.com
WWW: http://www.vladimirsafonov.org

Представление знаний и его роль
Знания (knowledge) – особым образом организованные и интерпретируемые данные, предназначенные для выражения семантики данных, выполняемых действий, систем понятий в проблемных областях, стратегий поведения и др.Традиционно, знания о решении задачи вкладываются в программную систему неявно, т.к. используются для разработки алгоритмов и программОднако для многих практических задач чисто алгоритмических методов решения недостаточноОсновные категории таких задач: экспертная оценка, анализ, предсказание,
диагностика, ремонт (лечение), поиск и структурирование информации и др.В связи с этим, все чаще разработчики и заказчики программных систем и решений обращаются к инструментам инженерии знанийПроблема: Методы и системы инженерии знаний по системе понятий, языкам,
инструментам оказываются практически несовместимыми с традиционными платформами для разработки программ, а специалисты – инженеры знаний и инженеры-программисты “говорят на разных языках”Вывод: Необходимо преодолеть этот семантический разрыв и интегрировать
методы инженерии программ и инженерии знаний
Интеллектуальные решения (intelligent solutions) – Программные решения, использующие методы инженерии знаний, в сочетании с алгоритмическими методами и технологиями программной инженерии
(C) Сафонов В.О. 2012

Знания и эффективность поиска в Интернете
Проблема: Низкая эффективность поисковых систем для Web. Даже лучшие поисковые системы (Google) выдают значительный процент не релевантных (фактически бессмысленных) ссылокРадикальное решение: Вместе с каждым элементом информации, публикуемым в Web, публиковать его семантику (знания о нем) в стандартизованной форме (идея Semantic Web)Есть надежда, что использование знаний для улучшения поиска данных поможет качественно улучшить системы поиска в WebДля решения этой задачи необходимы универсальные и эффективно реализуемые методы представления и использования знанийПока в данном направлении прогресс не так велик, как хотелось
бы, и идея Semantic Web пока не является общепринятой; у нее имеется много противников и скептиков (например, к сожалению, Microsoft Research Cambridge)
(C) Сафонов В.О. 2012

Semantic Web: Стандарты и инструменты
Resource Description Framework (RDF) – схемы: Стандартизованное представление знаний в XML-формате
Web Ontology Language (OWL) - язык спецификации
онтологий (ontologies) – систем понятий в некоторой предметной области и их взаимосвязей
Пример семантической публикации(semantic publishing) в Web (RDF):
<item rdf:about=http://dbpedia.org/resource/Monkey >Monkey</item>
Здесь содержится не только элемент информации (item “Monkey”), но и знания о нем в виде ссылки на соответствующую RDF-схему
Используется XML-формат (преимущества: расширяемость, общность, структурированность)
(C) Сафонов В.О. 2012

Semantic Web Stack
XML – формат данных
XML-схемы – структура XML-документов
RDF – модели данных (ссылки на ресурсы и их взаимосвязи)
RDF-схемы – словарь для описания свойств и классов ресурсов
OWL – словари (онтологии) для описания отношений между классами, например, “не пересекаются”, “мощность равна 1”SPARQL (аналог SQL) – язык запросов к RDF- ресурсам
RIF (Rule Interchange Format) – Разрабатываемый стандарт для представления семантических правил
(C) Сафонов В.О. 2012

Semantic Web:
Проекты
DBpedia – Извлечение и представление в виде RDF-ресурсов информации, извлеченной из Wikipedia (online- энциклопедии)
FOAF (Friend Of A Friend) – Семантическая социальная сеть на основе RDFВсевозможные онтологии в различных областях знаний, например, GoodRelations
– онтология для электронной коммерции (описывает концепции, связанные с ценами, рынками и др.)
(C) Сафонов В.О. 2012

Semantic Web:
Сервисы
Semantic Web Ping Service –
Инструментарий в виде Web-сервисов для создания, модификации и оценки (validation) семантических данных в Web, представленных в формате RDF
PiggyBank / SemanticBank –
Представление банковской информации в формате RDF
(C) Сафонов В.О. 2012

Semantic Web: Недостатки и проблемы
Формат XML неудобен для чтения и восприятия человекомИспользование только текстовой информации, а не визуальных образов
До сих пор нет системы общепринятых онтологий для ежедневного пользования, хотя идея Semantic Web сформулирована 10 лет назад
(C) Сафонов В.О. 2012

Web 2.0
Новое поколение Web-сайтов, реализующие интерактивные средства
общения через Web
Социальные сети для общения по интересам, сайты для обмена
мультимедийной информацией
Блоги (Web logs) – общедоступные Web- дневники
Наиболее распространенные сайты Web 2.0:
LinkedIn, FaceBook – социальные сети для профессионального(C) Сафонов Ви.О. 2012частного общения

Web 2.0: Технологии
AJAX – Группировка логически связанных Web-страниц для оптимизации их просмотра и минимизации перенаправлений с одной страницы на другую
Flash – технология для демонстрации мультимедийных “роликов” через Web
DOM (Document Object Model) – Объектно- ориентированное представление XML- и HTML- документов в виде объектов
RDF - Семантика в стандартизованном виде
RSS (Really Simple Syndication) – Просмотр (показ) новостных каналов на сайте конечного пользователяВывод: Для Web 2.0 весьма важно использование знаний;
WEB 3.0 = Web 2.0 + Semantic Web
(C) Сафонов В.О. 2012