Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shp.docx
Скачиваний:
59
Добавлен:
27.09.2019
Размер:
807.77 Кб
Скачать

1. Базы знаний. Основные определения и назначение дисциплины.

Данные – это представление фактов в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.

Знания – это совокупность информации (данных) и правил вывода о мере, свойствах и закономерностях достаточных для принятия решений…

Главное отличие знаний от данных:

  • структурности, активности.

  • могут изменять при добавлении новых фактов.

  • фиксируются в знаках естественных и искусственных языков

  • как правило для знаний существует собственный язык.

DIKW – информационная иерархия, где каждый следующий уровень добавляет определенные свойства к предыдущему уровню.( D(data) – данные (БД); I(information) – информация добавляет контекст (данные о данных – метаданные); K(knowledge) – уровень «как», т.е. как использовать;W(wisdom) – мудрость –знания о том когда и что применять).

Базы знаний – это особого роды базы данных, разработанные для оперирования знаниями (принятие решений на основе знаний). Знания получаются из данных. На основе знаний принимаются решения. Полноценная БЗ содержат в себе не только фактическую информацию, но и правила вывода допускающие умозаключения о выводимых фактах, и как следствие осмысленная обработка информации.

Инженерия знаний – область наук, изучающая БЗ и методы работы с ними.

Свойства БЗ:

  • Автоматическое доказательство – способность системы выводить новые знания из старых и находить закономерности.

  • Доказательство заключения – способность системы после выдачи ответа объяснить ход ее рассуждений.

  • Интроспекция – нахождение противоречий и нестыковок в БЗ и контроль правильной организации

  • Машинное обучение – набор опыта и переобучение

Двумя наиболее важными требованиями к информации, хранящейся в БД являются:

- Достоверность конкретных обобщенных сведений

- Релевантность информации получаемой с помощью правил вывода (релевантный – значимый, существенный, и имеющий отношение к данному вопросу и запросу; RageRank – алгоритм Google – поиск по графу с сортировкой по релевантности).

Применения:

  • Интеллектуальный анализ данных (Data Mining) - процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных и полезных знаний. Подразделяется на задачи классификации, моделирования, прогнозирования и т.д.

  • Экспертная система – программа помогающая принять решения (пользование знаниями как экспертом)

  • Гибридная интеллектуальная система (ГИС) – система в которой для решения задачи используется один или более методов имитации интеллектуальной деятельности человека. В ГИС входят: аналитические модели (диффуры), ИНС, нечеткие системы, генетические алгоритмы, имитационные статистические модели.

  • Машинное обучение – обучение по данным в БД и способность последующего принятия решений

  • Обработка естественного языка – анализ естественного языка и синтез ответа.

Wolfram Alpha – единственная коммерческая семантическая сеть.

Метаданные – это данные о данных; инфо об инфо; структурированные данные, представляющие собой характеристики описываемых сущностей.

Онтология – (наука о бытии) попытка всеобъемлимой и детальной формализации некоторой области знаний с помощью концептуальной схемы, обычно такая схема составляет структуры данных, содержащие все релевантные классы объектов, связи между ними, правила, теоремы, ограничения принятые в этой области. Онтология используется в БЗ как иерархический способ построения понятий и отношений между ними.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]