
- •Конспект по курсу «Информационные интеллектуальные системы»
- •1. Введение
- •3. Общение с иис на естественном языке
- •3.1. Проблема диалогового общения
- •3.2. Ограниченный естественный язык. Синтаксис, семантика, словари
- •3.3. Ограниченный естественный язык. Грамматики
- •3.4. Методы интерпретации естественного языка
- •3.5. Пример лингвистической обработки сообщений
- •Обработка вВод вывод
- •3.6. Пример: диалоговая система управления процессом сборки редуктора.
- •4. Обработка информации в иис
- •4.1. Виды, задачи, источники информации
- •4.2. Уровни обработки данных в иис
- •4.3. Слияние информации и принятие решений
- •4.4. Сегментация и классификация
- •4.5. Проблема распознавания речи
- •4.6. Проблема распознавания лиц
- •4.7. Проблема распознавания трехмерных объектов
- •4. Получение знаний
- •4.1. Извлечение знаний
- •4.2. Автоматическое формирование знаний (Обучение)
- •5.2. Раскопка данных и раскрытие знаний
- •Основные понятия интеллектуального анализа данных
- •Постановка задачи
- •Подготовка данных
- •Просмотр данных
- •Построение моделей
- •Исследование и проверка моделей
- •Развертывание и обновление моделей
- •Алгоритмы интеллектуального анализа данных
- •Алгоритм дерева принятия решений (Microsoft)
- •Упрощенный алгоритм Байеса (Microsoft)
- •Алгоритм кластеризации (Microsoft)
- •Алгоритм нейронной сети (Microsoft)
- •Алгоритм логистической регрессии (Microsoft)
- •Алгоритм временных рядов (Microsoft)
- •Алгоритм кластеризации последовательностей (Microsoft)
- •Алгоритм взаимосвязей (Microsoft)
- •5.3. Пример прогнозирования продаж автомобилей
- •4.1. Раскрытие данных. (Data Mining)
- •6. Получение знаний в иис
- •6.1. Проблема обучения машин
- •6.2. Методы обучения в иис
- •6.3. Экспертное (копирующее) обучение
- •6.4. Обучение с подкреплением
- •6.5. Пример управления роботом-уборщиком
- •Использование знаний в иис
- •7.1. Управление знаниями
- •7.2. Знания в Интернете и поиск
- •7.3. Онтологии и поиск Веб-источников
- •7.4. Раскопка Веб-сайтов
- •8. Многоагентные иис
- •8.1. Системы с интеллектуальными агентами на правилах
- •8.2. Системы с интеллектуальными агентами на логике
- •8.3. Системы с когнитивными агентами
- •9. Когнитивные системы
- •Когнитивный подход в психологии и машинном интеллекте
- •Нейрологические средства управления.
- •Реализация базовых нейрологических модулей
- •Когнитивные нейрологические системы управления и агенты.
- •Список литературы (по главе 9)
3.2. Ограниченный естественный язык. Синтаксис, семантика, словари
Человеческий язык как средство передачи и восприятия информации, существенно отличается от машинных языков своей нестрогостью, неоднозначностью интерпретации, огромным словарным размером и пр. При использовании естественного языка в технических системах имеет смысл говорить лишь о некоторых ограниченных подмножествах языка, ориентированных на узкие проблемные области и имеющие жестко фиксированные наборы форм построения предложений (естественно-языковых форм).
Полезное использование естественного языка в технических системах возможно, если отображения f и f -1 эффективно вычислимы. Полные естественные языки, используемые человеком, имеют функции отображения , которые пока на компьютере эффективно вычислены быть не могут. Отсюда стремление работать с упрощенными, т.е. ограниченными естественно-языковыми формами. Такие ограничения связаны с введением упрощенного синтаксиса, семантики языка.
Синтаксис определяет правила, описывающие входящие в язык тексты как цепочки символов, составляющие морфемы, словоформы, словосочетания и предложения. Морфема - значимая мельчайшая часть слова (корень, суффикс, окончания). Словоформа или просто слово-цепочка морфем. Словосочетание и предложения представляют собой цепочки слов незаконченных и законченных по содержанию. Синтаксис связан с алфавитом А={a1,…,аN} - определенный набор используемых символов.
Семантика определяет правила, смысловые значения входящих в язык цепочек.
Словари определяют другое упрощение естественного языка. Различают терминальные и нетерминальные словари. Терминальный словарь VT - это набор исходных элементов, из которых строятся синтаксически правильные цепочки символов, т.е. словарь основных слов языка, из которых строятся предложения. Нетерминальный словарь VH -это набор символов, которыми обозначаются исходных элементов или словарь синтаксических типов. Элементы этих словарей называются соответственно терминальными и нетерминальными символами. Число элементов VT и VH в ограниченных естественно-языковых формах существенно сужено, поскольку определяется узкой предметной областью и возможностями программного интерпретатора языка.
5________________________
3.3. Ограниченный естественный язык. Грамматики
Синтаксис, семантика и словари определяют грамматику языку, отображающую его структуру. Строгость языка зависит от степени формализации его грамматики.
В общем виде, грамматику можно представить упорядоченной системой вида
G = (VT, VH, H0 . Р),
где VT и VH - терминальный и нетерминальный словари; H0 - начальный нетерминальный символ, обозначающий класс всех тех языковых объектов, для описания которых предназначена грамматика; Р - правила грамматики, которые могут быть порождающими, распознающими, преобразующими.
Порождающие правила - позволяют строить любую правильную цепочку, давая указания об ее строении. Основная форма правил: «Если имеется набор символов φ, то может быть построена правильная цепочка ψ с определенным строением».
Распознающие правила - позволяют решить, является ли цепочка правильной , и дает указания о ее строении. Основная форма правил такая:
«Если цепочка φ удовлетворяет синтаксическим правилам, то φ – правильная цепочка и ее строение такое-то».
Преобразующие правила - правила позволяют для любой правильно построенной цепочки строить ее отображение в виде правильной цепочки, задавая при этом указания о порядке проведения отображения. Основная форма правил: «Если φ то ψ» (заменить цепочку φ на ψ). Такие правила позволяют делать выводы. Ограниченный естественный язык должен иметь формализованную грамматику с небольшим количеством правил порождения и преобразования предложений, причем эти правила не должны допускать неоднозначностей. В машинном варианте грамматика отображена в базе знаний грамматик, обычно имеющей продукционную форму.
Заметим, что грамматики могут быть контекстно-свободными (КС- грамматики) и контекстно-зависимыми (КЗ- грамматики). В первом случае предложения естественного языка не связываются с содержанием (контекстом) и интерпретируются относительно простыми КС -грамматиками. Во втором случае интерпретация усложняется неоднозначностью распознавания предложений естественного языка, которая может быть снята только дополнительным анализом контекста с помощью КЗ- грамматик.
6________________________