
- •1. Введение в интеллектуальные системы.................................................................7
- •2. Разработка систем, основанных на знаниях ........................................................36
- •3. Теоретические аспекты инженерии знаний..........................................................55
- •4. Технологии инженерии знаний.............................................................................. 95
- •5. Новые тенденции и прикладные аспекты
- •6. Программный инструментарий разработки систем, основанных на знаниях............................................................................................................................194
- •7. Пример разработки системы, основанной на знаниях ................................….226
- •8. Представление данных и знаний в Интернете...................................................257
- •9. Интеллектуальные Интернет-технологии..........................................................300
- •1. Введение в интеллектуальные системы
- •1.1. Краткая история искусственного интеллекта
- •1.1.1. Предыстория
- •1.1.2. Зарождение нейрокибернетики
- •1.1.3. От кибернетики «черного ящика» к ии
- •1.1.4. История искусственного интеллекта в России
- •1.2. Основные направления исследований в области искусственного интеллекта
- •1.2.1. Представление знаний и разработка систем, основанных на знаниях (knowledge-based systems)
- •1.2.2. Программное обеспечение систем ии (software engineering for Al)
- •1.2.3. Разработка естественно-языковых интерфейсов и машинный перевод (natural language processing)
- •1.2.4. Интеллектуальные роботы (robotics)
- •1.2.5. Обучение и самообучение (machine learning)
- •1.2.6. Распознавание образов (pattern recognition)
- •1.2.7. Новые архитектуры компьютеров (new hardware platforms and architectures)
- •1.2.8. Игры и машинное творчество
- •1.2.9. Другие направления
- •1.3. Представление знаний и вывод на знаниях
- •1.3.1. Данные и знания
- •1.3.2. Модели представления знаний
- •1.3.3. Вывод на знаниях
- •1.4. Нечеткие знания
- •1.4.1. Основы теории нечетких множеств
- •123456789 10 Рис. 1.7. Формирование нечетких множеств
- •1.4.2. Операции с нечеткими знаниями
- •1.5. Прикладные интеллектуальные системы
- •2. Разработка систем, основанных на знаниях
- •2.1. Введение в экспертные системы. Определение и структура
- •2.2. Классификация систем, основанных на знаниях
- •2.2.1. Классификация по решаемой задаче
- •2.2.2. Классификация по связи с реальным временем
- •2.2.3. Классификация по типу эвм
- •2.2.4. Классификация по степени интеграции с другими программами
- •2.3. Коллектив разработчиков
- •2.4. Технология проектирования и разработки
- •2.4.1. Проблемы разработки промышленных эс
- •2.4.2. Выбор подходящей проблемы
- •2.4.3. Технология быстрого прототипирования
- •2.4.4. Развитие прототипа до промышленной эс
- •2.4.5. Оценка системы
- •2.4.6. Стыковка системы
- •2.4.7. Поддержка системы
- •3. Теоретические аспекты инженерии знаний
- •3.1. Поле знаний
- •3.1.1. О языке описания поля знаний
- •3.1.2. Семиотическая модель поля знаний
- •3.1.3. «Пирамида» знаний
- •3.2. Стратегии получения знаний
- •3.3. Теоретические аспекты извлечения знаний
- •3.3.1. Психологический аспект
- •3.3.2. Лингвистический аспект
- •3.3.3. Гносеологический аспект извлечения знаний
- •3.4. Теоретические аспекты структурирования знаний
- •3.4.1. Историческая справка
- •3.4.2. Иерархический подход
- •3.4.3. Традиционные методологии структурирования
- •3.4.4. Объектно-структурный подход (осп)
- •4. Технологии инженерии знаний
- •4.1. Классификация методов практического извлечения знаний
- •4.2. Коммуникативные методы
- •4.2.1. Пассивные методы
- •4.2.2. Активные индивидуальные методы
- •4.2.3. Активные групповые методы
- •4.3. Текстологические методы
- •4.4. Простейшие методы структурирования
- •4.4.1. Алгоритм для «чайников»
- •4.4.2. Специальные методы структурирования
- •4.5. Состояние и перспективы автоматизированного приобретения знаний
- •4.5.1. Эволюция систем приобретения знаний
- •4.5.2. Современное состояние
- •4.6. Примеры методов и систем приобретения знаний
- •4.6.1. Автоматизированное структурированное интервью
- •4.6.2. Имитация консультаций
- •4.6.3. Интегрированные среды приобретения знаний
- •4.6.4. Приобретение знаний из текстов
- •5. Новые тенденции и прикладные аспекты инженерии знаний
- •5.1. Латентные структуры знаний и психосемантика
- •5.1.1. Семантические пространства
- •5.1.2. Методы многомерного шкалирования
- •5.1.3. Использование метафор для выявления «скрытых» структур знаний
- •5.2. Метод репертуарных решеток
- •5.2.1. Основные понятия
- •5.2.2. Методы выявления конструктов Метод минимального контекста
- •5.2.3. Анализ репертуарных решеток
- •5.2.4. Автоматизированные методы
- •5.3. Управление знаниями
- •5.3.1. Что такое «управление знаниями»
- •5.3.2. Управление знаниям и корпоративная память
- •5.3.3. Системы omis
- •5.3.4. Особенности разработки omis
- •5.4. Визуальное проектирование баз знаний как инструмент познания
- •5.4.1. От понятийных карт к семантическим сетям
- •5.4.2. База знаний как познавательный инструмент
- •5.5. Проектирование гипермедиа бд и адаптивных обучающих систем
- •5.5.1. Гипертекстовые системы
- •5.5.2. От мультимедиа к гипермедиа
- •5.5.3. На пути к адаптивным обучающим системам
- •6. Программный инструментарий разработки систем, основанных на знаниях
- •6.1. Технологии разработки программного обеспечения - цели, принципы, парадигмы
- •6.1.1. Основные понятия процесса разработки программного обеспечения (по)
- •6.1.2. Модели процесса разработки по
- •6.1.3. Инструментальные средства поддержки разработки систем по
- •6.2. Методологии создания и модели
- •6.3. Языки программирования для ии и языки представления знаний
- •6.4. Инструментальные пакеты для ии
- •6.5. WorkBench-системы
- •7. Пример разработки системы, основанной на знаниях
- •7.1. Продукционно-фреймовый япз pilot/2
- •7.1.1. Структура пилот-программ и управление выводом
- •7.1.2. Декларативное представление данных и знаний
- •7.1.3. Процедурные средства языка
- •7.2. Психодиагностика – пример предметной области для построения экспертных систем
- •7.2.1. Особенности предметной области
- •7.2.2. Батарея психодиагностических эс «Ориентир»
- •7.3. Разработка и реализация
- •7.3.1. Архитектура системы и ее база знаний
- •7.3.2. Общение с пользователем и опрос испытуемых
- •7.3.3. Вывод портретов и генерация их текстовых представлений
- •7.3.4. Помощь и объяснения в эс «Cattell»
- •8. Представление данных и знаний в Интернете
- •8.1. Язык html и представление знаний 8.1.1. Историческая справка
- •8.1.2. Html - язык гипертекстовой разметки Интернет-документов
- •8.1.3. Возможности представления знаний на базе языка html
- •8.2. Онтологии и онтологические системы
- •8.2.1. Основные определения
- •8.2.2. Модели онтологии и онтологической системы
- •8.2.3. Методологии создания и «жизненный цикл» онтологий
- •8.2.4. Примеры онтологий
- •8.3. Системы и средства представления онтологических знаний
- •8.3.1. Основные подходы
- •8.3.2. Инициатива (ка)2 и инструментарий Ontobroker
- •Средства спецификации онтологий в проекте Ontobroker
- •Формализм запросов
- •Формализм представления и машина вывода
- •Аннотация Web-страниц онтологической информацией
- •8.3.3. Проект shoe - спецификация онтологий и инструментарий Общая характеристика проекта
- •Спецификации онтологий и инструментарий shoe
- •Формализм представления и машина вывода
- •Аннотация Web-документов на базе онтологии
- •Формализм запросов
- •8.3.4. Другие подходы и тенденции
- •9. Интеллектуальные Интернет-технологии
- •9.1. Программные агенты и мультиагентные системы
- •9.1.1. Историческая справка
- •9.1.2. Основные понятия
- •9.2. Проектирование и реализация агентов и мультиагентных систем
- •9.2.1. Общие вопросы проектирования агентов и mac
- •9.2.2. Инструментарий AgentBuilder
- •9.2.3. Система Bee-gent
- •9.3. Информационный поиск в среде Интернет
- •9.3.1. Машины поиска
- •9.3.2. Неспециализированные и специализированные поисковые агенты
- •9.3.3. Системы интеллектуальных поисковых агентов
- •Autonomy и Web compass - системы интеллектуального поиска и обработки информации
- •Проект системы marri
- •Прототип системы OntoSeek
- •(Onto)2 - агент поиска и выбора онтологий
5.5. Проектирование гипермедиа бд и адаптивных обучающих систем
5.5.1. Гипертекстовые системы
Первые информационные системы на основе гипертекстовых (ГТ) моделей появились еще в середине 60-х [Engelbart, 1968], но подлинный расцвет наступил в 80-е годы после появления первых коммерческих ГТ систем для ПЭВМ - GUIDE (1986 г.) и HyperCard (1987 г.). В настоящее время ГТ технология является стандартом de facto в области АОС и сверхбольших документальных БД [Nielsen, 1990; Агеев, 1994].
Под гипертекстом понимают технологию формирования информационных массивов в виде ассоциативных сетей, элементами или узлами которой выступают фрагменты текста, рисунки, диаграммы и пр.
Навигация по таким сетям осуществляется по связям между узлами. Основные функции связей [Conklin, 1987]:
• перейти к новой теме;
• присоединить комментарий к документу;
• соединить ссылки на документ с документом, показать на экране графическую информацию (рисунок, чертеж, график, фотографию и пр.);
• запустить другую программу и т. д.
Учитывая широкое использование графовых структур в моделировании, ГТ может приобретать черты более сложных моделей, например сетей Петри, диаграмм состояний и др.
В настоящее время не существует стандартизированной технологии разработки «хорошо структурированного» ГТ, хотя важность когнитивно-наглядной и «прозрачной» структуры ГТ очевидна.
В качестве рабочего упрощенного алгоритма составления ГТ можно предложить следующий (в п. 5.5.3 будет представлен более сложный вариант).
Инструкция по разработке гипертекстового приложения
1. Дайте название воображаемому документу, например «Учебник по кулинарии», «Справочник абитуриента» и пр.
2. Представьте, что вся информация должна быть сгруппирована как в хорошем учебнике, то есть в виде глав и параграфов. Основное условие для глав, параграфов и подпараграфов - сбалансированность, то есть примерно равная величина.
3. Проставьте перекрестные ссылки между понятиями внутри параграфов, придерживаясь принципа «чем меньше - тем лучше».
4. Добейтесь баланса аудио, видео и графической информации.
5. Предоставьте возможность возвращения на шаг назад или на более высокий уровень иерархии.
6. Отобразите иерархическое положение текущей страницы. Например, если мы находимся в подпараграфе, то необходимо вывести название текущей главы и параграфа.
7. Еще раз проверьте гипертекстовое содержание, в котором отражены все главы, параграфы и подпараграфы. Из любой страницы приложения должен быть доступ к этому содержанию.
8. Все необходимые гипертекстовые ссылки лучше располагать не в самом тексте, а разместить их в одном месте на странице, например в конце страницы.
9. Ссылки, по которым пользователь уже заходил, должны выделяться другим цветом.
5.5.2. От мультимедиа к гипермедиа
Мультимедиа (ММ) сегодня понимается как интегрированная компьютерная среда, позволяющая использовать наряду с традиционными средствами взаимодействия человека и ЭВМ (алфавитно-цифровой и/или графический дисплей, принтер, клавиатура) новые возможности: звук (живой человеческий голос, музыку и др.), видеоролики (цветные художественные и документальные клипы), озвученную мультипликацию и т. д.
Когда элементы ММ объединены на основе сети гипертекста, можно говорить о гипермедиа (ГМ). Основной сферой применения ГМ сегодня являются автоматизированные обучающие системы (АОС) или электронные учебники. Размещение в узлах сети не только текстовой и цифровой информации, но и графиков, видеоклипов, фото и музыки обогащает гипертекст и увеличивает занимательность и наглядность электронных учебников. В последние годы ММ активно внедряется и в интеллектуальные системы [Nielsen, 1990], особенно в системы-консультанты, как эффективное средство увеличения наглядности и понятности рекомендаций, выдаваемых системой. Использование анимации, звука и видео существенно облегчает усвоение учебного материала по структурированию знаний и снижает уровень когнитивных усилий учащихся при одновременном уменьшении времени, необходимого на изучение данной проблематики.
Основной предпосылкой интереса к гипермедиа-системам является фактически беспрецедентный успех глобальной сети Интернет и WWW-технологии.
Другим фактором появления ГМ можно считать мощный прорыв на рынке машинных носителей информации со стороны фирм, производящих компакт-аудиодиски (PHILIPS, SONY, NIMBUS) в виде CD-ROM (Compact Disc Read Only Memory), позволяющих хранить до 600 Мб информации, тем самым открывая дверь для обработки BLOB (Binary Large Objects) - больших двоичных объектов, например оцифрованных видеоизображений.
Тем не менее, существует целый ряд проблем, с которыми сталкиваются разработчики ММ-систем, независимо от того, ориентированы они на Интернет-приложения или на автономные учебники на CD-ROM:
• отсутствие методологии и технологии структурирования разнородной информации;
• отсутствие единых стандартов на системы кодирования и обработки;
• сложные аппаратные и программные решения проблем аналого-цифровых преобразований и синхронизации полноэкранного видео.
Сейчас не существует единой методологии, а тем более технологии разработки ГМ систем, такое состояние характеризуется как «no science, rather art», то есть «не наука, а искусство». Однако первые подступы к созданию технологии уже сделаны [Кирмайкл, 1994; Reisman, 1991], и разработки в этой области продолжают активно развиваться.
Традиционно процесс разработки ГМ включает:
Фаза 1 - проектирование и разработка структуры и отдельных фрагментов гипермедиа-приложения, включая звуковые и видеоролики, программное окружение. 1 фаза - наиболее трудоемкий по времени и человеческим ресурсам период. Эту фазу осуществляет команда, состоящая из:
• менеджера;
• специалиста по системам обучения;
• эксперта предметной области;
• дизайнера-графика;
• системного аналитика;
• сценариста;
• программиста.
Фаза 2 зависит от того, на какой вариант приложения рассчитана система.
Для Интернет-приложений разрабатываются Web-страницы на языке HTML с включением оцифрованных в специальных форматах звука, изображений, анимации и видео. При этом могут использоваться специальные пакеты, например Dreamwever или FrontPage.
Для изготовления CD-дисков используется как HTML-формат, так и специальные программные средства (authoring languages and systems), как, например Toolbook или Macromedia Director.
Фаза 3 включает прототипирование CD-ROM на специальном устройстве WORM (Write Once Read Many) и его тестирование либо размещение приложения на Интернет-сайте.
Фаза 4 - это тиражирование и производство готовых CD ROM.