
- •Введение
- •1. База знаний
- •2. Процесс построения баз знаний
- •3. Модели представления знаний
- •3.1 Продукционные модели
- •3.2 Логические модели
- •3.3 Семантические сети или сетевые модели
- •3.4 Фреймовые модели
- •4. Система управления базами знаний.
- •Ключевые понятия
- •Что такое база знаний
- •Продукционные модели
- •Список используемой литературы
3.3 Семантические сети или сетевые модели
Однозначное определение семантической сети в настоящее время отсутствует. В инженерии знаний под ней подразумевается граф, отображающий смысл целостного образа. Узлы графа соответствуют понятиям и объектам, а дуги – отношениям между объектами.
Семантическая сеть как модель наиболее часто используется для представления декларативных знаний. С помощью этой модели реализуются такие свойства системы знаний, как интерпретируемость и связность, в том числе по отношениям IS-A и PART-OF. За счет этих свойств семантическая сеть позволяет снизить объем хранимых данных, обеспечивает вывод умозаключений по ассоциативным связям.
Одной из первых известных моделей, основанных на семантической сети, является TLC-модель (Teachaple Languge Compre-hender — доступный механизм понимания языка), разработанная Куиллианом в 1968 году. Модель использовалась для представления семантических отношений между концептами (словами) с целью описания структуры долговременной памяти человека в психологии.
3.4 Фреймовые модели
Фреймовая модель основана на концепции Марвина Мински (Marvin Minsky) — профессора Массачусетского технологического института, основателя лаборатории искусственного интеллекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания.
Фреймы образуют иерархию. Иерархия во фреймовых моделях порождает единую многоуровневую структуру, описывающую либо объект, если слоты описывают только свойства объекта, либо ситуацию или процесс, если отдельные слоты являются именами процедур, присоединенных к фрейму и вызываемых при его актуализации.
Фреймы подразделяются на:
фрейм-экземпляр — конкретная реализация фрейма, описывающая текущее состояние в предметной области;
фрейм-образец — шаблон для описания объектов или допустимых ситуаций предметной области;
фрейм-класс — фрейм верхнего уровня для представления совокупности фреймов образцов.
Состав фреймов и слотов в каждой конкретной фреймовой модели может быть разный, однако в рамках одной системы целесообразно единое представление для устранения лишнего усложнения.
Разнотипные объекты или объекты, соответствующие концепции «множественности миров», заключающейся, к примеру, в том, что лошадь — животное бескрылое для одного (реального) мира и одновременно крылатое (Пегас в мифическом мире) для другого, могут описываться отличающимися друг от друга фреймами.
В целом фреймовая модель допускает представление всех свойств декларативных и процедурных знаний. Глубина вложенности слотов во фрейме (число уровней) зависит от предметной области и языка, реализующего модель.
4. Система управления базами знаний.
Системы баз знаний являются разновидностью прикладного искусственного интеллекта (ИИ). Эта область привлекает все большее внимание и подразумевает наличие разнообразных навыков. Хотя до сих пор не существует официальных учебных программ и не выдается дипломов по инженерии знаний, ожидается, что скоро «индустрия знаний» приобретет то же значение, что и «информационная индустрия». Системы баз знаний в какой-либо области разрабатываются специалистами и экспертами по инженерии знаний. Разработчики систем и специалисты в области поведенческой теории и информатики изучают способы решения человеком задач с целью имитации знаний, полученных от экспертов в какой-либо области или других источников, в компьютерной программе. Они систематизируют эти знания в виде базы знаний. База знаний похожа на структуру данных. Это систематизированный набор знаний в какой-либо конкретной области, который постоянно дополняется и расширяется.
Самые важные и распространенные системы баз знаний - экспертные системы. Это компьютерные программы, которые используют знания и методы рассуждений для решения задач, обычно требующих знаний живого эксперта. Другими видами систем с базой знаний являются системы гипермедиа, системы автоматизированной разработки программного обеспечения (CASE, computer-aided/assisted software engineering), интеллектуальные обучающие системы и гибридные системы. В основе гипермедиа лежит интеграция текста, звука, изображений, данных и знаний в виде мультимедийного гипертекста. Используя CD-ROM, видео - диски или жесткие диски в сочетании с программным обеспечением для поиска информации, гипермедиа позволяет вести поиск в свободной форме на основе знаний по соответствующим ссылкам. Гипермедиа - лучший кандидат пароль структуры баз данных компьютерных систем будущего. Технология CASE сочетает в себе интегрированные программные инструменты и методики, которые дают возможность автоматизировать жизненный цикл программного обеспечения (анализ, разработку, программирование, тестирование и поддержку программного обеспечения). Интеллектуальные обучающие системы являются приложением ИИ в сфере образования. Они имеют много общего с учебными системами баз знаний, которые обычно связаны с более крупными базами данных. Наряду с этим существуют гибридные системы, созданные на основе частичного наложения различных систем баз знании.
В большинстве компаний системы баз знаний используются на постоянной основе. Область их применения широка, от медицинских диагностических систем до интеллектуальных систем для проведения мультимедийных презентаций, от планировки новых заводов до систем обеспечения безопасности объектов атомной энергетики.
Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, включают руководства, письма, новости, информацию о заказчиках, сведения о конкурентах и данные, накопившиеся в процессе разработки. Для применения КМ-систем используются разнообразные технологии:
• электронная почта;
• базы и хранилища данных (Data Wharehouse);
• системы групповой поддержки;
• браузеры и системы поиска;
корпоративные сети и Интернет;
экспертные системы и базы знаний;
интеллектуальные системы.
Традиционно проектировщики систем управления знаний ориентировались лишь на отдельные группы потребителей - главным образом менеджеров. Более современные КМ-системы спроектированы уже в расчете на целую организацию.
Хранилища данных, которые работают по принципу центрального склада, были одним из первых инструментариев КМ. Как правило, хранилища содержат многолетние версии обычной БД, физически размещаемые в той же самой базе. Когда все данные содержатся в едином хранилище, изучение связей между отдельными элементами может быть более плодотворным.
При этом активы знаний могут находиться в различных местах: в базах данных, базах знаний, в картотечных блоках, у специалистов и могут быть рассредоточены по всему предприятию. Слишком часто одна часть предприятия повторяет работу другой части просто потому, что невозможно найти и использовать знания, находящиеся в других частях предприятия.
Необходимость разработки систем КМ обусловлена следующими причинами:
• работники предприятия тратят слишком много времени на поиск необходимой информации;
• опыт ведущих и наиболее квалифицированных сотрудников используется только ими самими;
• ценная информация захоронена в огромном количестве документов и данных, доступ к которым затруднен;
• дорогостоящие ошибки повторяются из-за недостаточной информированности и игнорирования предыдущего опыта.
Важность систем КМ обусловлена также тем, что знание, которое не используется и не возрастает, становится устаревшим и бесполезным, так же, как деньги, которые сохранены без того, чтобы стать оборотным капиталом, в конечном счете, теряют свою стоимость, пока не обесценятся. Напротив, знание, которое распространяется, приобретается и обменивается, генерирует новое знание.
Большинство обзоров концепции управления знания (КМ) уделяет внимание только первичной обработке корпоративной информации типа электронной почты, программного обеспечения коллективной работы или гипертекстовых баз данных (например [Wiig, 1996]). Они формируют существенную часть из необходимой, но определенно не достаточной технической инфраструктуры для управления знаниями.
Одним из новых решений по управлению знаниями является понятие корпоративной памяти (corporate memory), которая по аналогии с человеческой памятью позволяет пользоваться предыдущим опытом и избегать повторения ошибок.
Корпоративная память не позволяет исчезнуть знаниям выбывающих специалистов (уход на пенсию, увольнение и пр.). Она хранит большие объемы данных, информации и знаний из различных источников предприятия. Они представлены в различных формах, таких как базы данных, документы и базы знаний.
Введем два уровня корпоративной памяти (так называемые явные и неявные знания [Nonaka, Takeuchi, 1995]).
Уровень 1. Уровень материальной или явной информации - это данные и знания, которые могут быть найдены в документах организации в форме сообщений, писем, статей, справочников, патентов, чертежей, видео и аудиозаписей, программного обеспечения и т. д.
Уровень 2. Уровень персональной или скрытой информации это персональное знание, неотрывно связанное с индивидуальным опытом. Оно может быть передано через прямой контакт - «с глазу на глаз», через процедуры извлечения знаний. Именно скрытое знание - то практическое знание, которое является ключевым при принятии решения и управлении технологическими процессами.
В действительности эти два типа информации, подобные двум сторонам одной и той же медали, одинаково важны в структуре корпоративной памяти. При разработке систем КМ можно выделить следующие этапы:
Накопление. Стихийное и бессистемное накопление информации в организации.
Извлечение. Процесс, идентичный традиционному извлечению знаний для ЭС (см. главы 2 и 3). Это один из наиболее сложных и трудоемких этапов. От его успешности зависит дальнейшая жизнеспособность системы.
Структурирование. На этом этапе должны быть выделены основные понятия, выработана структура представления информации, обладающая максимальной наглядностью, простотой изменения и дополнения.
Формализация. Представление структурированной информации в форматах машинной обработки, то есть на языках описания данных и знаний.
Обслуживание. Под процессом обслуживания понимается корректировка формализованных данных и знаний (добавление, обновление): «чистка», то есть удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям.
Если первые четыре этапа обычны для инженерии знаний, то последний является специфичным для систем управления знаниями.
Как уже было сказано, он распадается на три более мелких процесса:
Корректировка формализованных знаний (добавление, обновление).
Удаление устаревшей информации.
Фильтрация знаний для поиска информации, необходимой пользователю, выделяет компоненты данных и знаний, соответствующие требованиям конкретного пользователя. При помощи той же процедуры пользователь может узнать местонахождение интересующей его информации. База знаний содержит в себе знания о предметной области. Для представления знаний, как отмечалось ранее, используется та или иная модель знаний, зависящая от особенностей решаемой задачи.
Под системой управления базой знаний (СУБЗ) понимают инструментальную систему, обеспечивающую создание, ведение и применение базы знаний. Ввод знаний в БЗ и их последующее обновление в ЭС осуществляется механизмом приобретения знаний. В простейшем варианте, это интеллектуальный редактор, который позволяет вводить единицы знаний в БЗ и проводить их синтаксический и семантический контроль, например, на противоречивость (избыточность). В более сложных случаях извлечение знаний осуществляется: на основе специальных сценариев опроса экспертов; из вводимых примеров реальных ситуаций, как в случае индуктивного вывода; из текстов или из опыта работы самой интеллектуальной системы.
Если рассматривать БЗ как автономную подсистему ЭС, то в ней можно выделить следующие компоненты:
базу концептуальных знаний (БКЗ);
базу экспертных знаний (БЭЗ);
базу данных (БД) как элемент расширения базы знаний
БД как объект хранения информации может активно применяться совместно с БКЗ и БЭЗ. В реальных БЗ выделяют следующие формы знаний: • понятия (как математические, так и нематематические); • факты; • правила; • зависимости; • законы; • закономерности; • связи; • алгоритмы; • процедуры.
возможности рассмотренных выше моделей представления знаний (логическая, продукционная, фреймовая, семантическая) в БКЗ и БЭЗ существенно возрастают в случае "насыщения" этих моделей элементами "мягких" вычислений, предполагающих применение:
• нечеткой логики (обработка информации в условиях неопределенности);
• нейронных сетей;
• генетических алгоритмов;
• когнитивной графики.
Под прецедентом при этом понимается описание проблемы или ситуации с указанием подробного плана действий, предпринимаемых в данной ситуации для решения данной проблемы. Прецедент, как правило, включает в себя:
• проблемную ситуацию, которая описывает состояние исследуемого процесса в момент, когда произошел прецедент;
• процедуру решения этой проблемы;
• результат, описывающий состояние исследуемого процесса после возникновения проблемной ситуации и принятия определенного решения.
БЗ прецедентов строится на основе классификации прецедентов в соответствии с множеством решений по управлению выводом в проблемных ситуациях. Между БЗ прецедентов и базой правил ЭС осуществляется постоянный обмен информацией, выполняемый таким образом, чтобы:
• пополнить базу правил новыми правилами ( в том числе на основе новых прецедентов);
• адаптировать решения, содержащиеся в прецедентах;
• корректировать БЗ прецедентов, исключая устаревшие и малоэффективные прецеденты.
К основным функциям управлениям БЗ относятся:
поддержка пользовательского интерфейса;
пополнение и редактирование БЗ;
логический вывод;
поддержка целостности и непротиворечивости знаний;
реорганизации БЗ.
Отметим, что системы управления БЗ (СУБЗ) могут быть встроены в информационно-управляющую систему, например, в системы управления внешней или массовой памятью ЭВМ с целью их интеллектуализации
Прямое использование знаний для решения поставленных перед ЭС задач обеспечивается решателем – механизмом логического вывода (МЛВ), который дает возможность извлекать из БЗ ответы на вопросы, получать решения задач, формулируемых в терминах понятий, хранящихся в БЗ.
Заключение
Быстрое действие и большая емкость запоминающих устройств позволит использовать знания, основанные на здравом смысле, и предоставит возможность одновременно обрабатывать правила, фреймы и другие структуры знаний. Станет необходимой обработка данных с массовым параллелизмом и применение суперкомпьютеров. Программное обеспечение позволит обучение на базе опыта и обновление его базы данных. Также оно будет обладать возможностями динамического отклика на изменяющиеся входные условия или функцию. Системы с базой знаний будут полагаться на автоматизированное программное обеспечение по получению знаний. В качестве пользовательских интерфейсов будут использоваться распознавание речи и ввод рукописной информации. Коммуникации будут многоязычными, появятся возможности машинного перевода.
Приобретение знаний — это то, что ограничивает развитие систем с базой знаний. Мы сможем разработать более эффективные системы с базой знаний только в том случае, если мы лучше поймем способы обработки знаний, их хранения и поиска, свойственные человеческому разуму, а также принципы накопления человеком опыта.
У компьютера большие возможности искусственного интеллекта. Он превратится из устройства для обработки данных в устройство для обработки знаний. Обладая сенсорными связями и роботами, система с базой знаний сможет собирать и анализировать информацию, а также действовать бел вмешательства человека. Языковое программное обеспечение будет имитировать интуицию. Дополнительные технологии, такие как нейросети или «широкомасштабная» параллельная обработка, подготовят почву для появления интеллектуальных машин более высокого уровня.