
Формализация знаний
В настоящее время в области ИИ одной из основных проблем является проблема представления знаний. В рамках этой проблемы решаются задачи, связанные с формализацией и представлением знаний в памяти СИИ. Для этого разрабатываются специальные модели представления знаний и языки для описания знаний, выделяются различные типы знаний. Изучаются источники, из которых СИИ может черпать знания, и создаются процедуры, с помощью которых возможно приобретение знаний для СИИ.
Следует отличать данные от знаний.
Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства: результаты измерений и наблюдений в таблицах, протоколах, справочниках, структуры данных в виде диаграмм, графиков, функций и т.д.
Для хранения данных используются базы данных.
Базой данных (БД) является представленная в объективной форме совокупность самостоятельных материалов (статей, расчетов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины, т.е. база данных хранится и обрабатывается вычислительной системой, данные в базе данных хорошо структурированы (систематизированы), структура базы данных обеспечивает эффективный поиск и обработку данных.
Например, компьютерные программы для работы юридического агенства содержат базу данных клиентов; программы для работы сервисного центра, предоставляющего обслуживание и ремонт бытовой техники и компьютеров, содержат базу данных клиентов и поставщиков; программы для работы туристического агентства содержат базу данных клиентов и партнеров и т.д. Для баз данных характерен большой объём и относительно небольшая стоимость информации.
Знания представляют собой результат мыслительной деятельности человека, обобщают его опыт, полученный в ходе практической деятельности. Знания – это выявленные закономерности предметной области. Знания существуют в памяти человека как результат обучения, воспитания, мышления, размещены в учебниках, инструкциях, книгах, методических пособиях и т.д.
Для хранения знаний используются базы знаний.
База знаний (БЗ) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Под базами знаний понимают совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.
Чаще всего базы знаний используются при создании экспертных систем - программ, способных играть роль человека-эксперта в некоторой предметной области, то есть, как правило, предоставлять консультации по некоторым проблемам в режиме "вопрос - ответ". Например, экспертная система в книжном Интернет - магазине может рекомендовать приобрести конкретные книги или книги конкретных жанров с учетом потребностей, предпочтений и даже настроения пользователей.
Базы знаний отличаются сравнительно небольшими объёмами, но исключительно дорогими информационными массивами.
Основные методы формализации знаний
Для решения задач ИИ компьютер должен «обладать знаниями» в какой-то конкретной области – компьютерной базой знаний (БЗ).
Компьютерная БЗ – определённым образом формализованные и заложенные в память компьютера знания из конкретной предметной области (в языке программирования Пролог - это совокупность фактов и правил).
При создании СИИ должны быть решены две основные задачи:
Моделирование знаний для создания БЗ.
Моделирование рассуждений.
Моделированием знаний (формализацией знаний), разработкой БЗ и созданием на их основе СИИ занимается инженер по знаниям (когнитолог).
Проблема представления знаний достаточна сложна. Было предпринято множество исследований с целью выяснить, каким образом многообразие сведений об отдельных фактах и общие принципы построения окружающего нас мира можно использовать в компьютерных программах. Существует методика, получившая название анализ протокола (Ньюэлл, Саймон), которая заключается в том, что человеку предлагается «думать вслух» в процессе решения проблемы, а затем зафиксированный протокол анализируют и пытаются отыскать в нём концепции и процедуры, которые были использованы человеком. Исследования показали, что для моделирования знаний целесообразно использовать конструкции следующих видов (в чистом виде или в комбинации):
правила в форме: «если имеет место условие, то примени этот оператор»;
разного рода сети, в которых узлы соответствуют концепциям, а дуги – отношениям между ними;
логические формулы, представляющих отдельные факты и принципы, включая управляющую информацию о том, когда применить то или иное соответствие.