Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции.doc
Скачиваний:
179
Добавлен:
28.06.2014
Размер:
1.1 Mб
Скачать

1 Данные и знания в интеллектуальных системах

Рассмотренные нами методы дедуктивного вывода относятся к достоверным, т.е. из множества посылок, имеющих выделенные истинностные значения выводимы заключения, также имеющие лишь выделенные истинностные значения. Так как в двузначной логике выделенным истинностным значением является «истина», то из истинных посылок не выводимы ложные заключения.

Дедуктивные выводы в настоящее время хорошо изучены, и автоматическое доказательство теорем является старейшей ветвью искусственного интеллекта. Конечно, формальные, синтаксические методы дедуктивного вывода не способны обрабатывать сложные прикладные области с большим пространством поиска нужной информации. Необходимо разрабатывать эвристические методы управления таким поиском, применять adhocстратегии, которые использует человек при решении различных проблем. Таким образом, на первый план выдвигаются рассуждения «здравого смысла», рассуждения, оперирующие с неполной, противоречивой, неточной, неопределенной информацией, где главную роль играет правдоподобный вывод. Но прежде чем переходить к основным методам правдоподобного вывода – абдукции и индукции – необходимо остановиться на основных особенностях данных и знаний, применяемых в интеллектуальных системах различного назначения.

Характерные особенности знания

Данные и знания есть основные понятия системы представления знаний, являющейся одной из главных компонент интеллектуальной системы принятия решений. Исторически в теории и практике программирования понятие «данные» видоизменялось и усложнялось. Сначала под данными понимались двоичные слова фиксированной длины. С развитием структуры вычислительных машин происходило развитие информационных структур для представления данных. Появились способы описания данных в виде векторов и матриц, возникли списочные и иерархические структуры. В настоящее время в языках программирования высокого уровня используютсяабстрактные типы данных, структура которых задается программистом. Появление БД знаменовало собой еще один шаг на пути организации работы с данными. Специальные средства, образующие систему управления БД (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из БД и записывать в нужном порядке в БД.

Таким образом, данные – это факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

По мере развития исследования в области интеллектуальных систем возникла концепция знаний, которая стала доминирующей в исследованиях по искусственному интеллекту.

Как считает Д.А. Поспелов, не существует никакой объективной границы для смены термина «данные» на термин «знания». Он выделил шесть этапов для усложнения данных и превращения их в знания. Охарактеризуем суть каждого этапа.

1. Внутренняя интерпретируемость.

На заре развития программирования каждой информационной единице – данному – программист отводил определенную ячейку памяти, которой соответствовал ее адрес в памяти, т.е. приписанное ей уникальное имя. Такое приписывание имени информационной единице приводило к тому, что только сам программист знал содержимое, скрывающееся под тем или иным именем. При необходимости он использовал это содержимое в программе, вызывал его по имени, причем, что скрывается за тем или иным именем машине не было известно.

Переход от физических адресов к относительным, а позднее и к символьным создал большие удобства для программиста. Он освобождался от забот по распределению реальной памяти в машине. Автоматически распределяя физическую память, машина формировала таблицу соответствий, в которой относительным или символьным адресам соответствовали физические адреса, назначаемые машиной. Но и в этом случае машина не получала информации о том, что именно скрывается за введенными программистом именами, соответствующими относительным или символьным адресам.

Имена информационных единиц не подвергались ее анализу, и машина не могла ответить ни на один запрос, который касался бы содержимого ее памяти, если программист не составил для ответа специальной программы.

Если, например, в память машины нужно было записать сведения о студентах университета, представленные в таблице 1.1, то без внутренней интерпретации в память машины была бы занесена совокупность из четырех машинных слов, соответствующих строкам этой таблицы.

Таблица 1.

Ф.И.О.

Год рождения

Факультет

Курс

зачетной книжки

Специализация

Железнов В.П.

1979

АВТ

4

М1273

прикладная математика

Попов П.С.

1981

РТ

3

Р523

Радиотехника

Иванов А.П.

1978

ЭТ

5

Э1451

Электротехника

Петухова С.С.

1983

ПТ

2

Т485

Теплоэнергетика

Информационная единица, которой, например, приписано имя «Железнов В.П.», выглядит так: (<Год рождения, 1979> <Факультет, АВТ> <Курс, 4> <№ зачетной книжки, М1273> <Специализация, прикладная математика>). Круглые скобки здесь служат для выделения содержанияинформационной единицы, а угловые скобки выделяют в ней самостоятельные части, называемые обычнослотами. Полная запись информационной единицы, таким образом, имеет вид: (Имя информационной единицы <Имя 1-го слота, Значение 1-го слота> <Имя 2-ого слота, Значение 2-ого слота> … <Имяn-ого слота, Значениеn-ого слота>).

При этом информация о том, какими группами двоичных разрядов в этих машинных словах закодированы сведения о студентах, у системы отсутствуют. Они известны лишь программисту, который использует данные таблицы 1.1 для решения возникающих у него задач.

При переходе к знаниям в память машины вводится информация о некоторой протоструктуре информационных единиц, «шапка» таблицы в нашем примере. Она представляет собой специальное машинное слово, в котором указано, в каких разрядах хранятся данные о Ф.И.О., годах рождения, факультета, курсах, номерах зачетных книжек и специализациях. При этом должны быть заданы специальные словари, в которых перечислены имеющиеся в памяти системы Ф.И.О., года рождения, факультеты и т.п. Все этиатрибутымогут играть роль имен для тех машинных слов, которые соответствуют строкам таблицы. По ним можно осуществлять поиск нужной информации. Каждая строка таблицы будетэкземпляром протоструктуры. В настоящее время СУБД обеспечивает реализацию внутренней интерпретируемости всех информационных единиц, хранимых в реляционной БД.