Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции.doc
Скачиваний:
179
Добавлен:
28.06.2014
Размер:
1.1 Mб
Скачать

5. Семантическая метрика.

На множестве информационных единиц упорядочение сведений в когнитивных структурах человека происходит не только благодаря оппозиционным шкалам, но и также благодаря ассоциативным связям, характеризующим ситуационнуюблизость этих единиц. Эту связь можно было бы назватьотношением релевантностидля информационных единиц. Такое отношение дает возможность выделять в информационной базе некоторые типовые ситуации (например, «покупка», «учеба», «отдых»). Отношения релевантности при работе со знанием позволяет сузить пространство поиска нужной информации и находить знания, близкие к уже найденным.

Другая оценка близости информационных единиц опирается на частоту появления тех или иных ситуаций или конкретных представителей в типовых ситуациях. Выбор того или иного конкретного представителя из множества возможных подчиняется закону частоты его появления. Если, например, провести с представителями социума, в котором мы живем, эксперимент, в ходе которого испытуемый должен не задумываясь давать ответы на вопросы экспериментатора о названиях конкретных представителей типовых ситуаций или слов-понятий, то результат в подавляющем числе случаев будет демонстрировать действие закона частоты появления.

Если мы просим назвать поэта, то, как правило, русский человек даст ответ «Пушкин», а не «Байрон». На требование назвать инструмент, мы, как правило, получим ответ «молоток».

Такие эксперименты показывают, что у нас «на языке» готовые ответы на возможные запросы к нашей памяти всегда те, которые соответствуют наиболее часто встречавшемуся верному ответу. Подобный механизм позволяет при дефиците времени на обдумывание и поиск нужной информации в памяти всегда иметь нужные «клише», наиболее часто встречавшиеся в нашей жизни.

6. Наличие активности.

В связи с непрерывным развитием теории и практики программирования программы и данные, с которым эта программа работала, были отделены друг от друга. В программе было сосредоточено процедурное знание. Оно хранило в себе информацию о том,какнадо действовать, чтобы получить нужный результат. Машина выступала в роли мощного калькулятора, в котором программа играла рольактиватораданных.

Знания другого типа, которые обычно называют декларативными, хранили в себе информацию о том,над чемнадо выполнять эти действия. Процедурное знание формировало обращение к декларативному знанию, воплощенному на первом этапе развития программирования в пассивно лежащие в памяти машины данные.

Для интеллектуальных систем складывается противоположная ситуация. Не процедурные знания активизируют декларативные, а наоборот – та или иная структура декларативных знаний оказывается активаторомдля процедурных знания. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы.

Совокупность средств, обеспечивающих работу со знанием, образует систему управления базой знаний (СУБЗ), разработка которых сейчас усиленно развивается.

В развитых моделях представления данных можно выделить два компонента: интенсиональныепредставления иэкстенсиональныепредставления. Оба компонента хранятся в БД. При этом в ее экстенсиональную часть входят конкретные факты, касающиеся предметной области (например, строки таблицы 1.1), а в интенсиональную часть – схемы связей между атрибутами, выраженные в виде общих законов (постулатов). Будем рассматривать БД, в которых хранятся конкретные факты о предметной области как экстенсиональные БД (ЭБД), а БД для хранения общих законов как интенсиональные (ИБД). Если экстенсиональные представления относятся к данным, то относительно интенсиональных представлений единого мнения нет. Разработчики БД говорят в этом случае осхемах БД, а представители искусственного интеллекта – ознанияхв проблемной области. Естественно, мы будем придерживаться второй точки зрения.

Поясним на примере понятия экстенсионального и интенсионального представления знаний. Возьмем понятие ПРЕДШЕСТВУЕТ (сокращенно ПРЕД). Интенсиональный смысл этого понятия состоит в том, что ПРЕД есть бинарное отношение, определенное на множестве предметов и удовлетворяющее следующим условиям:

  1. если хПРЕДуиуПРЕДz, тоx ПРЕД z;

  2. не существует x1x2, …, xmтаких, чтоx1 ПРЕД x2,x2 ПРЕД x3, …,xm ПРЕД x1.

Экстенсиональное представление понятия ПРЕД получается тогда, когда это понятие интерпретируется как множество всех пар предметов, для которых это отношение истинно.

Пусть, например, предметная область состоит из всех двоичных слов длины n. Предположим, что отношение ПРЕД определено следующим образом:12…nПРЕД12…nтогда и только тогда, когда11,2  2, …,n  n.

Тогда экстенсиональным представлением понятия ПРЕД будет множество пар: (00…00, 00…01), (00…00, 00…10), …, (00…0, 10…0), (00…01, 00…11), (00…001, 00…101), …, (00…01, 10…01), …, (01…11, 11…11).

Легко показать, что число этих пар равно в данном примере 3n – 2n.

При таком экстенсиональном представлении имеется простой алгоритм, выясняющий для любой пары x,у {0, 1}nверно ли, чтохПРЕДу. Этот алгоритм заключается просто в поиске данной пары (х,у) среди пар экстенсионального представления. Если такая пара найдена, то ответом будет: «верно, чтохПРЕДу»; если же такой пары нет, то ответом будет: «неверно, чтохПРЕДу».

Конечно, опираясь только на интенсиональное представление 1) и 2) нельзя для конкретной пары (х,у) выяснить, верно ли, чтохПРЕДу. Нужна дополнительная информация об интерпретации. Можно, однако, рассматривать «комбинированные» экстенсиональное и интенсиональное представления, которые позволяют отвечать более эффективно на такие вопросы.

Эффективность алгоритмов вывода очень сильно зависит от выбранных экстенсиональных и интенсиональных представлений. Чисто экстенсиональное представление приводит к неэффективным алгоритмам (в том случае, если экстенсиональное представление понятий велико) или же вообще не позволяет дать алгоритм (в том случае, когда экстенсиональное представление бесконечно). С другой стороны, чисто интенсиональное представление не позволяет фиксировать интерпретацию, в частности ее область: необходимо также и экстенсиональное представление. Логика предикатов первого порядка показывает, что в определенном смысле произвольное знание можно выразить почти чисто интенсионально: единственным экстенсиональным представлением является экстенсиональное представление понятия ИСТИНА. Однако, проблемы распознавания в языке логики предикатов первого порядка либо вообще алгоритмически неразрешимы, либо имеют трудоемкие алгоритмы (алгоритмы с весьма высокими нижними оценками по времени и памяти).

Таким образом, в ЭБД конкретные факты находятся в экстенсиональной форме посредством соответствующих кортежей (n-ок) отношений. ИБД служит для хранения общих законов (постулатов), представленных в виде правильно построенных выражений логики предикатов первого порядка. Введение интенсиональной части БД является очень важным с точки зрения дедуктивного вывода и позволяет нам перейти к рассмотрению дедуктивных БД, являющихся составной частью дедуктивных систем принятия решений. Отсюда понятно различие между обычными БД и дедуктивными: в дедуктивных БД для вывода новых фактов из общих законов используются методы автоматического доказательства теорем, в то время как в обычных БД пользователь должен писать более сложные предложения для запроса, включая необходимые ему общие законы. Отметим также, что дедуктивные механизмы вывода должны являться, на наш взгляд, интегральной частью любой технологии БД и как следствие любой интеллектуальной системы.

Возвращаясь к табличному представлению данных, отметим, что экстенсиональное отношение – это определенным образом выделенное подмножество декартова произведения доменов, относящихся к некоторому набору атрибутов. Например, содержимое таблицы 1 есть подмножество декартова произведения доменов, соответствующих атрибутам: «Ф.И.О.», «Год рождения», «Факультет», «Курс», «№ зачетной книжки», «Специализация». В схеме баз данных такому экстенсиональному отношению будет соответствовать интенсиональное отношение R(A1, A2, …, Am). Имя этого отношения совпадает с именем экстенсионального отношения (например, для таблицы 1Rпредставляет собой «список студентов данного университета»), а в качестве его аргументов выступают атрибуты, домены которых использовались для образования соответствующего экстенсионального отношения.

Табличное представление данных, протоструктура которых определяется экстенсиональными отношениями, а схема БД – интенсиональными отношениями, является характерным для реляционных БД.