Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 8-10 Технологии и системы искусственного...doc
Скачиваний:
27
Добавлен:
21.09.2019
Размер:
194.56 Кб
Скачать

Вопрос 4. Интеллектуальный анализ данных. Управление знаниями

Информация — совокупность сведений (полезная информация + + информационный мусор) об объекте, процессе или явлении, являющаяся объектом хранения, передачи, преобразования и помогающая решить поставленную задачу.

Полезная информация – набор сведений, уменьшающих степень неопределенности у их получателя.

Релевантная информация – полезная информация, полностью устраняющая степень неопределенности у получателя.

Информационный мусор – данные, не несущие полезной информации и многократно увеличивающие временные и прочие издержки пользователя на извлечение и обработку полезной информации.

Данные – информация, характеризующая объекты, процессы, явления предметной области и их свойства, представленная в формализованном виде, предназначенная для хранения, передачи, приема и обработки. Данные безотносительны к содержанию информации.

Знания связаны с данными, основываются на них, но представляют результат мыслительной деятельности человека, обобщают его опыт, полученный в ходе выполнения какой-либо практической деятельности.

Знание можно также считать сравнительной информацией, которая позволяет принимать решения.

Знание - проверенный общественной практикой логически полный ограниченный набор полезных сведений, который может многократно использоваться людьми для решения тех или иных задач. Такие сведения выражаются в системе понятий, принятой в рамках некоторой науки или производственной деятельности, и имеют стандартное представление. Ограниченный набор позволяет задать уровень подготовки специалистов.

Знания могут быть классифицированы по следующим категориям:

поверхностные - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;

глубинные - абстракции, аналогии, схемы, отображающие структуру и процессы в предметной области.

В итоге имеем следующие простые формулы:

информация = данные + смысл;

знание = информация + сравнение.

Для хранения данных используются базы данных, для хранения знаний – базы знаний

Такое понимание сущности данных, информации и знаний может не только являться базой для общения, но также может способствовать более качественному проектированию информационных систем.

Модели представления знаний

Существуют десятки моделей (или языков) представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам: продукционные, семантические сети, фреймы, формальные логические модели.

Продукционная модель, или модель, основанная на правилах, позволяет представить знания в виде предложений: Если (условие), то (действие).

Под, условием понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под действием - действия, выполняемые при успешном исходе поиска.

При использовании продукционной модели база знаний состоит из набора правил.

Продукционная модель чаще всего применяется в промышленных экспертных системах (ЭС). Она привлекает разработчиков своей наглядностью, высокой модульностью, легкостью внесения дополнений и изменений и простотой механизма логического вывода.

Семантические сети

Семантика - это наука, устанавливающая отношения между символами и объектами, которые они обозначают, т.е. наука, определяющая смысл знаков.

Семантическая сеть – ориентированный граф, вершины которого - понятия, а дуги - отношения между ними.

Понятиями обычно выступают абстрактные или конкретные объекты, а отношения - это связи типа: «это», «имеет частью», «принадлежит», «любит».

Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

а) класс – элемент класса;

б) свойство – значение;

в) пример элемента класса.

Можно ввести несколько классификаций семантических сетей:

по количеству типов отношений: однородные (с единственным типом отношений) и неоднородные (с различными типами отношений).

по типам отношений: бинарные (в которых отношения связывают два объекта n=2) и n-арные (в которых есть специальные отношения, связывающие более двух понятий).

Наиболее часто в семантических сетях используются следующие отношения:

– связи «часть-целое» («класс-подкласс», «элемент-множество» и т.п.);

– функциональные связи («влияет», «производит» и т.п);

– количественные (больше, меньше, равно и т.п.);

– пространственные (далеко от, близко от, за, под, над и т.п.);

– временные (раньше, позже, в течение и т.п.);

– атрибутивные связи (иметь свойство, иметь значение и т.п.);

– логические связи (и, или, не) и др.

Пример 22.1.4.. На рисунке 22.1.2. изображена семантическая сеть. В качестве вершин графа используются понятия: Человек, Иванов, Волга. Автомобиль, Цвет, Красный.

Рисунок 22.1.2. – Семантическая сеть.

Проблема поиска решения в базе знаний с моделью семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети и поставленному вопросу.

Основное преимущество этой модели – соответствие современным представлениям об организации долговременной памяти человека.

Недостаток модели - сложность поиска вывода на семантической сети.

Фреймы представляют собой структуры знаний для восприятия пространственных сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обоснование.

Под фреймом понимается абстрактный образ или ситуация. В психологии и философии известно понятие абстрактного образа. Например, слово «комната» вызывает у слушающих образ комнаты – жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м2 . Из этого описания ничего нельзя убрать (например, убрав окна мы получим чулан, а не комнату), но в нем есть пробелы, или «слоты», - это незаполненные значения некоторых атрибутов (количество окон, цвет стен, высота потолка. покрытие пола и др).

Фреймом называется также формализованная модель для отображения образа.

Структура фрейма представлена в таблице 22.1.2:

Таблица 22.1.2. – Структура фрейма.

Имя фрейма

Имя слота

Тип слота

Значение слота

Присоединительная процедура

В качестве значения слота может выступать имя другого фрейма – так образуют сети фреймов.

Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения реальных ситуаций на основе поступающих данных.

Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через: фреймы-структуры, для обозначения объектов и понятий (заем, залог, вексель); фреймы-роли (менеджер, кассир, клиент); фреймы-сценарии (банкротство, собрание акционеров, празднование именин); фреймы-ситуации (тревога, авария, рабочий режим устройства) и др.

Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям (A-Kind-Of = = это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, т.е. переносятся, значения аналогичных слотов.

Основным преимуществом фреймов как модели представления знаний является способность отражать концептуальную основу организации памяти человека, а также гибкость и наглядность.

Пример 22.1.5. Рассмотрим сеть фреймов изображенную на рисунке 22.1.2.

– фрейм.

– АКО-связь между фреймами.

Рисунок 22.1.3. – Сеть фреймов.

Сеть включает в себя три фрейма: «человек», «ребёнок», «ученик». Фрейм «ученик» наследует свойства фреймов более высокого уровня иерархии «ребенок» и «человек». На высокий уровень иерархии указывают слоты АКО). Так, на вопрос: «Любят ли ученики сладкое?», следует ответ: «Да», так как этим свойством обладают все дети, (это указано во фрейме «ребенок»). Наследование свойств может быть частичным, так, возраст для учеников не наследуется из фрейма «ребенок», поскольку указан в своем собственном фрейме.

Формальные логические модели основаны на классическом исчислении предикатов 1 порядка, когда предметная область или задача описывается в виде набора аксиом. Эта логическая модель применима в основном в исследовательских «игрушечных» системах, так как предъявляет очень высокие требования и ограничения к предметной области.