- •Глава 10. Машинное обучение
- •10.1. Компоненты процесса обучения
- •10.2. Индуктивное обучение
- •10.3. Система id3
- •10.4. Система induce
- •Индуктивно сгенерированные правила
- •Переменные, используемые для классификации
- •10.5. Алгоритм обучения понятиям
- •10.6. Неинкрементальное (параллельное) обучение в решетках Галуа
- •10.7. Адаптивная дискретизация непрерывных значений атрибутов
- •10.8. Открытие знаний
- •10.9. Типы закономерностей, выявляемых методами над
- •10.10. Бизнес-приложения методов иад
- •10.11. Классы систем иад Предметно-ориентированные аналитические системы
- •Статистические пакеты
- •Системы рассуждений на основе аналогичных случаев (cbr case based reasoning)
- •Деревья решений (decision trees)
- •Эволюционное программирование
- •Генетические алгоритмы
- •Алгоритмы ограниченного перебора
- •К-ближайший сосед
- •Технология deep data mining
- •10.12. Архитектура систем иад
- •10.13. Применение алгоритмов типа аво (вычисления оценок) для построения итерационных алгоритмов поиска
- •10.14. Алгоритм распознавания типа «Кора»
- •10.15. Обучение машин распознаванию образов
- •10.16. Алгоритмы автоматического построения классификаций
- •Общее описание методов партициальной кластеризации
- •Алгоритм партициальной кластеризации. Метод k-средних (k-means)
- •Алгоритмы иерархической кластеризации
- •Программные средства интеллектуального анализа данных
- •Ibm Visualization Data Explorer
- •Data mining suite
10.2. Индуктивное обучение
Индуктивное обучение заключается в том, чтобы получить применимые правила из изучения прошлых специфических примеров. Таким образом, индуктивное обучение также называется обучением по примерам. В основу индуктивного обучения положены принципы индуктивных умозаключений. Индуктивным называется умозаключение, в котором на основании принадлежности признака отдельным предметам или частям некоторого класса делают вывод о его принадлежности классу в целом. Полная индукция может быть описана следующим образом:
Посылки: S1имеет признак Р, S2 имеет признак Р, Sn имеет признак Р, S1S2,...,Sn— составляют класс К. Заключение: Всем предметам класса К присущ признак Р.
Выраженная в посылках этого умозаключения информация служит достаточным основанием для логического переноса признака на весь класс. В случае неполной индукции — на основе принадлежности признака некоторым элементам или частям класса— делают вывод о его принадлежности классу в целом. Индуктивное обучение может основываться также на аналогии. Умозаключение по аналогии — это вывод о принадлежности определенного признака единичному объекту (предмету, событию, отношению или признаку) на основе его сходства в существенных чертах с другим уже известным единичным объектом. Умозаключению по аналогии всегда предшествует операция сравнения двух объектов, которая позволяет установить сходство и различие между ними. При этом для аналогии требуется сходство в существенных признаках и различие в несущественных. Рассуждение по аналогии имеет следующую структуру:
Допустим, пользователь желает установить наличие некоторого свойства Q у объекта b, но не имеет такой возможности. Можно использовать подобие объектов b и а. Первые п посылок устанавливают наличие такого подобия, на основании чего делается заключение а = Ь. Далее, опираясь на это заключение о подобии объекта а объекту b, n+1-ю посылку, которая говорит о на-личиии у объекта свойства Q(a), делается вывод о наличии этого свойства у объекта b, т.е. Q(b).
Строгая аналогия имеет место в том случае, если достоверно установлено, что переносимый признак Т находится в условной зависимости от признаков сходства, т.е. (P,Q,S) -> Т.
Различают аналогию свойств и аналогию отношений. В случае аналогии свойств посылки имеют вид:
Рис 10.3. Взаимосвязи между элементами схемы индукции
Мы будем рассматривать результат индуктивного как множество правил продукции. Ситуацию обучения мы будем описывать следующим образом: из одного или более примеров, в которых действие (action,) явилось адекватной реакцией на ситуацию (situation;) мы делаем вывод, что действие общего вида (actiongen) является адекватным видом реакции на обобщенную ситуацию (situationgen) . При формировании правил вида «если <условие>, то... <действие>, мы будем в зависимости от их адекватности ситуации ослаблять или усиливать их. Антецедент правила является более сильным, если множество его истинности имеет меньшую мощность. Один способ сделать правило более сильным или специализировать его состоит в том, чтобы добавить конъюнкцию.
В общем случае определение понятия применимо к некоторому множеству ситуаций, которое называется положительными примерами и не применимо к другому множеству, которое называется негативными примерами. Важными шагами в процессе индуктивного обучения являются процессы генерализации и специализации. Один из путей генерализации — это генерализация типа IS-A. Добавление дизъюнкции к концепту делает его более общим, добавление конъюнкции — более специфичным.
Конечным этапом генерализации является универсализация, в результате которой осуществляется переход от единичных примеров к некоторому общему условию, выраженному при помощи квантора общности. Обозначения, используемые для выражения определения понятий, должны обладать свойством, что подобные ситуации должны иметь подобные описания и обозначения.
В процессе сравнения абстрактных и конкретных ситуаций мы выделяем абстрактное отображение. Переход от абстрактной ситуации к конкретной есть просто инстанциация, замена переменных константами. Обратный переход есть последовательность генерализаций. Мы будем рассматривать процесс сравнения как модифицированный процесс дедукции, в котором допускается, что цель может быть не достигнута.
Обучение тесно связано с поиском в пространстве состояний. Такой поиск требует существования множеств операторов, которые трансформируют состояния, проблема поиска заключается в том, чтобы найти последовательность операторов, которые переводят начальное состояние в целевое (желаемое), т.е., состояние, которое удовлетворяет описанию цели. Пространство, которое подвергается изучению — это пространство «частичных планов» или сеть задач. Операторы сводят задачи к подзадачам и накладывают упорядочение на прежде неупорядоченные задачи. Модель мира может быть описана, как конечное множество формул без переменных.
Описание состояния — это конъюнкция литералов, переменные которых интепретируются экзистенциально. Мы будем представлять такие конъюнкции как конечное множество литералов.
Целевая конъюнкция G сравнивается с текущим состоянием S. Результатом сравнения является множество разностей, определенное ниже. Максимальная подстановка — это подстановка θ , такая, что для всех других подстановок θ', |Gθ - S׀ < |Gθ'- S|. Здесь мы используем обозначение Gθ для формулы, полученной подстановкой значений переменных в G. Максимальная подстановка совпадения — это такая подстановка, которая минимизирует конъюнкции Gθ', не найденные в S.
Разница между G и S — это формула р такая, что для некоторой максимальной подстановки совпадения 9, р Gθ — S. Говорят, что Gθ — S — разностное множество для θ. G совпадает с S точно, если G θ S для некоторого θ. Возможно, что разность G θ - S не выводима (не устранима) в ситуации S.
Мы могли бы попытаться изменить мир, чтобы исключить эту разность, пытаясь элиминировать ее, изменяя определение концепта. Наиболее простой путь — удалить избыточные конъюнкции из описания, однако в нашем распоряжении имеются также операции генерализации.
Программа поиска совпадения использует генерализацию, однако проблема заключается в том, какой из многих возможных вариант специализации затем избрать. Специализация необходима также тогда, когда ситуации совпадают, в то время как они не должны совпадать. Рассмотрим для каждого элемента f разностного множества Nθ (f) элементы S, для которых выполняется (f). Хороший способ генерализации состоит в том, чтобы найти некий суперкласс такой, что заменив им конъюнкции в Gθ и S, мы ликвидируем различие.
Другой возможностью является включение различия в виде дизъюнкции, представляющей исключение из правила вывода. Однако список таких исключений очень быстро разрастается. Важным шагом в поиске совпадений является замена констант переменными. Если в результате многократных сопоставлений обнаруживается, что константы сравниваемых ситуаций, совпадающих в остальном, сопоставимы, то это является свидетельством возможности их вариабелйзации.
Предположим, мы имеем описание желаемой ситуации в виде списка элементарных конъюнкций, имеющих вид (имя атрибута, 'значение атрибута) для исходной ситуации и для целевой. Производя сопоставление каждой из множества данных ситуаций с целевой, алгоритм делит список конъюнкций на два возможно пустых класса — обязательный и желательный. Конъюнкции класса «обязательный» должны быть удовлетворены, из конъюнкций класса «желательный» требуется, чтобы совпало максимальное количество элементов.
Понятие соответствия между ситуациями можно рассматривать, используя для этой идеи термин аналогии. Аналогия образует некоторое соответствие или отображение между ситуациями. Это отображение не делает ситуации идентичными, но их различие, возможно, игнорируется. Одна трудность с аналогиями состоит в том, что это отображение может не быть взаимно однозначным.
Поскольку индивидуально генерируемые правила обычно используются для проблемы классификации, при обучении ставится общая задача получить характеристики не хуже, чем в других статистических методах, таких как статистический дискриминантный анализ.
В отличие от дискриминантного анализа индуктивное обучение не делает никаких допущений априори относительно формы взаимосвязей переменных (например, линейной зависимости). Индуктивное обучение допускает как качественные, так и количественные переменные, и его можно рассматривать как такую же родственную процедуру как дискриминантный анализ.
Такие пакеты, как EXPERT-EASY, VP-Expert, UNIK-INDUCE оборудованы средствами индуктивного обучения.
Предположив, что мы в состоянии решить нетривиальную проблему разработки хорошего языка описания, мы сталкиваемся с вопросом, каким образом можно на этом языке строить нужные описания.
Один из подходов состоит в том, чтобы организовать в пространстве всех возможных описаний поиск таких из них, которые являются и верными, и полезными. Однако число возможных описаний носит астрономический характер, и оно тем больше, чем более выразительным является язык описаний.
Ясно, что должен быть найден какой-то способ управления таким поиском, позволяющий избежать рассмотрения громадного числа потенциально возможных описаний (т. е. понятий), которые не имеют отношения к изучаемой в данный момент задаче. Было показано, что этого можно достигнуть многими методами, если использовать незашумленные обучающие последовательности. Мы же ограничимся рассмотрением здесь четырех конкретных примеров систем, допускающих использование данных с шумами.
Во всех этих системах обучение правилам классификации происходит в результате рассмотрения цепочки правильно классифицированных обучающих примеров — обучающего множества. При этом предполагается, что такие правила впоследствии могут быть применены к новым данным такого же типа, которых не было в обучающем множестве. Правильная классификация лежит в основе многих систем искусственного интеллекта, таких как интеллектуальные управляющие устройства, системы диагностики, советчики, чувствительные устройства роботов и тому подобные системы.