
- •Системы искусственного интеллекта
- •1. Общие понятия об искусственном интеллекте.
- •1.1. Предмет исследования искусственного интеллекта.
- •1.2. Проблемы искусственного интеллекта.
- •1.3. История развития систем искусственного интеллекта.
- •1.4. Подходы к построению систем искусственного интеллекта.
- •2. Знания в системах искусственного интеллекта.
- •2.1. Понятие и виды знаний.
- •2.2. Системы баз знаний.
- •2.3. Онтологии.
- •2.4. Методы представления знаний.
- •2.5. Методы приобретения знаний.
- •3. Экспертные системы.
- •3.1. Базовые понятия.
- •3.2. Методика построения эс.
- •4. Искусственная жизнь.
- •4.1. Генетические алгоритмы.
- •4.2. Клеточные автоматы.
- •5. Распознавание образов.
- •5.1. Понятие образа.
- •5.2. Проблема обучения распознаванию образов.
- •5.3. Гипотеза компактности.
- •5.4. Подходы к распознаванию образов.
- •5.5. Обучение и самообучение распознаванию образов.
- •6. Методы обучения распознаванию образов.
- •6.1. Кластерный анализ структуры многомерных данных.
- •6.1.1. Основные понятия кластерного анализа.
- •6.1.2. Общая схема кластеризации.
- •6.1.3. Методы кластеризации.
- •6.2. Метод потенциальных функций.
- •6.3. Метод предельных упрощений.
- •6.4. Коллективы решающих правил.
- •6.5. Метод группового учета аргументов.
5.4. Подходы к распознаванию образов.
Геометрический подход.
Целью реализации подхода является построении поверхности, которая разделяла бы образы в пространстве признаков. Если образы компактны, то они не имеют общих точек, и всегда существует целое множество разделяющих их функций.
Структурный (лингвистический) подход.
Выделяется набор исходных понятий – типичные фрагменты и характеристики взаимного расположения фрагментов. Эти исходные понятия образуют словарь, позволяющий строить различные логические высказывания. Задача состоит в том, чтобы отобрать наиболее существенные высказывания для данного случая. Далее, просматривая конечное и, по возможности, небольшое число объектов из каждого образа, нужно построить описание этих образов. Построенные описания должны быть столь полными, чтобы решить вопрос о том, к какому образу принадлежит данный объект.
Таким образом, при реализации этого подхода возникают две задачи: задача построения исходного словаря и задача построения правил описания из элементов заданного словаря.
5.5. Обучение и самообучение распознаванию образов.
Обучение – процесс выработки в некоторой системе той или иной реакции на группы внешних идентичных сигналов путем многократного воздействия на систему внешней корректировки. Механизм генерации этой корректировки определяет алгоритм обучения.
При самообучении дополнительная информация о верности реакции системе не сообщается.
Алгоритмы, соответствующие обучению и самообучению, классифицируются как алгоритмы обучения с учителем и без учителя.
В первом случае существует «учитель», который предъявляет входные объекты системе, сравнивает ее ответы (выходы) с требуемыми, а затем настраивает систему таким образом, чтобы уменьшить различия.
Во втором случае системе предъявляются объекты без каких-либо указаний об их принадлежности к образам. Система, используя некоторое заложенное в нее заранее свойство разделимости образов, производит самостоятельную классификацию этих объектов. Роль учителя при этом состоит лишь в подсказке системе некоторого объективного свойства, одинакового для всех образов и определяющего способность к разделению множества объектов на образы. Таким объективным свойством является свойство компактности образов. Взаимное расположение точек в выбранном пространстве уже содержит информацию о том, как следует разделить множество точек. Эта информация и определяет то свойство разделимости образов, которое оказывается достаточным для самообучения системы распознаванию образов.
6. Методы обучения распознаванию образов.
6.1. Кластерный анализ структуры многомерных данных.
6.1.1. Основные понятия кластерного анализа.
Кластерный анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации.
Кластеризация – это автоматическое разбиение элементов некоторого множества на группы (кластеры) по принципу схожести. Характеристики групп определяются только фактическим результатом.
Классификация относит каждый объект к одной из заранее определенных групп.
Пусть = (x1, …, xn) – вектор характеристик (объект), где n – размерность пространства характеристик.
Множество
объектов M
= {
}
– набор входных данных.
Расстояние
d(
,
)
между объектами
и
– результат применения выбранной
метрики в пространстве характеристик.
Кластер – подмножество «близких друг к другу» (с малым расстоянием) объектов из M.
Расстояние между группами объектов измеряется различными способами.
Пусть wi – i-я группа объектов (кластер);
Ni – число объектов, образующих группу wi;
i – «центр масс» i-й группы (среднее арифметическое координат объектов, входящих в wi);
q (ws, wm) – расстояние между группами ws и wm
Способы измерения расстояний между кластерами:
Расстояние ближайшего соседа – расстояние между ближайшими объектами кластеров
Расстояние дальнего соседа – расстояние между самыми дальними объектами кластеров
Расстояние центров тяжести – расстояние между центральными точками кластеров
Выбор меры расстояния между кластерами влияет на вид выделяемых геометрических группировок объектов в пространстве признаков. Алгоритмы, основанные на расстоянии ближайшего соседа, хорошо работают в случае группировок, имеющих сложную (например, цепочечную) структуру. Расстояние дальнего соседа применяется, когда искомые группировки образуют в пространстве признаков шаровидные облака. Алгоритмы, использующие расстояние центров тяжести, лучше всего работают в случае группировок эллипсоидной формы.
Критерий качества кластеризации должен отражать следующие неформальные требования:
а) внутри групп объекты должны быть тесно связаны между собой;
б) объекты разных групп должны быть далеки друг от друга;
в) при прочих равных условиях распределения объектов по группам должны быть равномерными.
Требования а) и б) выражают стандартную концепцию компактности классов разбиения; требование в) состоит в том, чтобы критерий не навязывал объединения отдельных групп объектов.
Примеры критериев качества кластеризации:
Среднее арифметическое расстояние между объектами и центрами их кластеров
,
где
– объект (k
= 1…K);
K – количество объектов;
– центр
кластера, в который входит объект
.
i – номер координаты (i = 1…n);
n – размерность пространства признаков.
Среднеквадратическое расстояние между объектами и центрами их кластеров
.