
- •Минобрнауки россии
- •Текст печатается в авторской редакции
- •2. Цель работы.
- •3. Порядок выполнения работы.
- •4. Содержание отчета
- •2. Цель работы.
- •3. Порядок выполнения работы.
- •4. Содержание отчета
- •2. Цель работы.
- •3. Порядок выполнения работы.
- •4. Содержание отчета
- •5. Контрольные вопросы.
- •Список рекомендуемой литературы:
- •Исходные данные Вариант 1
2. Цель работы.
Целью работы является приобретение навыков в построении решающего правила в виде линейных разделяющих поверхностей.
3. Порядок выполнения работы.
1. Исходя из варианта, указанного преподавателем, изучить исходный набор экспериментальных данных для 2-х классов с указанными параметрами: количество признаков, вид функции плотности, координаты центров классов, дисперсия для каждого признака.
2. На основании полученных данных найти координаты центров классов
3. С использованием описанной выше методики найти уравнение линейной разделяющей поверхности аналитическим методом,
4. С использованием программы MicrosoftOffice EXCEL провести поиск уравнения линейной разделяющей поверхности итерационным методом, а также определить время поиска. Сравнить полученное уравнение с уравнением, полученным в п.п.З
5. Провести отображение данных в 2-мерное пространство. Для этого используя первые 2 координаты признакового пространства отобразить объекты классов ТЭД в декартовом пространстве xl, х2. Также отобразить -слученные уравнения.
6. Используя данные ТЭД в качестве контрольной выборки провести оценку качества полученных моделей.
4. Содержание отчета
1. Данные исходной ТЭД, с указанием количества классов, функции плотностей, математического ожидания и дисперсии для каждого класса ТЭД.
2. Результаты моделирования: промежуточные этапы формирования уравнения поверхности аналитическим методом и уравнение, полученное итерационным методом.
3. Результаты отображения данных и результат оценки качества модели
4. Выводы по работе.
5. Контрольные вопросы
1. Общий вид уравнения разделяющей поверхности.
2. Что называется решающим правилом?
3. Для каких структур дранных рассмотренный метод наиболее подходит?
4. Каким образом производится поиск решающего правила аналитически и итерационно? Написать алгоритм итерационного поиска решающего правила.
5. Какие методы анализа информативности признаков вы знаете?
Лабораторная работа №3
Изучение эталонных классификаторов
1. Краткие теоретические сведения.
Среди задач принятия решений связанных с обработкой ТЭД для получения решающих правил, одним из методов классификации является построение решающего правила в виде эталонных классификаторов. Эталоны как правило состоят из набора элементарных замкнутых объемов многомерного пространства, образованного выбранными, на этапе предварительного анализа данных, классификационными переменными. Чаще всего эталоны представляют в виде гиперкубов, гиперпараллелипипедов, гиперсфер, гиперэлипсоидов и.т.д.
В практических приложениях используют гиперпараллелипипеды, описываемые системой неравенств типа (10) и гиперсферы типа (11).
(10),
где i - номер классификационной переменной, aik и bjk - нижняя и верхняя граница ограничения Wk по признаку xi.
(11),
где mi - коэффициент, определяющий центр гиперсферы, Rk - ее радиус.
На рисунке 7 и 8 представлена геометрия гиперобъемов, формируемых системой выражений типа 10 и 11 соответственно.
Рис. 2. Геометрия гиперобъема, описываемого выражением типа (10)
Рис. 3. Геометрия гиперобъема, описываемого выражением типа (11)
Классы со сложной геометрической структурой могут быть представлены в виде целого набора элементарных гиперобъемов, например так, как это представлено на рисунке 4.
Рис 4. Представление классов со сложной геометрической структурой наборами элементарных гиперобъемов.
Построение решающих правил в виде эталонных классификаторов сводится к нахождению настраиваемых параметров модели типа I и 2. Для: гиперкуба типа 1 - настраиваются параметры аik и bik, которые представляют собой максимальное и минимальное значения элементов ТЭД для k-го класса 1-го признака, для гиперсферы типа 2 определяются параметры центра гиперсферы, например как центр масс данного класса, а также радиуса Rk. Нахождение данного параметра сводится к поиску наиболее удаленной от центра точки в ТЭД для класса номер k. При этом найденное расстояние и будет соответствовать заданному параметру.