
- •Задание курсовой работы.
- •Предметная область.
- •Исходные данные.
- •Компонентный анализ.
- •Кластерный анализ.
- •Построение дерева решений.
- •Нейросетевой анализ данных на основе обучения с учителем.
- •Нейросетевой анализ данных на основе самоорганизующихся карт Кохонена.
- •Анализ с помощью гибридной (нейро-нечеткой) сети. Построение выборки.
- •Анализ и разбиение второго класса.
- •Компонентный анализ.
- •Кластерный анализ.
- •Список литературы.
Оглавление
Задание курсовой работы. 1
Предметная область. 3
Исходные данные. 4
Компонентный анализ. 4
Кластерный анализ. 20
Построение дерева решений. 25
Нейросетевой анализ данных на основе обучения с учителем. 29
Нейросетевой анализ данных на основе самоорганизующихся карт Кохонена. 30
Анализ с помощью гибридной (нейро-нечеткой) сети. Построение выборки. 33
Анализ и разбиение второго класса. 34
Компонентный анализ. 34
Кластерный анализ. 36
Построение дерева решений. 38
Нейросетевой анализ данных на основе обучения с учителем. 38
Нейросетевой анализ данных на основе самоорганизующихся карт Кохонена. 39
Анализ с помощью гибридной (нейро-нечеткой) сети. 39
Вывод. 45
Список литературы. 46
Задание курсовой работы.
1. Подготовить выборку на основе статистических данных по выбранной предметной области; перечень тем для проведения макроэкономического анализа указаны в приложении, темы также могут быть предложены студентом самостоятельно. Требования к выборке: количество объектов – не менее 50; количество признаков – больше 7; значения признаков – числовые.
2. Выполнить компонентный анализ данных с использованием пакета Statgraphics для предварительной обработки данных с целью определения наиболее значимых для последующего анализа признаков. Предварительно сформировать правила классификации объектов.
3. Провести кластерный анализ данных с использованием пакета Statgraphics. Сформулировать правила классификации объектов. По результатам проведенного анализа дополнить обучающую выборку столбцом с номером класса.
4. Провести нейросетевой анализ данных на основе обучения с учителем с использованием пакета Deductor (выполнить решение задач классификации). Использовать режимы обучения и what-if – анализ для отнесения нового объекта к какому-либо классу.
5. Провести нейросетевой анализ данных на основе самоорганизующихся карт Кохонена (обучение без учителя) с использованием пакета Deductor (выполнить решение задач кластеризации). Применение метода самоорганизующихся карт позволяет решать задачи кластеризации и дает возможность подтвердить результаты проведенного компонентного и кластерного анализа данных. What-if – анализ позволяет определить принадлежность нового объекта к классу.
6. Сопоставить результаты нейросетевого анализа (п.4.и п.5).
7. Разработать гибридную (нейро-нечеткую) сеть для принятия решения по управлению объектом в выбранной предметной области. Для этого необходимо составить дополнительную обучающую выборку, структура которой соответствует правилам принятия решений вида «если-то»:
-
№ кластера
Ресурсы
Принимаемое решение
ЕСЛИ
ТО
№ кластера – номера кластеров, полученные по результатам нейросетевого анализа данных;
ресурсы – имеющиеся у ЛПР в наличии запасы (финансовые или иные средства), которые могут быть использованы для изменения (улучшения) состояния объекта;
принимаемое решение – набор типовых решений, принимаемых для изменения (улучшения) состояния объекта.
8. Применить разработанную нейро-нечеткую сеть для различных наборов исходных данных, сделать выводы.
Предметная область.
Потребление основных продуктов питания в регионах Российской Федерации за 2012 год.
Объекты – регионы Российской Федерации, признаки – осовные продукты питания.
Исходные данные.
Исходные данные представлены в прилагающемся документе Исходная выборка.xls. В данной выборке входными полями являются «Картофель», «Растительное масло», «Молоко и молочные продукты», «Мясо и мясопродукты», «Бахчевые культуры», «Рыба и рыбопродукты», «Сахар», «Фрукты и ягоды», «Хлебные продукты» и «Яйца и яйцепродукты».
Таким образом, получаем 80 объектов и 10 признаков, значения которых являются числовыми.