
- •Задание курсовой работы.
- •Предметная область.
- •Исходные данные.
- •Компонентный анализ.
- •Кластерный анализ.
- •Построение дерева решений.
- •Нейросетевой анализ данных на основе обучения с учителем.
- •Нейросетевой анализ данных на основе самоорганизующихся карт Кохонена.
- •Анализ с помощью гибридной (нейро-нечеткой) сети. Построение выборки.
- •Анализ и разбиение второго класса.
- •Компонентный анализ.
- •Кластерный анализ.
- •Список литературы.
Анализ и разбиение второго класса.
Для анализа будет использоваться выборка, находящаяся в файле Выборка для разбиения.xls. В ней записаны только те регионы, которые были определены в 3-й класс.
Компонентный анализ.
Рис. 33. Анализ собственных значений компонент
Так как значение первой компоненты (рис. 33) представляет маленький процент, то будем рассматривать первые две компоненты.
Рис. 34. Таблица весов компонент
Для первой компоненты (рис. 34) значимые признаки – «Фрукты», «Картофель» и «Хлеб». Признак «Хлеб» имеет отрицательное значение. Для второй компоненты – «Рыба» и «Фрукты».
Рассмотрим компоненты.
Первая компонента:
Рис. 35. Диаграмма рассеивания первой компоненты
Можно выделить 3 класса (рис. 35). Запишем объекты и правила.
Объекты:
2, 8, 10, 11, 12, 13, 21, 23, 24, 25;
1, 3-7, 9, 14, 16-20, 22, 26-28, 30-37;
15, 29.
Правила:
Если фруктов мало и картофеля мало и хлеба много, то класс 1;
Если фруктов средне и картофеля средне и хлеба средне, то класс 2;
Если фруктов много и картофеля много и хлеба мало, то класс 3.
Вторая компонента:
Рис. 36. Диаграмма рассеивания второй компоненты
Объекты:
12, 13, 14, 16, 22, 25, 26, 35;
1-6, 8, 10, 11, 15, 17-19, 21, 23, 24, 27 -31, 33, 34, 36, 37;
7, 9, 20, 32.
Правила:
Если рыбы мало и фруктов мало, то класс 1;
Если рыбы средне и фруктов средне, то класс 2;
Если рыбы много и фруктов много, то класс 3.
Соберем все правила вместе:
Если фруктов мало и картофеля мало и хлеба много и рыбы мало, то класс 1;
Если фруктов средне и картофеля средне и хлеба средне и рыбы средне, то класс 2;
Если фруктов много и картофеля много и хлеба мало и рыбы много, то класс 3.
Объединим объекты:
2, 8, 10, 11, 12, 13, 14, 16, 21, 22, 23, 24, 25, 26, 35;
1, 3-7, 9, 17-20, 27, 28, 30-34, 36, 37;
15, 29.
Кластерный анализ.
Кластерный анализ поделил объекты на 3 класса. К первому классу относятся 19 объектов, ко второму 7 объектов и к третьему 11 объектов.
Рис. 37. Значение признаков для каждого класса
Значимыми признаками являются «Картофель», «Рыба», «Фрукты» и «Хлеб» (рис. 37).
Правила для классов:
Если картофеля много и рыбы много и фруктов средне и хлеба средне, то класс 1;
Если картофеля мало и рыбы средне и фруктов много и хлеба мало, то класс 2;
Если картофеля средне и рыбы мало и фруктов мало и хлеба много, то класс 3.
Объекты:
1, 3-9, 11, 17-21, 27, 28, 30, 32, 34;
2, 10, 12, 13, 23, 24, 31;
14, 15, 16, 22, 25, 26, 29, 33, 35, 36, 37.
С виду правила, полученные в кластерном анализе, и правила, полученные в компонентном анализе, отличны, но если присмотреться, то можно выделить общие черты. Разделение объектов по классам также кажется отличным, но можно заметить, что второй кластер в кластерном анализе, очень похож на первый класс в компонентном анализе. Третий кластер кластерного анализа похож на первый кластер компонентного анализа. Если поменять правила местами, то можно отметить их схожесть.
Дендрограмма (рис. 38) также подтверждает, что объекты разных классов схожи.
Рис. 38. Дендрограмма для кластерного анализа
Таким образом, можно выделить следующие классы и правила для них:
Правила:
Если картофеля мало и рыбы средне и фруктов много и хлеба мало, то класс 1;
Если картофеля много и рыбы много и фруктов средне и хлеба средне, то класс 2;
Если картофеля средне и рыбы мало и фруктов мало и хлеба много, то класс 3.
Объекты:
2, 10, 12, 13, 23, 24;
1, 3-7, 9, 17-20, 27, 28, 30, 32, 34;
15, 29.
Остальные объекты слабо поддаются классификации.
Построение дерева решений.
Дерево решений (рис. 39) получилось следующим:
Рис. 39. Дерево решений
Оно показывает, что признаки «Рыба» и «Хлеб» являются значимыми.
Нейросетевой анализ данных на основе обучения с учителем.
Нейросеть для данной выборки имеет следующий вид (рис. 40):
Рис. 40. Нейросеть [4x3x1]
При построении нейронной сети возникла ошибка классификации, но она мала по отношению к выборке (рис. 41).
Рис. 41. Таблица сопряженности
Нейросетевой анализ данных на основе самоорганизующихся карт Кохонена.
Карты Кохонена (рис. 42) подтвердили значимость признаков «Хлеб» и «Рыба», которые были выделены деревом решений.
Рис. 42. Карты Кохонена
На картах (рис. 42) можно заметить, что признаки «Фрукты» и «Картофель» менее значимые, чем признаки «Рыба» и «Хлеб».
Анализ с помощью гибридной (нейро-нечеткой) сети.
Таким образом, второй класс был разбит ещё на 3 класса. В результате новое разделение на классы выглядит следующим образом:
Таблица 3. Распределение регионов по классам
Класс 1 |
Класс 2 |
Класс 3 |
Класс 4 |
Класс 5 |
г. Москва Архангельская область Мурманская область Республика Калмыкия Камчатский край Приморский край Магаданская область Сахалинская область Чукотский АО |
Владимирская область Новгородская область Ростовская область Кабардино-Балкарская Республика Оренбургская область Пензенская область
|
Орловская область Рязанская область Смоленская область Вологодская область Тверская область Республика Мордовия Республика Татарстан Удмуртская республика Пермский край Ульяновская область Курганская область Забайкальский край Алтайский край |
Челябинская область Республика Башкортостан |
Московская область Краснодарский край Ставропольский край |
Выборка, необходимая для построения нейро-нечеткой сети, находится в файле Нейро-нечеткая сеть.dat.
Загружаем данные в редактор Anfis (рис. 43).
Рис. 43. Загрузка данных в редактор Anfis
Для обучения сети устанавливаем количество эпох равным 60.
Обучение считается законченным в том случае, когда ошибка не меняется и очень мала. В данном случае (рис. 44) значение ошибки равно 0,0012. Нас така я ошибка устраивает.
Рис. 44. Результат обучения нейро-нечеткой сети
Нейросеть для нашей выборки получилась следующая (рис. 45):
Рис. 45. Нейросеть нейро-нечеткой сети
Она имеет 4 входных нейрона, 12 нейронов на первом скрытом слое, 81 нейрон на втором скрытом слое и 1 нейрон на выходном слое.
Нейро-нечеткая сеть вывела 81 правило (рис. 46).
Рис. 46. Правила нейро-нечеткой сети
Введем следующие данные:
Текущий класс – 1;
Желаемый класс – 5;
Текущая сумма потребления – 625,4;
Желаемая сумма потребления – 1003.
Нейро-нечеткая сеть приняла решение увеличить потребление на 265 единиц (рис. 47).
Рис. 47. Принятие решения нейро-нечеткой сетью
Установим другую функцию дефаззификации (рис. 48).
Рис. 48. Установка другой функции дефаззификации
Введем те же данные, которые вводили для предыдущего примера. Нейро-нечеткая сеть приняла решение о необходимости увеличить сумму потребления продуктов питания на 266 единиц (рис. 49).
Рис. 49. Принятие решения нейро-нечеткой сетью
Поверхности имеют следующий вид:
Рис. 50. Поверхность при входных данных желаемый класс и текущий класс
Рис. 51. Поверхность при входных данных желаемая сумма и текущая сумма
Вывод: разные функции дефаззификации принимают примерно одинаковые решения, поэтому можно выбрать любую.
Вывод.
Анализ регионов Российской федерации по потреблению основных продуктов питания на 2012 год показал, что основную часть регионов можно классифицировать, но около 40% находится в переходном состоянии, то есть их тяжело отнести к какому-то одному классу. Первоначальный анализ показал, что регионы России делятся на «рыбные» регионы, «мясные» регионы и «сельскохозяйственные» регионы. Дальнейший анализ показал, что основными продуктами питания являются рыба, яйца и картофель.
Регионы России различаются от самых бедных районов до богатых. Отдельно от всех регионов отстоит Чукотский АО, который имеет наименьшее количество потребляемых продуктов питания на душу населения.