Скачиваний:
38
Добавлен:
02.05.2014
Размер:
219.14 Кб
Скачать

11

Уфимский государственный авиационный технический университет

Кафедра технической кибернетики

Отчет по лабораторной работе №2

по курсу «Системы искусственного интеллекта»

на тему «Изучение интеллектуальных методов анализа данных. Компонентный анализ. Кластерный анализ»

Выполнили: cтуденты гр.ИСТ-302

Иванов В.

Касьянова А.

Проверила: Колоденкова А. Е.

Уфа 2005г

Лабораторная работа №2

«Изучение интеллектуальных методов анализа данных

Компонентный анализ. Кластерный анализ»

Цель работы: изучение особенностей применения компонентного и кластерного

анализа с целью изучения структуры данных

Исходные данные:

Выборка по предприятиям представлена в таблице 1.

Таблица

15 14,32 0,06 0,66 5736 1,3 22,97

16 7,37 0,15 0,86 26705 7,19 16,38

17 7,02 0,08 0,79 20068 4,82 13,21

18 8,25 0,2 0,34 11487 5,46 14,48

19 8,15 0,2 1,6 32029 6,2 13,38

2 9,38 0,26 1,04 50391 7,8 18,39

20 8,72 0,3 1,46 18946 4,25 13,69

21 6,64 0,24 1,27 28025 5,38 16,66

22 8,1 0,1 1,58 20968 5,88 15,06

23 5,52 0,11 0,68 11049 9,27 20,09

24 9,37 0,47 0,86 45893 4,36 15,98

25 13,17 0,53 1,98 99400 10,31 18,27

26 6,67 0,34 0,33 20719 4,69 14,42

27 5,68 0,2 0,45 36813 4,16 22,76

28 5,22 0,24 0,74 33956 3,13 15,41

29 10,02 0,54 0,03 17016 4,02 19,35

3 12,11 0,4 1,8 43149 9,76 26,46

30 8,16 0,4 0,99 34873 5,23 16,83

31 3,78 0,2 0,24 11237 2,74 30,53

32 6,48 0,64 17306 3,1 17,98

33 10,44 0,42 1,22 39250 10,44 22,09

34 7,65 0,27 0,68 19074 5,65 18,29

35 8,77 0,37 1 18452 6,67 26,05

36 7 0,38 0,81 17500 5,91 26,2

37 11,06 0,35 1,27 7888 11,99 17,26

38 9,02 0,42 1,5 58947 8,3 18,83

39 13,28 0,32 1,89 94697 1,63 19,7

4 10,81 0,5 0,43 41089 7,9 22,37

40 9,27 0,33 0,67 29626 8,94 16,87

41 6,7 0,29 0,96 11688 1,7 14,63

42 6,69 0,3 0,67 21955 4,8 22,17

43 9,42 0,56 0,98 12243 5,01 22,62

44 7,24 0,42 1,16 20193 4,12 26,44

45 5,39 0,26 0,54 20122 5,1 22,26

46 5,61 0,16 1,23 7612 3,49 19,13

47 5,59 0,45 0,78 27404 4,19 18,28

48 6,57 1,16 39648 5,01 28,23

49 6,54 0,08 4,44 43799 11,44 12,39

5 9,35 0,4 0,88 14257 5,35 28,13

50 4,23 0,68 1,06 6235 7,67 11,64

51 5,22 0,03 2,13 11524 4,66 8,62

52 18 0,02 1,21 17309 4,3 20,1

53 11,03 0,22 2,2 22225 6,62 19,41

6 9,87 0,19 0,57 22661 9,9 17,55

7 8,17 0,25 1,72 52509 4,5 21,92

8 9,12 0,44 1,7 14903 4,88 19,52

9 5,88 0,17 0,84 25587 3,46 23,99

Задание:

  1. Выполнить исследование методом главных компонент для выданного варианта задания (Вар_задан_Дубров.xls).

  2. Выполнить кластерный анализ для выданного варианта задания. Сделать выводы по структуре данных.

  3. Сравнить полученные результаты компонентного и кластерного анализов по двум признакам:

  • по составу объектов в выделенных группах

  • по сформированным правилам.

Ход выполнения работы.

1. Компонентный анализ.

Для выборки по предприятиям (представленной в исходных данных) проведено построение трех главных компонент и выполнен компонентный анализ.

а-б) На рисунке 1 представлено окно с результатами компонентного анализа, где в левой половине дается сводная характеристика для всех компонент с указанием собственных значений, а в правой – график для собственных значений главных компонент.

в) Записаны главные компоненты с характеристикой весов признаков:

F1=0,537277*Fondootdacha + 0,536336*Proizv + 0,367298*Smen – 0,499293*VesPoter+

+ 0,198684*VesRab

F2=0,121262*Fondootdacha – 0,21045*Proizv – 0,467522*Smen – 0,10381*VesPoter+

+ 0,843595*VesRab

F3= – 0,321624*Fondootdacha – 0,0608761*Proizv + 0, 743098*Smen +

+0,32743*VesPoter + 0,483164*VesRab

г) Выбор значащих компонент и определение названия для них представлено ниже.

1) Выберем p=3 главных компонент.

2) Определим названия для них по формуле: ,

где [w2 – w3] – подмножество участвующих в названии весовых коэффициентов;

[w] – все весовые коэффициенты.

=> т.к. k1 не принадлежит интервалу [0,75; 0,95], в подмножество [w2 – w3] включаем еще один весовой коэффициент = -0,499293 => k1=0,826, а значит, первая главная компонента определяется следующими коэффициентами: фондоотдачи, производительности труда и удельного веса потерь от брака.

k2=0,93 => вторая главная компонента определяется коэффициентами сменности оборудования и удельным весом рабочих.

k3=0,786 => третья главная компонента также определяется коэффициентами сменности оборудования и удельным весом рабочих.

д) Анализ структуры данных (на примере трехмерной диаграммы рассеивания - 3D Scatterplot). На рисунке 2 представлена трехмерная диаграмма рассеивания. На представленном рисунке видно, что все объекты разделились на три группы, что позволяет заключить следующее:

1) Первая группа объектов характеризуется высокой производительностью и высокой фондоотдачей;

2) Вторая группа объектов характеризуется средней производительностью и средней фондоотдачей;

3) Третья группа объектов характеризуется низкой производительностью и низкой фондоотдачей;

Рисунок 1 – Результаты компонентного анализа

Рисунок 2 – Трехмерная диаграмма рассеивания

Рисунок 3 - Результаты кластерного анализа

2. Кластерный анализ.

Для выборки по предприятиям (представленной в исходных данных) проведен кластерный анализ и построена дендрограмма. Результаты кластерного анализа представлены на рисунке 3.

а) На рисунке 3б представлена дендрограмма для трех кластеров. Первый кластер включает в себя номера предприятий: 1, 13, 4, 6, 3, 5, 15, 2. Второй кластер включает в себя номера предприятий: 7, 9, 8, 11, 16, 10, 14. И третий кластер включает в себя номера предприятий: 12, 20, 19, 17, 18.

б-в) Сводка кластерного анализа с населенностью кластеров и координаты центроидов представлены на рисунке 3а.

г) Анализ кластеров (на примере двухмерной и трехмерной диаграмм рассеивания – 2D и 3D Scatterplot).

На рисунке 3в,г представлены двухмерная и трехмерная диаграммы рассеивания соответственно. Из диаграмм следует, что первый кластер характеризуется высокой производительностью и низким весом потерь. В кластере 2 наблюдается низкая производительность и низкий вес потерь. А кластер 3 характеризуется низкой производительностью и высоким весом потерь.

3. Сравнительная характеристика результатов компонентного и кластерного анализов.

Принадлежности объектов к кластерам №1,№2,№3 по результатам компонентного и кластерного анализов приведены в таблице 2.

Таблица 2

№ объекта

Анализ

Кластерный

Компонентный

1

1

1

2

1

1

3

1

1

4

1

1

5

1

1

6

1

1

7

2

2

8

2

2

9

2

2

10

2

2

11

2

2

12

3

3

13

1

1

14

2

2

15

1

1

16

2

2

17

3

3

18

3

3

19

3

3

20

3

3

Вывод: в ходе лабораторной работы были проведены компонентный и кластерный анализ. Результаты разбиения по компонентному анализу и на основании кластерного анализа полностью совпали (по номерам объектов). Характеристики выделенных кластеров сходны.

Соседние файлы в папке Методичка по лабораторной работе №2