- •Лабораторная работа № 3 Свойства нормального распределения. Кластерный анализ
- •1. Теоретическая часть
- •1.1 Свойства нормального распределения
- •1.2 Кластерный анализ
- •Метод кластеризации: соединение (древовидные алгоритмы)
- •Метод к-средних
- •Двухвходовое объединение
- •2. Практическая часть
- •3. Контрольные вопросы
Двухвходовое объединение
Кластеризация проводится одновременно как по переменным (столбцам), так и по результатам наблюдений (строкам). Для примера рассмотрим десять экономических показателей (производительность труда, индекс снижения себестоимости, рентабельность и т. д.) для каждого из 50 предприятий. Нас могут интересовать однородные по этим показателям группы предприятий (кластеризация производится по предприятиям (строкам», а также однородные группы экономических показателей (кластеризация проводится по переменным – столбцам). Процедура двухвходового объединения используется в тех случаях, когда можно ожидать, что одновременная кластеризация по переменным (столбцам) и наблюдениям (строкам) дает возможность получить осмысленные кластеры. Результаты процедуры: описательные статистики по переменным и наблюдениям, а также двумерная цветная диаграмма, на которой цветом отмечаются значения данных. По распределению цвета можно составить представление об однородных группах.
2. Практическая часть
По выборке из своего варианта, используя данные таблицы 2.1, выполнить следующие расчеты и задания:
вычислить верхнюю и нижнюю границы, среднее и дисперсию;
на уровне значимости α = 0,1 проверить гипотезу о нормальном распределении генеральной совокупности по критерию χ;
посторойте график.
Ввести данные в пакет STATISTICA, выполнить расчеты, сравнить результаты и оформить 1-ю часть лабораторной работы.
Провести кластеризацию объектов методами одиночной и полной связи используя данные таблицы 2.2.
Ввести данные в пакет STATISTICA, выполнить расчеты, сравнить результаты и оформить 2-ю часть лабораторной работы.
Провести кластеризацию объектов методом К-средней используя данные таблицы 2.3.
Ввести данные в пакет STATISTICA, выполнить расчеты, сравнить результаты и оформить 3-ю часть лабораторной работы.
Распечатайте полученные данные, графики и оформите титульный лист лабораторной работы.
3. Контрольные вопросы
Охарактеризуйте понятия «нормальное распределение».
Что такое критерий χ2?
При каком уровне значимости принимается гипотеза о нормальном распределении?
Назовите основные методы кластеризации.
Поясните суть методов древовидных алгоритмов.
Какой вид имеют результаты кластеризации методом соединения (древовидными алгоритмами)?
Охарактеризуйте метод К-средних.
Как выбрать тип графика?
Для чего используется диаграмма рассеяния для исходных данных при использовании метода К-средних?
Перечислите результаты кластеризации, полученные при использовании метода К-средних.
Поясните суть метода двухвходового метода кластеризации.
Таблица 2.1
Выборка для задания по проверке гипотезы о нормальном распределении
№ варианта
№ п/п |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
67 |
55 |
41 |
36 |
75 |
56 |
25 |
19 |
90 |
73 |
2 |
78 |
67 |
90 |
100 |
88 |
95 |
92 |
99 |
66 |
35 |
3 |
49 |
39 |
89 |
54 |
59 |
57 |
95 |
16 |
75 |
44 |
4 |
84 |
53 |
30 |
72 |
16 |
81 |
98 |
98 |
67 |
14 |
5 |
97 |
84 |
64 |
20 |
71 |
62 |
46 |
69 |
13 |
84 |
6 |
92 |
56 |
97 |
61 |
78 |
94 |
30 |
100 |
95 |
23 |
7 |
42 |
15 |
100 |
30 |
96 |
94 |
65 |
29 |
19 |
39 |
8 |
40 |
75 |
22 |
22 |
46 |
29 |
66 |
59 |
65 |
40 |
9 |
59 |
13 |
41 |
73 |
81 |
98 |
66 |
95 |
35 |
98 |
10 |
47 |
81 |
100 |
43 |
98 |
21 |
76 |
74 |
16 |
98 |
11 |
85 |
58 |
44 |
29 |
92 |
48 |
59 |
57 |
69 |
63 |
12 |
35 |
78 |
29 |
69 |
40 |
74 |
39 |
75 |
76 |
66 |
13 |
84 |
33 |
13 |
99 |
86 |
46 |
91 |
42 |
65 |
20 |
14 |
87 |
33 |
42 |
73 |
71 |
66 |
27 |
91 |
24 |
53 |
15 |
70 |
42 |
17 |
66 |
68 |
54 |
75 |
47 |
13 |
55 |
16 |
80 |
85 |
35 |
78 |
91 |
74 |
72 |
59 |
87 |
88 |
17 |
77 |
24 |
84 |
74 |
44 |
76 |
48 |
31 |
50 |
14 |
18 |
96 |
14 |
20 |
40 |
45 |
18 |
44 |
13 |
93 |
77 |
19 |
93 |
26 |
81 |
30 |
90 |
88 |
45 |
23 |
24 |
17 |
20 |
98 |
26 |
66 |
90 |
82 |
34 |
31 |
86 |
81 |
99 |
21 |
85 |
67 |
22 |
26 |
98 |
82 |
62 |
33 |
54 |
18 |
22 |
18 |
79 |
83 |
42 |
95 |
19 |
28 |
14 |
31 |
99 |
23 |
82 |
78 |
86 |
83 |
33 |
77 |
50 |
27 |
98 |
72 |
24 |
25 |
15 |
18 |
64 |
48 |
79 |
42 |
12 |
95 |
69 |
25 |
81 |
15 |
80 |
34 |
62 |
13 |
71 |
11 |
13 |
40 |
26 |
71 |
55 |
46 |
73 |
89 |
24 |
30 |
93 |
82 |
53 |
27 |
14 |
30 |
64 |
21 |
82 |
79 |
76 |
14 |
80 |
28 |
28 |
37 |
82 |
100 |
36 |
76 |
40 |
11 |
13 |
47 |
93 |
29 |
38 |
35 |
90 |
77 |
72 |
54 |
88 |
72 |
68 |
16 |
30 |
96 |
83 |
98 |
100 |
73 |
81 |
89 |
76 |
36 |
92 |
31 |
55 |
13 |
84 |
87 |
32 |
36 |
43 |
55 |
66 |
72 |
32 |
31 |
67 |
28 |
52 |
93 |
66 |
20 |
81 |
86 |
20 |
33 |
81 |
56 |
83 |
32 |
85 |
89 |
18 |
97 |
85 |
49 |
34 |
85 |
100 |
34 |
57 |
48 |
75 |
75 |
12 |
60 |
22 |
35 |
83 |
93 |
77 |
63 |
66 |
59 |
91 |
90 |
90 |
16 |
36 |
53 |
42 |
59 |
55 |
86 |
29 |
28 |
20 |
78 |
31 |
37 |
90 |
89 |
49 |
27 |
63 |
48 |
48 |
88 |
94 |
90 |
38 |
34 |
56 |
47 |
86 |
46 |
84 |
19 |
62 |
19 |
64 |
39 |
97 |
67 |
94 |
54 |
83 |
89 |
96 |
34 |
45 |
43 |
40 |
55 |
17 |
72 |
92 |
41 |
11 |
68 |
15 |
51 |
55 |
41 |
97 |
80 |
44 |
11 |
56 |
18 |
98 |
43 |
67 |
39 |
42 |
23 |
94 |
20 |
37 |
74 |
49 |
73 |
63 |
63 |
48 |
43 |
89 |
98 |
57 |
49 |
85 |
75 |
73 |
21 |
32 |
48 |
44 |
39 |
21 |
64 |
29 |
65 |
26 |
33 |
84 |
12 |
94 |
45 |
76 |
70 |
36 |
64 |
87 |
91 |
14 |
87 |
88 |
62 |
46 |
51 |
13 |
42 |
11 |
15 |
82 |
53 |
48 |
73 |
26 |
47 |
15 |
11 |
22 |
52 |
13 |
86 |
56 |
39 |
32 |
32 |
48 |
73 |
20 |
90 |
23 |
24 |
58 |
46 |
48 |
48 |
18 |
49 |
23 |
16 |
15 |
48 |
64 |
77 |
17 |
13 |
28 |
13 |
50 |
20 |
41 |
18 |
17 |
23 |
36 |
100 |
91 |
78 |
18 |
51 |
57 |
30 |
43 |
87 |
39 |
39 |
69 |
87 |
22 |
15 |
52 |
16 |
72 |
17 |
59 |
93 |
82 |
56 |
60 |
86 |
22 |
53 |
86 |
72 |
49 |
83 |
73 |
13 |
80 |
91 |
12 |
71 |
54 |
61 |
18 |
31 |
11 |
70 |
93 |
100 |
56 |
43 |
96 |
55 |
46 |
54 |
12 |
81 |
64 |
36 |
89 |
33 |
90 |
29 |
Таблица 2.2
Выборка для кластеризации объектов методами одиночной и полной связи
Вариант
№ п/п |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
||||||||||
|
x0 |
y0 |
x1 |
y1 |
x2 |
y2 |
x3 |
y3 |
x4 |
y4 |
x5 |
y5 |
x6 |
y6 |
x7 |
y7 |
x8 |
y8 |
x9 |
y9 |
1 |
5 |
-7 |
2 |
10 |
-3 |
2 |
2 |
1 |
0 |
-6 |
-7 |
5 |
-2 |
-4 |
0 |
-2 |
-9 |
-7 |
5 |
7 |
2 |
0 |
-3 |
10 |
-9 |
-5 |
4 |
-2 |
-2 |
-3 |
-3 |
10 |
1 |
1 |
-10 |
8 |
-8 |
1 |
-10 |
-4 |
-1 |
3 |
8 |
2 |
4 |
-3 |
8 |
-1 |
3 |
-2 |
-4 |
7 |
-4 |
7 |
-2 |
6 |
-7 |
8 |
-10 |
-2 |
-6 |
0 |
4 |
5 |
0 |
-7 |
10 |
-1 |
-4 |
5 |
0 |
-9 |
4 |
-8 |
-10 |
-9 |
5 |
-10 |
3 |
-6 |
-2 |
-4 |
8 |
5 |
-7 |
3 |
2 |
0 |
-10 |
5 |
-7 |
1 |
7 |
8 |
10 |
4 |
7 |
3 |
10 |
-4 |
-2 |
9 |
5 |
-10 |
Таблица 2.3
Выборка для кластеризации объектов методом К-средней
Порядковый номер
№ варианта |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
0 ВАРИАНТ |
||||||||||
x |
6,0 |
8,0 |
9,0 |
5,0 |
9,0 |
8,0 |
8,0 |
6,0 |
3,0 |
4,0 |
y |
2,0 |
2,0 |
8,0 |
9,0 |
7,0 |
4,0 |
7,0 |
5,0 |
2,0 |
9,0 |
z |
5,0 |
2,0 |
5,0 |
3,0 |
4,0 |
2,0 |
9,0 |
3,0 |
2,0 |
4,0 |
1 ВАРИАНТ |
||||||||||
x |
8,0 |
8,0 |
8,0 |
8,0 |
6,0 |
6,0 |
4,0 |
9,0 |
3,0 |
3,0 |
y |
4,0 |
2,0 |
4,0 |
9,0 |
6,0 |
4,0 |
7,0 |
2,0 |
8,0 |
6,0 |
z |
7,0 |
2,0 |
2,0 |
6,0 |
7,0 |
7,0 |
4,0 |
2,0 |
3,0 |
5,0 |
2 ВАРИАНТ |
||||||||||
x |
8,0 |
7,0 |
3,0 |
7,0 |
7,0 |
2,0 |
8,0 |
7,0 |
3,0 |
8,0 |
y |
5,0 |
6,0 |
3,0 |
4,0 |
2,0 |
8,0 |
9,0 |
6,0 |
7,0 |
5,0 |
z |
6,0 |
2,0 |
3,0 |
7,0 |
7,0 |
7,0 |
9,0 |
4,0 |
9,0 |
7,0 |
3 ВАРИАНТ |
||||||||||
x |
6,0 |
4,0 |
9,0 |
8,0 |
8,0 |
8,0 |
3,0 |
8,0 |
3,0 |
5,0 |
y |
3,0 |
7,0 |
7,0 |
9,0 |
9,0 |
9,0 |
7,0 |
4,0 |
9,0 |
6,0 |
z |
9,0 |
4,0 |
8,0 |
7,0 |
6,0 |
2,0 |
9,0 |
2,0 |
3,0 |
6,0 |
4 ВАРИАНТ |
||||||||||
x |
5,0 |
2,0 |
7,0 |
3,0 |
3,0 |
4,0 |
2,0 |
8,0 |
2,0 |
9,0 |
y |
9,0 |
3,0 |
8,0 |
3,0 |
6,0 |
2,0 |
6,0 |
2,0 |
4,0 |
8,0 |
z |
7,0 |
5,0 |
5,0 |
8,0 |
8,0 |
3,0 |
9,0 |
9,0 |
7,0 |
7,0 |
5 ВАРИАНТ |
||||||||||
x |
2,0 |
2,0 |
3,0 |
8,0 |
7,0 |
2,0 |
8,0 |
2,0 |
4,0 |
2,0 |
y |
6,0 |
6,0 |
3,0 |
3,0 |
5,0 |
7,0 |
3,0 |
2,0 |
4,0 |
5,0 |
z |
5,0 |
9,0 |
8,0 |
4,0 |
4,0 |
5,0 |
5,0 |
6,0 |
2,0 |
7,0 |
6 ВАРИАНТ |
||||||||||
x |
4,0 |
8,0 |
5,0 |
3,0 |
7,0 |
8,0 |
6,0 |
3,0 |
4,0 |
9,0 |
y |
7,0 |
3,0 |
4,0 |
4,0 |
6,0 |
9,0 |
9,0 |
4,0 |
9,0 |
4,0 |
z |
3,0 |
9,0 |
8,0 |
4,0 |
3,0 |
4,0 |
7,0 |
6,0 |
8,0 |
4,0 |
7 ВАРИАНТ |
||||||||||
x |
9,0 |
5,0 |
7,0 |
5,0 |
2,0 |
4,0 |
3,0 |
4,0 |
9,0 |
2,0 |
y |
9,0 |
9,0 |
4,0 |
8,0 |
4,0 |
2,0 |
7,0 |
9,0 |
3,0 |
4,0 |
z |
9,0 |
9,0 |
3,0 |
7,0 |
6,0 |
4,0 |
7,0 |
8,0 |
7,0 |
7,0 |
8 ВАРИАНТ |
||||||||||
x |
2,0 |
2,0 |
2,0 |
5,0 |
4,0 |
4,0 |
7,0 |
9,0 |
8,0 |
4,0 |
y |
8,0 |
9,0 |
8,0 |
3,0 |
6,0 |
8,0 |
4,0 |
7,0 |
5,0 |
5,0 |
z |
4,0 |
7,0 |
7,0 |
4,0 |
6,0 |
9,0 |
6,0 |
4,0 |
3,0 |
5,0 |
9 ВАРИАНТ |
||||||||||
x |
6,0 |
7,0 |
4,0 |
4,0 |
8,0 |
5,0 |
7,0 |
8,0 |
2,0 |
6,0 |
y |
6,0 |
7,0 |
2,0 |
5,0 |
4,0 |
2,0 |
3,0 |
5,0 |
3,0 |
7,0 |
z |
2,0 |
7,0 |
2,0 |
8,0 |
5,0 |
6,0 |
8,0 |
8,0 |
8,0 |
7,0 |