Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lab_4_Інтелектуальний аналіз даних.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.32 Mб
Скачать

3. Порядок виконання роботи

  1. Ознайомитися з теоретичною частиною.

  2. Виконати реалізацію алгоритму ієрархічної кластеризації на основі свого індивідуального завдання.

  3. Оформити звіт по результатах виконаної роботи.

Варіанти індивідуальних завдань

Частина №1

Створити ієрархічну кластеризацію відстаней в кілометрах між деякими містами України. Із заданих міст створити матрицю для подальшої кластеризації об’єктів. Застосувати метод «ближнього сусіда». Також побудувати кластерне дерево відстані для заданих міст. На карті зобразити послідовності сполучення кластерів (міст).

  1. міста: Львів, Луцьк, Київ, Вінниця, Чернівці, Одеса.

  2. міста: Хмельницький, Тернопіль, Миколаїв, Одеса, Ковель,Житомир.

  3. міста: Харків, Полтава, Чернігів, Рівне, Луцьк, Броди.

  4. міста: Керч, Севастополь, Житомир, Кривий Ріг, Київ, Алушта.

  5. міста:Харків, Донецьк, Луганськ, Ялта, Броди, Рівне.

  6. міста: Лубни, Миргород, Полтава, Вінниця, Чернівці, Житомир.

  7. міста: Мукачево, Полтава, Тернопіль, Львів, Миколаїв, Чернівці.

  8. міста: Моршин, Стрий, Самбір, Трускавець, Червоноград, Ковель.

  9. міста: Херсон, Ялта, Дрогобич, Коломия, Львів, Полтава.

  10. міста: Хмельницький, Ялта, Тернопіль, Львів, Самбір, Трускавець.

  11. міста: Чернігів, Рівне, Дрогобич, Коломия, Полтава, Чернівці.

  12. міста: Харків, Полтава, Самбір, Трускавець, Кривий Ріг, Київ

  13. міста: Івано-Франківськ, Нововолинськ, Шацьк, Кам’янець Подільський, Умань, Дніпродзержинськ.

  14. міста: Кременчук, Нікополь, Миколаїв, Кіровоград, Євпаторія, Севастополь

  15. міста: Суми, Радивилів, Дубно, Броди, Біла Церква, Херсон.

Частина №2

Завдання полягає в тому, щоб перевірити коректність шуканої конфігурації об'єктів методом Joining (tree clustering) (ієрархічні агломеративні методи або деревоподібна кластеризація), проаналізуйте Vertical icicle plot, Amalgamation schedule, Graph of amalgamation schedule, матрицю відстаней. Використайте різні правила об'єднання кластерів (Amalgation (joing) rule) та метрику відстані (Distansemetric).

Завдання 16

У таблиці містяться дані про споживання продуктів на душу населення і показники - аргументи, які беруть участь у кластеризації.

Країни:

X1

X2

X3

X4

X5

X6

Росія

55

3,9

30

5

28

124

Австралія

100

2,6

47

8,2

121

87

Австрія

93

5,3

37

12

146

74

Азербайдж.

20

4,1

12,4

7,9

52

141

Вірменія

20

3,7

4,3

6,5

72

134

Білорусь

72

3,6

28

5,4

38

120

Бельгія

85

6,9

48

11

83

72

Болгарія

65

3

18

9,5

92

156

Великобританія

67

3,5

39

8,8

91

91

Завдання 17

У таблиці містяться дані про економічні показники країн.

Країни:

X5

X11

X6

X7

X10

Угорщина

32,1

64,73

24,5

6

39,8

Німеччина

38,1

36,63

76,2

8,6

56,9

Греція

41,5

32,84

44,4

5,7

37,4

Грузія

55

62,64

11,3

3,5

18,6

Данія

36,7

34,07

79,2

6,7

54,4

Ірландія

15,8

39,27

57

6,7

64,2

Іспанія

40,9

28,46

54,8

7,3

22,6

Італія

49,4

30,27

72,1

8,5

46

Казахстан

38,1

69,04

13,4

3,3

7,9

Канада

27,6

25,42

79,9

10,2

25,4

Киргизія

33,2

53,13

11,2

3,4

17

Завдання 18

У таблиці містяться дані про хімічні речовини(стовпці) та їхні складові сполуки(рядки).

Сполуки:

SiO2

TiO2

Al2O3

FeO

MgO

CaO

a1

43.5

0.58

12.5

11.2

12.7

9.9

a2

53.6

1.2

13.2

10.5

12.4

8.5

a3

48.9

1.5

15.4

13.4

13.1

9.1

b1

41.7

2.1

16.2

10.5

14

8.6

b5

50.1

0.9

11.5

10.6

12.1

7.9

c6

40.2

1.5

14.2

10.4

11.9

8.1

d5

46.5

2.1

11.6

11.8

11.8

9.5

a7

51.6

1.8

10.3

12.5

12.4

8.9

Завдання 19

У таблиці містяться дані про рівень життя в українських містах.

Міста:

X1

X2

X3

X4

X5

X6

X7

Львів

12

32

1

22

10

2

66

Луцьк

21

11

32

66

4

45

39

Донецьк

1

10

24

56

5

56

56

Київ

51

25

33

56

11

5

56

Житомир

1

280

22

54

24

22

25

Сімферополь

22

12

32

39

4

10

36

Кривий Ріг

1

12

11

19

9

20

30

Завдання 20

У таблиці містяться дані про міста Франції.

Міста:

X1

X2

X3

X4

X5

X6

X7

Париж

9,5

15,6

123,1

11,2

32,9

565,4

7,4

Марсель

8,9

9,5

122,1

25,5

23,2

456,6

6,9

Ліон

7,1

9,9

112,6

14,9

11,6

543,2

6,4

Лілль

6,6

9,1

100,9

12,5

22,1

445,5

5,9

Ніцца

7,6

8,6

109,1

14,5

25,2

347,9

6,9

Тулуза

6,9

10,5

121,6

21,5

18,9

483,6

5,4

Бордо

5,1

11,9

119,1

17,1

25,5

451,2

5,9

Нант

4,5

5,6

100,6

15,9

16,2

489,5

1,4

Тулон

2,5

7,5

99,1

18,5

15,5

410,9

2,9

Завдання 21

У таблиці містяться дані про університети Європи.

Університет Х-ка

X1

X2

X3

X4

X5

X6

Гарвардський університет

27000

1636

27500

1

22

567

Кембриджський університет

21500

1209

18500

1

12

767

Оксфордський університет

22500

1117

15400

1

2

654

Массачусетський технологічний інститут

11500

1861

30400

0

23

999

Йельський університет

19000

1701

29500

0

1

53

Стенфордський університет

2000

1891

25602

0

1

31

Каліфорнійський технологічний інститут

31000

1891

16200

0

12

12

Каліфорнійський університет

31500

1868

20700

1

2

32

Імперський коледж Лондона

12000

1868

21000

1

2

12

Принстонський університет

7000

1746

29910

1

3

21

Завдання 22

У таблиці містяться дані про студентів.

Студент:

X1

X2

X3

X4

X5

X6

X7

X8

Іванов

5

5

5

5

5

5

5

5

Петров

4

5

4

3

4

5

5

5

Штельмах

4

5

4

3

4

5

4

4

Сидоров

4

4

4

4

3

4

4

4

Федоров

3

3

3

3

4

3

3

3

Максимов

3

4

4

3

4

4

4

2

Вовков

5

5

5

5

4

3

3

4

Завдання 23

У таблиці містяться дані про футбольні клуби.

Клуб:

X1

X2

X3

X4

X5

X6

X7

X8

X9

Челсі

11,3

12,8

22,6

22,4

56,2

56,1

55,1

147,3

444,2

Реал

12,8

14,2

25,32

22,3

25,21

25,31

54,11

454,2

541,2

Барселона

11,4

10,3

22,21

22,6

11,2

63,2

25,2

555,2

200,3

Манчестер Сіті

0,3

11,8

23,1

12,8

23

52

32,2

420,3

302

Манчестер Юнайтед

2,8

13,8

52

23,2

25,3

12,9

51

320,2

120,2

ПСЖ

11,5

11,1

41,2

22,5

62,6

42,6

41,2

329,2

256,2

Мілан

9,7

14,3

11,8

12,2

55,6

56,3

52

245,2

230

Інтер

2,8

13,7

23,1

22,2

22,6

23

68,82

200,5

145,4

Завдання 24

У таблиці містяться дані про ґрунти.

Х-ка Проба ґрунту

X1

X2

X3

X4

X5

X5

X6

1

15.21

70.6

467.1

1400

0.12

0.63

4.53

2

33.27

67.5

1059.8

460

0.15

1.19

4.9

3

68.09

1700.3

3309.7

1200

0.36

2.3

4.82

4

32.89

168.1

1392.9

2100

0.17

1.29

4.84

5

19.87

102.7

71.3

920

0.14

0.73

7.93

6

16.46

32.5

367

1100

0.06

0.52

3.78

7

10.56

192.9

352.4

1000

0.1

0.33

4.59

8

15.63

118.4

300.2

1900

0.11

0.61

4.16

9

11.15

101.4

308.4

1300

0.11

0.47

5.13

10

16.25

232.5

306.2

1600

0.12

0.66

4.43

11

9.94

51.4

212.3

1800

0.1

0.37

4.7

12

70.63

150.3

627.7

590

0.15

1.81

3.65

13

9

9.8

129.7

95

0.01

0.21

3.63

14

19.71

297.7

467.9

2200

0.08

0.63

4.04

15

26.02

83.9

618.5

2800

0.08

0.88

3.93

16

11.84

168.9

375.8

750

0.07

0.45

5.89

17

10.71

127.3

330.3

910

0.13

0.43

4.56

18

8.3

107.4

241.4

880

0.08

0.31

4.74

19

12.67

188.7

516.4

1300

0.05

0.33

4.4

20

15.92

203.6

336.9

1500

0.08

0.52

4.13

21

12.92

170.6

319.6

1600

0.06

0.44

4.05

22

7.54

53.8

315.7

890

0.05

0.28

4.7

23

21.96

104.3

578.8

1900

0.12

0.81

4.11

24

88.78

107.6

1156.8

290

0.06

0.99

3.19

25

72.19

174.7

1061.3

690

0.14

2.32

3.93

Завдання 25

У таблиці містяться дані про річки світу.

Річка:

X1

X2

X3

X3

X4

X5

X6

Амазонка

5421,3

22,43

65,32

21,4

123,32

32,42

123,4

Волга

1233l,2

32,54

32,34

32,34

845,98

61,24

343,6

Урал

5343,21

12,76

12,63

34,4

456,96

29,63

341,8

Дон

2134,1

65,62

34,74

54,4

345,56

54,75

132,7

Хуанхе

6542,2

43,43

54,85

76,3

356,73

37,45

143,9

Об

2434,6

32,34

76,54

43,3

357,74

36,52

162,05

Конго

2342,5

12,23

23,63

65,23

343,52

47,22

179,66

Міссісіпі

4123,8

54,21

45,34

76,3

324,57

32,34

146,54

Одер

2342,43

32,76

45,44

43,3

111,74

35,55

137,44

Завдання 26

У таблиці містяться дані про економічні центри Італії.

Місто:

X1

X2

X3

X4

X5

X6

X7

X8

Рим

12,43

32,76

45,43

76,34

98,55

34,44

48,4

33,44

Турин

34,41

41,65

31,33

43,4

84,45

34,23

22,5

34,54

Мілан

41,22

32,54

83,5

23,5

56,34

45,23

84,76

43,54

Палермо

21,12

21,23

24,8

12,4

55,78

11,12

33,76

22,75

Болонья

31,32

11,33

26,32

38,77

43,43

21,65

45,882

11,98

Неаполь

12,45

12,44

29,56

73,54

82,23

12,4

66,33

23,90

Завдання 27

У таблиці містяться дані про міста Іспанії.

Місто:

X1

X2

X3

X4

X5

X6

X7

X8

Мадрид

234,44

654,6

888,44

455,98

455,1

452,4

121,6

3,88

Барселона

235,34

236,21

568,32

632,76

256,2

254,33

635,55

5,44

Більбао

236,23

256,32

756,54

256,67

356,5

563,11

256,5

8,3

Севілья

123,55

456,31

745,12

241,56

245,4

258,87

254,8

7,4

Валенсія

412,33

356,33

762,81

256,45

569,6

255,44

215,4

4,6

Сарагоса

125,12

359,44

741,5

256,54

589,8

452,43

248,3

7,7

Малага

149,45

354,44

621,65

254,44

514,9

145,5

524,30

7,3

Завдання 28

У таблиці містяться дані міста Англії.

Місто:

X1

X2

X3

X4

X5

X6

X7

X8

Лондон

21,2

231,55

12,33

23,5

34,55

12,4

3,6

431,54

Манчестер

43,34

432,4

12,23

12,3

14,45

23,6

4,5

129,34

Портсмут

81,3

324,2

32,12

23,2

32,43

21,6

5,3

234,23

Ньюкасл

75,21

546,5

45,11

32,45

23,33

32,4

3,5

453,56

Ліверпуль

62,3

453,3

34,23

76,7

12,87

23,6

2,54

324,87

Бірмінгем

53,5

323,4

65,6

45,5

12,44

12,4

5,22

233,54

Бристоль

23,4

324,22

78,87

23,77

3,32

33,2

8,34

435,45

Завдання 29

У таблиці містяться дані про текстові документи.

Документ:

X1

X2

X3

X4

X5

X6

X7

X8

Соціологія

2

3

2

2

1

2

2

1

Філософія

3

2

3

2

1

2

3

2

Макроекономіка

5

5

4

5

4

4

4

4

Історія економічних вчень

5

4

5

6

6

6

6

5

Етика

0

1

0

0

0

1

1

1

Мікроекономіка

4

4

4

3

4

3

3

5

Завдання 30

У таблиці містяться дані про інтернет ресурси.

Інтернет ресурс:

X1

X2

X3

X4

X5

X6

X7

X8

http://www.champion.com.ua/

2,3

2,2

3,5

2,5

3,3

2,6

4,8

4,4

http://24tv.ua/

6,4

5,3

6,4

5,4

5,4

5,5

6,7

5,2

http://www.pravda.com.ua/

6,5

6,6

5,4

7,7

7,7

6,4

5,6

7,3

http://zik.ua/

6,5

5,5

7,3

6,5

5,6

7,4

7,5

7,2

http://techno.bigmir.net/

1,8

2,4

1,6

1,4

2,5

2,3

2,4

3,8

http://www.pslan.com/

5,4

8,8

6,8

6,4

7,8

7,2

8,3

6,1

http://www.lostfilm.tv/

5,8

8,6

7,3

6,9

6,3

8,2

8,9

6,07

Вимоги до звіту

Оформити звіт для захисту лабораторної роботи за зразком:

  • назва роботи;

  • мета роботи;

  • порядок роботи;

  • короткі теоретичні відомості;

  • аналіз отриманих результатів та висновок.

Оформлення звіту

Звіт повинен відповідати вимогам, перерахованим в розділі 3 – Вимоги до звіту. Звіт оформляється на листах формату А4 (також додається електронний варіант). Титульна сторінка повинна містити: назву предмету, такий заголовок:

Звіт

до лабораторної роботи № 4

“Кластеризація в Data Mining. Базові алгоритми кластеризації.

Ієрархічний алгоритм кластеризації”

ПІБ, номер групи студента і дату виконання лабораторної роботи. Звіт подається викладачу для перевірки на занятті, яке є наступними за даною лабораторною роботою.

Контрольні питання:

  1. Що таке кластеризація?

  2. Що таке характеристична функція?

  3. Опишіть формальне завдання кластеризації.

  4. Що таке міра близькості? Як вона обчислюється?

  5. Класифікація алгоритмів кластеризації.

  6. У чому полягає різниця між агломеративними та подільними алгоритмами?

  7. Часова складність алгоритмів кластеризації.

  8. Де застосовується кластеризація?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]