Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kl_an.docx
Скачиваний:
56
Добавлен:
05.06.2015
Размер:
153.59 Кб
Скачать

4.5. Задачи и упражнения Кластерный анализ

4.1. По иерархическому агломеративному алгоритму провести классификацию n=6 предприятий машиностроения, данные о деятельности которых характеризуются показателями:x(1)-рентабельность (%),x(2) - производительность труда (млн. руб./чел.) и представлены в табл.4.6.

Таблица 4.6.

№ предприятия

1

2

3

4

5

6

x(1)

x(2)

23,4

9,1

17,5

5,2

9,7

5,5

18,2

9,4

6,6

7,5

8,0

5,7

В качестве расстояния между объектами принять:

а) обычное евклидово расстояние;

б) взвешенное евклидово расстояние с весами 1=0,1 и2=0,9;

в) сравнить разбиения на два кластера по критерию минимума суммы внутриклассовых дисперсий.

Расстояние между кластерами определить по принципу "ближайшего соседа", не нормализуя данные.

4.2. Задачу 4.1. решить, предварительно нормализовав исходные данные.

4.3. Задачу 4.1. решить, измеряя расстояние между кластерами по принципу "дальнего соседа", не нормализуя предварительно исходные данные.

4.4. Задачу 4.1. решить, измеряя расстояние между кластерами по "центрам тяжести" групп, не нормализуя предварительно исходные данные.

4.5. По агломеративному алгоритму провести классификацию n=5 хозяйств, данные о деятельности которых характеризуются показателями объема реализованной продукции:x(1)- растениеводства иx(2)- животноводства с одного гектара пашни (млн.руб./га) и представлены в табл.4.7.

Таблица 4.7.

№ хозяйства

1

2

3

4

5

x(1)

x(2)

2,49

0,38

1,51

0,51

1,17

0,28

1,67

0,29

2,73

0,34

В качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу:

а) "ближайшего соседа";

б) "дальнего соседа";

в) сравнить разбиения на два кластера по критерию минимума суммы внутриклассовых дисперсий. Исходные данные не нормализовывать.

4.6. Задачу 4.5. решить, предварительно нормализовав исходные данные.

4.7. Задачу 4.5. решить при условии, что расстояние между кластерами измеряются по принципу:

а) "средней связи";

б) "центра тяжести", не нормализуя предварительно исходные данные.

4.8. По агломеративному алгоритму провести классификацию n=6 регионов по уровню медицинского обслуживания населения, который характеризуется показателями:x(1)- число врачей на 10 тыс. жителей иx(2)- число больничных коек на 10 тыс. жителей. Данные для классификации представлены в табл.4.8.

Таблица 4.8.

№ региона

1

2

3

4

5

6

x(1)

x(2)

34,8126,0

31,2

112,0

32,1

123,0

35,7

128,0

30,2

115,0

34,2

123,0

За расстояние между объектами принять взвешенное евклидово расстояние с 1=0,8 и2=0,2, а расстояние между кластерами измерять по принципу:

а) "ближайшего соседа";

б) "дальнего соседа";

в) сравнить разбиения на два кластера по критерию минимума суммы внутриклассовых дисперсий. Исходные данные не нормализовывать.

4.9. Задачу 4.8. решить, предварительно нормализовав исходные данные.

4.10. Задачу 4.8. решить при условии, что расстояния между кластерами измеряются по принципу:

а) "средней связи";

б) "центра тяжести" групп, не нормализуя предварительно исходные данные.

4.11. Задачу 4.8. решить, когда расстояния между кластерами измеряются по принципу:

а) "дальнего соседа";

б) "средней связи", а между объектами - с помощью обычного евклидова расстояния.

4.12. Провести по агломеративному алгоритму классификацию n=5 хозяйств района, данные о деятельности которых представлены в табл.4.9. по показателям:x(1)- производительность труда (млн. руб./чел.), объем реализованной продукцииx(2)- растениеводства иx(3)- животноводства с одного гектара посевной площади (млн. руб./га).

Таблица 4.9.

№ хозяйства

1

2

3

4

5

x(1)

x(2)

x(3)

8,22

0,25

0,41

4,33

0,49

0,38

6,43

0,51

0,51

6,39

0,27

0,42

4,92

0,32

0,55

В качестве расстояния между объектами принять:

а) обычное евклидово расстояние;

б) взвешенное евклидово расстояние с весами: 1=0,1;2=0,4;3=0,5;

в) сравнить разбиения на два кластера по критерию минимума суммы внутриклассовых дисперсий.

Расстояния между кластерами определять по принципу "ближайшего соседа". Исходные данные не нормализовывать.

4.13. Задачу 4.12. решить, предварительно нормализовав исходные данные.

4.14. Задачу 4.12. решить, измеряя расстояние между кластерами по принципу "дальнего соседа". Исходные данные не нормализовывать.

4.15. Задачу 4.12. решить, измеряя расстояние между кластерами по принципу "центра тяжести", не нормализуя исходные данные.

4.16. Провести по агломеративному алгоритму классификацию n=6 машиностроительных предприятий, данные о деятельности которых представлены в табл.4.10. по показателям:x(1)- производительность труда (млн. руб./чел.),x(2)- удельный вес потерь от брака (%) иx(3)- фондоотдача активной части основных производственных фондов (руб. /руб.).

Таблица 4.10.

№ предприятия

1

2

3

4

5

6

x(1)

x(2)

x(3)

9,40

0,15

1,91

6,6

0,48

0,88

7,4

0,62

1,09

10,0

0,32

2,62

6,6

0,50

1,32

9,1

0,90

1,89

В качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу

а) "ближайшего соседа";

б) "дальнего соседа";

в) сравнить разбиения на два кластера по критерию минимума суммы внутриклассовых дисперсий, не нормализуя предварительно исходные данные.

4.17. Задачу 4.16. решить, предварительно нормализовав исходные данные.

4.18. Задачу 4.16. решить при условии, что расстояние между кластерами измеряются по принципу:

а) "средней связи";

б) "центра тяжести" групп, не нормализуя предварительно исходные данные.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]