Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР_3.doc
Скачиваний:
3
Добавлен:
13.11.2019
Размер:
2.03 Mб
Скачать

Двухвходовое объединение

Кластеризация проводится одновременно как по переменным (столб­цам), так и по результатам наблюдений (строкам). Для примера рассмот­рим десять экономических показателей (производительность труда, индекс снижения себестоимости, рентабельность и т. д.) для каждого из 50 пред­приятий. Нас могут интересовать однородные по этим показателям группы предприятий (кластеризация производится по пред­приятиям (строкам», а также однородные группы экономических показателей (кластеризация проводится по переменным – столбцам). Процедура двухвходового объединения используется в тех случаях, когда можно ожидать, что одновременная кластеризация по переменным (столбцам) и наблюдениям (строкам) дает возможность получить осмысленные кластеры. Результаты процедуры: описательные статистики по переменным и наблюдениям, а также двумерная цветная диаграмма, на которой цветом отмечаются значения данных. По распределению цвета можно составить представление об однородных группах.

2. Практическая часть

  1. По выборке из своего варианта, используя данные таблицы 2.1, выполнить следующие расчеты и задания:

  • вычислить верхнюю и нижнюю границы, среднее и дисперсию;

  • на уровне значимости α = 0,1 проверить гипотезу о нормальном распределении генеральной совокупности по критерию χ;

  • посторойте график.

  1. Ввести данные в пакет STATISTICA, выполнить расчеты, сравнить результаты и оформить 1-ю часть лабораторной работы.

  2. Провести кластеризацию объектов методами одиночной и полной связи используя данные таблицы 2.2.

  3. Ввести данные в пакет STATISTICA, выполнить расчеты, сравнить результаты и оформить 2-ю часть лабораторной работы.

  4. Провести кластеризацию объектов методом К-средней используя данные таблицы 2.3.

  5. Ввести данные в пакет STATISTICA, выполнить расчеты, сравнить результаты и оформить 3-ю часть лабораторной работы.

  6. Распечатайте полученные данные, графики и оформите титульный лист лабораторной работы.

3. Контрольные вопросы

  1. Охарактеризуйте понятия «нормальное распределение».

  2. Что такое критерий χ2?

  3. При каком уровне значимости принимается гипотеза о нормальном распределении?

  4. Назовите основные методы кластеризации.

  5. Поясните суть методов древовидных алгоритмов.

  6. Какой вид имеют результаты кластеризации методом соединения (древовидными алгоритмами)?

  7. Охарактеризуйте метод К-средних.

  8. Как выбрать тип графика?

  9. Для чего используется диаграмма рассеяния для исходных данных при использовании метода К-средних?

  10. Перечислите результаты кластеризации, полученные при использовании метода К-средних.

  11. Поясните суть метода двухвходового метода кластеризации.

Таблица 2.1

Выборка для задания по проверке гипотезы о нормальном распределении

№ варианта

№ п/п

0

1

2

3

4

5

6

7

8

9

1

67

55

41

36

75

56

25

19

90

73

2

78

67

90

100

88

95

92

99

66

35

3

49

39

89

54

59

57

95

16

75

44

4

84

53

30

72

16

81

98

98

67

14

5

97

84

64

20

71

62

46

69

13

84

6

92

56

97

61

78

94

30

100

95

23

7

42

15

100

30

96

94

65

29

19

39

8

40

75

22

22

46

29

66

59

65

40

9

59

13

41

73

81

98

66

95

35

98

10

47

81

100

43

98

21

76

74

16

98

11

85

58

44

29

92

48

59

57

69

63

12

35

78

29

69

40

74

39

75

76

66

13

84

33

13

99

86

46

91

42

65

20

14

87

33

42

73

71

66

27

91

24

53

15

70

42

17

66

68

54

75

47

13

55

16

80

85

35

78

91

74

72

59

87

88

17

77

24

84

74

44

76

48

31

50

14

18

96

14

20

40

45

18

44

13

93

77

19

93

26

81

30

90

88

45

23

24

17

20

98

26

66

90

82

34

31

86

81

99

21

85

67

22

26

98

82

62

33

54

18

22

18

79

83

42

95

19

28

14

31

99

23

82

78

86

83

33

77

50

27

98

72

24

25

15

18

64

48

79

42

12

95

69

25

81

15

80

34

62

13

71

11

13

40

26

71

55

46

73

89

24

30

93

82

53

27

14

30

64

21

82

79

76

14

80

28

28

37

82

100

36

76

40

11

13

47

93

29

38

35

90

77

72

54

88

72

68

16

30

96

83

98

100

73

81

89

76

36

92

31

55

13

84

87

32

36

43

55

66

72

32

31

67

28

52

93

66

20

81

86

20

33

81

56

83

32

85

89

18

97

85

49

34

85

100

34

57

48

75

75

12

60

22

35

83

93

77

63

66

59

91

90

90

16

36

53

42

59

55

86

29

28

20

78

31

37

90

89

49

27

63

48

48

88

94

90

38

34

56

47

86

46

84

19

62

19

64

39

97

67

94

54

83

89

96

34

45

43

40

55

17

72

92

41

11

68

15

51

55

41

97

80

44

11

56

18

98

43

67

39

42

23

94

20

37

74

49

73

63

63

48

43

89

98

57

49

85

75

73

21

32

48

44

39

21

64

29

65

26

33

84

12

94

45

76

70

36

64

87

91

14

87

88

62

46

51

13

42

11

15

82

53

48

73

26

47

15

11

22

52

13

86

56

39

32

32

48

73

20

90

23

24

58

46

48

48

18

49

23

16

15

48

64

77

17

13

28

13

50

20

41

18

17

23

36

100

91

78

18

51

57

30

43

87

39

39

69

87

22

15

52

16

72

17

59

93

82

56

60

86

22

53

86

72

49

83

73

13

80

91

12

71

54

61

18

31

11

70

93

100

56

43

96

55

46

54

12

81

64

36

89

33

90

29

Таблица 2.2

Выборка для кластеризации объектов методами одиночной и полной связи

Вариант

№ п/п

0

1

2

3

4

5

6

7

8

9

x0

y0

x1

y1

x2

y2

x3

y3

x4

y4

x5

y5

x6

y6

x7

y7

x8

y8

x9

y9

1

5

-7

2

10

-3

2

2

1

0

-6

-7

5

-2

-4

0

-2

-9

-7

5

7

2

0

-3

10

-9

-5

4

-2

-2

-3

-3

10

1

1

-10

8

-8

1

-10

-4

-1

3

8

2

4

-3

8

-1

3

-2

-4

7

-4

7

-2

6

-7

8

-10

-2

-6

0

4

5

0

-7

10

-1

-4

5

0

-9

4

-8

-10

-9

5

-10

3

-6

-2

-4

8

5

-7

3

2

0

-10

5

-7

1

7

8

10

4

7

3

10

-4

-2

9

5

-10

Таблица 2.3

Выборка для кластеризации объектов методом К-средней

Порядковый номер

№ варианта

1

2

3

4

5

6

7

8

9

10

0 ВАРИАНТ

x

6,0

8,0

9,0

5,0

9,0

8,0

8,0

6,0

3,0

4,0

y

2,0

2,0

8,0

9,0

7,0

4,0

7,0

5,0

2,0

9,0

z

5,0

2,0

5,0

3,0

4,0

2,0

9,0

3,0

2,0

4,0

1 ВАРИАНТ

x

8,0

8,0

8,0

8,0

6,0

6,0

4,0

9,0

3,0

3,0

y

4,0

2,0

4,0

9,0

6,0

4,0

7,0

2,0

8,0

6,0

z

7,0

2,0

2,0

6,0

7,0

7,0

4,0

2,0

3,0

5,0

2 ВАРИАНТ

x

8,0

7,0

3,0

7,0

7,0

2,0

8,0

7,0

3,0

8,0

y

5,0

6,0

3,0

4,0

2,0

8,0

9,0

6,0

7,0

5,0

z

6,0

2,0

3,0

7,0

7,0

7,0

9,0

4,0

9,0

7,0

3 ВАРИАНТ

x

6,0

4,0

9,0

8,0

8,0

8,0

3,0

8,0

3,0

5,0

y

3,0

7,0

7,0

9,0

9,0

9,0

7,0

4,0

9,0

6,0

z

9,0

4,0

8,0

7,0

6,0

2,0

9,0

2,0

3,0

6,0

4 ВАРИАНТ

x

5,0

2,0

7,0

3,0

3,0

4,0

2,0

8,0

2,0

9,0

y

9,0

3,0

8,0

3,0

6,0

2,0

6,0

2,0

4,0

8,0

z

7,0

5,0

5,0

8,0

8,0

3,0

9,0

9,0

7,0

7,0

5 ВАРИАНТ

x

2,0

2,0

3,0

8,0

7,0

2,0

8,0

2,0

4,0

2,0

y

6,0

6,0

3,0

3,0

5,0

7,0

3,0

2,0

4,0

5,0

z

5,0

9,0

8,0

4,0

4,0

5,0

5,0

6,0

2,0

7,0

6 ВАРИАНТ

x

4,0

8,0

5,0

3,0

7,0

8,0

6,0

3,0

4,0

9,0

y

7,0

3,0

4,0

4,0

6,0

9,0

9,0

4,0

9,0

4,0

z

3,0

9,0

8,0

4,0

3,0

4,0

7,0

6,0

8,0

4,0

7 ВАРИАНТ

x

9,0

5,0

7,0

5,0

2,0

4,0

3,0

4,0

9,0

2,0

y

9,0

9,0

4,0

8,0

4,0

2,0

7,0

9,0

3,0

4,0

z

9,0

9,0

3,0

7,0

6,0

4,0

7,0

8,0

7,0

7,0

8 ВАРИАНТ

x

2,0

2,0

2,0

5,0

4,0

4,0

7,0

9,0

8,0

4,0

y

8,0

9,0

8,0

3,0

6,0

8,0

4,0

7,0

5,0

5,0

z

4,0

7,0

7,0

4,0

6,0

9,0

6,0

4,0

3,0

5,0

9 ВАРИАНТ

x

6,0

7,0

4,0

4,0

8,0

5,0

7,0

8,0

2,0

6,0

y

6,0

7,0

2,0

5,0

4,0

2,0

3,0

5,0

3,0

7,0

z

2,0

7,0

2,0

8,0

5,0

6,0

8,0

8,0

8,0

7,0