Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпаргалки для студентов.doc
Скачиваний:
4
Добавлен:
21.08.2019
Размер:
1.27 Mб
Скачать

Пример: построим равнонаполненную группировку совокупности 20 студентов по признаку «посещаемость практических занятий» - х.

Исходные данные:

16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9.

Решение:

  1. Примем число групп равным 3. Тогда n=20/3=6,67 .

  2. Упорядочим совокупность студентов по значению признака Х:

0 3 4 5 6 7 7 9 10 10 10 12 12 14

1 группа 2 группа

1 5 15 16 16 16 16

3 группа

Определим границы интервалов по группам:

Хн Хв

1 группа 0 7

2 группа 7 14

3 группа 14 16

Результаты сведем в таблицу:

N группы –j

Посещаемость – (Xн j; X вj)

Величина интервала - j

Количество студентов – Nj

Абсолютная плотность – mаj=

Доля – qj

Относительная плотность - moj=

1

[0 ; 7]

7

7

1

0,35

0,05

2

(7 ; 14]

7

7

1

0,35

0,05

3

(14; 16]

2

6

3

0,3

0,15

ИТОГО

16

20

-

1,0

Вопрос 13

Сложные группировки: комбинационные и многомерные.

ОТВЕТ

Сложные группировки (группировки по нескольким признакам) делятся на комбинационные и многомерные.

Комбинационная группировка - группировка по нескольким признакам, осуществляемая последовательно. Последовательность устанавливается исходя из логики взаимосвязи показателей. Обычно начинают группировку с атрибутивного признака. При комбинационной группировке группы, образованные по одному признаку, делятся на подгруппы по второму признаку, затем по третьему и т.д.

Комбинационная группировка позволяет выявить и сравнить различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированных группировок по ряду группировочных признаков. Однако при изучении влияния большого числа признаков применение комбинационных группировок снижает наглядность, поскольку чрезмерное дробление информации затушевывает проявление закономерностей. Даже при наличии большого массива информации приходится ограничиваться двумя-четырьмя признаками.

Комбинационная группировка по 2-ум признакам (Х, Y) оформляется в виде шахматной таблицы, в которой значения группировочных признаков откладывается по строкам (X) и столбцам (Y). В теле такой таблицы (на пересечении j-ого столбца и i-ой строки) содержатся частоты совместного появления значения признака Y в j–ом столбце и значения признака X в i–ой строке.

Приведем пример комбинационной группировки студентов по 2-ум признакам: Y - оценка по статистике и X- посещаемость практических занятий.

X 16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9

Y 4 4 4 3 3 5 5 3 3 3 5 4 4 5 4 2 4 3 3 4

Комбинационная группировка студентов по признакам: оценка (y) и посещаемость практических занятий (X):

Посещаемость

(Xн i; X вi)

Оценка по статистике (Yj)

ИТОГО

2

3

4

5

[0 ; 7]

1

3

2

1

7

(7 ; 14]

-

3

3

1

7

(14; 16]

-

1

3

2

6

Итого

1

7

8

4

20

Анализируя комбинационную группировку можно сделать вывод о направлении связи между признаками. Если максимальные частоты располагаются вдоль главной диагонали, проходящей из левого верхнего угла в правый нижний угол, то связь между признаками прямая. Если максимальные частоты располагаются на побочной диагонали, выходящей из правого верхнего угла в левый нижний угол, то связь - обратная. В нашем примере связь между признаками оценка и посещаемость практических занятий прямая.

Кроме того, по расположению максимальных частот, можно сделать вывод о форме связи между признаками (линейная или нелинейная форма связи).

Многомерная группировка осуществляется не последовательно по отдельным признакам, а одновременно по комплексу признаков. При осуществлении многомерных группировок могут быть использованы два основных подхода:

  • Суть первого состоит в том, что каждая единица совокупности, характеризующаяся набором (из m) признаков, рассматривается как точка в m-мерном пространстве. Множество точек (единиц совокупности) разделяется на однородные группы. Мерой близости точек (сходства единиц совокупности) могут служить различные критерии. В кластерном анализе, например, в качестве критерия близости используют евклидово расстояние.

  • Второй подход заключается в расчете обобщающего показателя по комплексу группировочных признаков и проведении простой группировки по этому обобщающему показателю. Разновидностью такого подхода является метод многомерных средних. Алгоритм данного метода:

1) первичные данные заменяются их нормированными по среднему значению уровнями (Хi’=Хi / );

2) для каждой единицы совокупности по этим нормированным значениям рассчитывается средняя арифметическая величина (X’) - обобщающий показатель;

3) в соответствии со значениями обобщающего показателя и производится распределение единиц на группы.