Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
0491807_F3EAE_lekcii_po_statistike / 003_метод_группировок.doc
Скачиваний:
67
Добавлен:
16.04.2015
Размер:
93.7 Кб
Скачать

Характеристика зависимости количества комментариев от времени ведения блога за 2008 г.

Продолжительность ведения блога,

мес

Число блогов

Среднее количество комментарев, шт

20 - 30

60

70,40

31 -50

80

120,95

51 - 80

60

140,57

Итого

200

110,77

Территориальная группировка - средство изучения территории изучаемых явлений.

Научно обоснованные группировки подчинены задачам исследования. Они исключают формализм при образовании интервалов, дают возможность применять специализированные группировочные признаки и специализированные интервалы.

Группировочный признак - признак, по которому происходит объединение (или разъединение) отдельных единиц совокупности в отдельные группы.

Ряд распределения - результат группировки данных, полученных при статистическом наблюдении, упорядоченное распределение единиц совокупности на группы по изучаемому варьирующему признаку.

Статистические ряды (различная система показателей):

  • Вариационные ряды распределения

  • Дискретные

  • Интервальные

  • Динамические ряды

  • Моментные

  • Интервальные

Вариация - различие значений признака у разных единиц одновременно существующей совокупности.

Частотыf – это численности отдельных вариаций или каждой группы вариационного ряда. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.

Показатель численности групп представлен либо частотой (абсолютные числа), либо частостью (удельным весом каждой группы - относительные), либо как те и другие совместно (в двух параллельных столбцах).

Частость - относительное выражение частоты, представляет собой отношение частоты к сумме частот.

Отношения частот или частостей к величинам интервала называются плотностью распределения.

Абсолютной плотностью распределения называется число, показывающее, сколько единиц совокупности приходится на единицу размера интервала в отдельных группах ряда

Относительная плотность распределения определяется как частное от деления частности W отдельной группы ряда на единицу размера интервала

Абсолютная плотность распределения

Относительная плотность распределение

Динамика - изменение изучаемого явления в разные периоды времени.

Ряд распределения, в котором единицы совокупности расположены либо в порядке возрастания, либо в порядке убывания изучаемого признака, называется ранжированным.

Атрибутивные ряды распределения - ряды, построенные по атрибутивному признаку.

Число групп, на которые делится исследуемая совокупность по атрибутивному признаку, определяется числом разновидностей данного признака.

Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т.д.

При альтернативной группировке, частном случае группировки по атрибутивному признаку - существует всего два значения рассматриваемою признака, причем один исключает другой.

Вариационные ряды - ряды распределения, построенные по количественному признаку, определение интервала группировки должно соответствовать переходу от одного качества к другому.

Примером вариационного ряда распределения могут служит распределения населения по возрасту, рабочих – по стажу работы, заработной плате и т.д.

Дискретный вариационный ряд распределения характеризует распределение совокупности по отдельным заранее фиксированным значениям признака (как правило, целочисленным).

Интервальный вариационный ряд - ряд распределения, в котором значения признака выражены в виде интервалов.

При построении интервального вариационного ряда необходимо выбрать оптимальное количество групп и установить величину (шаг) интервала

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Интервалы бывают:

равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

открытые, когда имеется только либо верхняя, либо нижняя граница;

закрытые, когда имеются и нижняя, и верхняя границы.

Определение числа групп. Здесь необходимо учитывать несколько условий:

  • число групп детерминируется уровнем колеблемости группировочного признака. Чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп;

  • число групп должно отражать реальную структуру изучаемой совокупности;

  • не допускается выделение пустых групп. Если проблема пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы.

Число групп чаще всего определяется по формуле Стерджесса:

k = 1 + 3,322 lg N, где N – число единиц совокупности

Определение ширины интервалов производится по формуле:

Например:

В садоводстве растет 15 яблонь.

*

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

итого

**

20

22

24

26

28

30

32

34

35

36

38

40

42

44

45

496

***

1

2

3

4

5

х

*номер яблони, **количество яблок, шт *** номер участка

N = 15

k= 1+3,322lg15= 1+3,322*1,17 5

Количество яблок, шт

Номер яблони

Количество яблонь, шт

1

[20-25]

1, 2, 3

3

2

(25-30]

4, 5, 6,

3

3

(30-35]

7, 8, 9

3

4

(35-40]

10, 11, 12

3

5

(40-45]

13, 14, 15

3

Итого:

х

15

Наименьшее количество яблок вырастает на участке №1 (яблони 1, 2, 3), наибольшее количество яблок вырастает на участке №5(яблони 13, 14, 15). Чем больше порядковый номер яблони – тем больше яблок на ней. Чем больше порядковый номер участка, тем больше яблок на нем выращивается. Если предположить, что уход за яблонями, их сорта, возраст, состояние одинаковы, то можно сделать вывод, что качество земли улучшается от участка №1 к участку №5.