Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика.Лекции..doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
99.33 Кб
Скачать

Основные принципы построения группировок и классификаций

Принципы -//- зависят от целей и задач статистического исследования.

На первом этапе выбирается группировочный признак.

На втором – определяется число групп. Число групп зависит от вида группировочного признака и задач статистического исследования.

Если в качестве группировочного признака выбран:

- атрибутивный альтернативный признак, то число групп – 2.

- множественный атрибутивный признак, то число групп будет равно числу этих признаков (классификация).

- дискретный количественный и этот признак варьирует в узких пределах, то число групп будет совпадать с числом этих признаков. Если дискретный признак варьирует в широких пределах, то строят интервальную группировку.

- количественный непрерывный признак, то строят интервальную группировку.

Если при интервальной группировке исходная информация представлена небольшим объемом, т.е. признак варьирует в узких пределах, то число групп должно быть небольшим. «Негласное правило» – группы должны быть сформированы таким образом, чтобы в каждую группу попало не меньше 5 единиц наблюдения.

Если признак варьирует в широких пределах, то число групп может определяться по формуле Стерджеса: n = 1 + 3,322*lgN, где n – число групп, а N – большое число единиц.

На третьем этапе определяются интервалы.

Интервал – значение признака, лежащие в определенных границах.

Интервал включает: нижняя и верхняя границы, величина интервала.

Нижняя граница – минимальное значение признака, попавшего в данный интервал.

Верхняя граница – максимальное значение признака, попавшего в данный интервал.

Величина интервала – разность между максимальным и минимальным значением признака.

Интервалы могут быть открытыми (имеет одну границу) и закрытыми (имеет две границы – верхнюю и нижнюю). Как правило открытыми являются первый и последний интервалы.

В зависимости от величины интервалы бывают

- равными. Применяются, если признак распределяется близко к нормальному. Тогда определяется величина

d = R/n, R=Xmax-Xmin.

- неравными. Применяются, если признак имеет распределение, отличающееся от нормального. Бывают:

1. прогрессивно возрастающими/убывающими – рассчитываются для арифметической и геометрической прогрессии. di+1=di ± A; di+1=di*K.

2. произвольными – если группировка строится на . Для расчета величины используется величина Коэффициент вариации. Сначала исследуемая свокупность ранжируется в порядке возрастания группировочного признака, затем для первых двух значений расчитывают коэффициент вариации.

=٧δ/x*100%. ٧33%

3. специализированными.

Лекция 4. Ряды распределения

Ряды распределения – это упорядоченное распределение единиц совокупности по какому либо существенному признаку.

В зависимости от рассматриваемого вида признака различают: Атрибутивные Р.Р.- ряд распределения по качественному признаку. Характеризует структуру рассматриваемого явления по одному или нескольким признакам за один или несколько периодов времени в условиях качественной определенности. Качественная определенность признака состоит в том, что признак характеризует внутреннее содержание явления, его сущность.

Вариационные Р.Р.- ряд распределения, построенный по количественному признаку. В зависимости от степени варьирования признака различают:

  1. дискретные. Построены по дискретному количественному признаку. Если вариация признака непрерывна, т.е. значение признака в определенных пределах могут принимать любые числа, отличающиеся друг от друга на сколь угодно малую величину, то строят интервальные.

  2. интервальные. Строят, в первую очередь, для непрерывной вариации, во вторую очередь, для дискретных признаков, варьирующих в широких пределах.

Вариационные ряды удобнее всего анализировать с помощью графиков. Для их отображения используют: полигон и гистограмму.

Полигон – применяется для отображения дискретных вариационных рядов. Для его построения в прямоугольной системе координат на оси абсцисс откладывают ранжированное значение дискретного признака в определенном масштабы, а на оси ординат- частоты этих признаков или их частость. Полученные точки соединяют ломаной линией, крайние точки соединяют перпендикулярами с осью Х (полученная ломаная - полигон). Полигон характеризует распределение единиц совокупности между дискретными варьирующими признаками.

Гистограмма – применяется для изображения интервальных вариационных рядов. Если изображается интервальный ряд с равными непрерывными интервалами, то для изображения гистограммы на оси Х откладываются равные отрезки в определенном масштабе, на них как на основаниях строят прямоугольники, высота которых соответствует частоте (частости) данного интервала, т.е. распределение совокупности между вариантами распределения признака, лежащими в равных непрерывных интервалах.

Если изображается ряд с неравными интервалами, то для изображения гистограммы на оси Х в определенном масштабе откладывают отрезки, соответствующие величине каждого интервала, а на оси У откладывают плотности распределения признака в данном ряду. Плотность распределения признака – число единиц совокупности, приходящееся на единицу ширины интервала.

Если середины верхних оснований гистограммы соединить отрезками прямой, то получим полигон.

Применяется также кумулятивная кривая-кумулянта. Для ее построения вместо частот (частости, плотности) на оси У откладывают накопленные частоты (накопленные частости).

Ряды распределения являются простейшей группировкой, в которой варианты признака характеризуются только одним показателем – числом единиц совокупности.

Варианта – значение признака, которые он принимает в данном ряду.

Частота – показывает, сколько раз появляется данное значение признака в рассматриваемом ряду.

Сумма всех частот в ряду – объем совокупности.

Частость – частота, выраженная в процентах или долях.

Сумма всех частостей – единица или 100%.

После построения ряда распределения, строится группировка, т.е. ряд распределения усложняется. Каждая группировка характеризуется многими признаками. Как правило, при построении группировки рассматривается не отдельное множество признаков, а их совокупность, включающих в себя абсолютные, относительные и средние статистические величины.

Если при построении кумулятивных кривых для интервального вариационного ряда, оси координат перевернуть и варианты отложить на оси У, а накопленные частоты на оси Х, то получим огиву.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]