
- •Статистика. Лекции
- •Основные черты:
- •2. Организационная – кем организовано наблюдение, кто будет проводить наблюдение, материальное и финансовое обеспечение.
- •3. В зависимости от источника получения сведений: непосредственное наблюдение, документальное наблюдение, опрос.
- •Лекция 3. Второй этап статистического исследования –
- •Основные принципы построения группировок и классификаций
- •Лекция 4. Ряды распределения
- •Тема: Статистические показатели
Основные принципы построения группировок и классификаций
Принципы -//- зависят от целей и задач статистического исследования.
На первом этапе выбирается группировочный признак.
На втором – определяется число групп. Число групп зависит от вида группировочного признака и задач статистического исследования.
Если в качестве группировочного признака выбран:
- атрибутивный альтернативный признак, то число групп – 2.
- множественный атрибутивный признак, то число групп будет равно числу этих признаков (классификация).
- дискретный количественный и этот признак варьирует в узких пределах, то число групп будет совпадать с числом этих признаков. Если дискретный признак варьирует в широких пределах, то строят интервальную группировку.
- количественный непрерывный признак, то строят интервальную группировку.
Если при интервальной группировке исходная информация представлена небольшим объемом, т.е. признак варьирует в узких пределах, то число групп должно быть небольшим. «Негласное правило» – группы должны быть сформированы таким образом, чтобы в каждую группу попало не меньше 5 единиц наблюдения.
Если признак варьирует в широких пределах, то число групп может определяться по формуле Стерджеса: n = 1 + 3,322*lgN, где n – число групп, а N – большое число единиц.
На третьем этапе определяются интервалы.
Интервал – значение признака, лежащие в определенных границах.
Интервал включает: нижняя и верхняя границы, величина интервала.
Нижняя граница – минимальное значение признака, попавшего в данный интервал.
Верхняя граница – максимальное значение признака, попавшего в данный интервал.
Величина интервала – разность между максимальным и минимальным значением признака.
Интервалы могут быть открытыми (имеет одну границу) и закрытыми (имеет две границы – верхнюю и нижнюю). Как правило открытыми являются первый и последний интервалы.
В зависимости от величины интервалы бывают
- равными. Применяются, если признак распределяется близко к нормальному. Тогда определяется величина
d = R/n, R=Xmax-Xmin.
- неравными. Применяются, если признак имеет распределение, отличающееся от нормального. Бывают:
1. прогрессивно возрастающими/убывающими – рассчитываются для арифметической и геометрической прогрессии. di+1=di ± A; di+1=di*K.
2. произвольными – если группировка строится на . Для расчета величины используется величина Коэффициент вариации. Сначала исследуемая свокупность ранжируется в порядке возрастания группировочного признака, затем для первых двух значений расчитывают коэффициент вариации.
=٧δ/x*100%. ٧33%
3. специализированными.
Лекция 4. Ряды распределения
Ряды распределения – это упорядоченное распределение единиц совокупности по какому либо существенному признаку.
В зависимости от рассматриваемого вида признака различают: Атрибутивные Р.Р.- ряд распределения по качественному признаку. Характеризует структуру рассматриваемого явления по одному или нескольким признакам за один или несколько периодов времени в условиях качественной определенности. Качественная определенность признака состоит в том, что признак характеризует внутреннее содержание явления, его сущность.
Вариационные Р.Р.- ряд распределения, построенный по количественному признаку. В зависимости от степени варьирования признака различают:
дискретные. Построены по дискретному количественному признаку. Если вариация признака непрерывна, т.е. значение признака в определенных пределах могут принимать любые числа, отличающиеся друг от друга на сколь угодно малую величину, то строят интервальные.
интервальные. Строят, в первую очередь, для непрерывной вариации, во вторую очередь, для дискретных признаков, варьирующих в широких пределах.
Вариационные ряды удобнее всего анализировать с помощью графиков. Для их отображения используют: полигон и гистограмму.
Полигон – применяется для отображения дискретных вариационных рядов. Для его построения в прямоугольной системе координат на оси абсцисс откладывают ранжированное значение дискретного признака в определенном масштабы, а на оси ординат- частоты этих признаков или их частость. Полученные точки соединяют ломаной линией, крайние точки соединяют перпендикулярами с осью Х (полученная ломаная - полигон). Полигон характеризует распределение единиц совокупности между дискретными варьирующими признаками.
Гистограмма – применяется для изображения интервальных вариационных рядов. Если изображается интервальный ряд с равными непрерывными интервалами, то для изображения гистограммы на оси Х откладываются равные отрезки в определенном масштабе, на них как на основаниях строят прямоугольники, высота которых соответствует частоте (частости) данного интервала, т.е. распределение совокупности между вариантами распределения признака, лежащими в равных непрерывных интервалах.
Если изображается ряд с неравными интервалами, то для изображения гистограммы на оси Х в определенном масштабе откладывают отрезки, соответствующие величине каждого интервала, а на оси У откладывают плотности распределения признака в данном ряду. Плотность распределения признака – число единиц совокупности, приходящееся на единицу ширины интервала.
Если середины верхних оснований гистограммы соединить отрезками прямой, то получим полигон.
Применяется также кумулятивная кривая-кумулянта. Для ее построения вместо частот (частости, плотности) на оси У откладывают накопленные частоты (накопленные частости).
Ряды распределения являются простейшей группировкой, в которой варианты признака характеризуются только одним показателем – числом единиц совокупности.
Варианта – значение признака, которые он принимает в данном ряду.
Частота – показывает, сколько раз появляется данное значение признака в рассматриваемом ряду.
Сумма всех частот в ряду – объем совокупности.
Частость – частота, выраженная в процентах или долях.
Сумма всех частостей – единица или 100%.
После построения ряда распределения, строится группировка, т.е. ряд распределения усложняется. Каждая группировка характеризуется многими признаками. Как правило, при построении группировки рассматривается не отдельное множество признаков, а их совокупность, включающих в себя абсолютные, относительные и средние статистические величины.
Если при построении кумулятивных кривых для интервального вариационного ряда, оси координат перевернуть и варианты отложить на оси У, а накопленные частоты на оси Х, то получим огиву.