- •Предмет, метод и основные категории статистики как науки
- •Классификация признаков
- •Формы статистического наблюдения
- •Способы наблюдения
- •1. Непосредственное наблюдение — такое наблюдение, при котором факты устанавливаются и фиксируются регистратором путем замера, взвешивания или подсчета.
- •План статистического наблюдения План включает в себя программно-методологические и организационные вопросы.
- •Сводка и группировка данных статистического наблюдения
- •1) Производится группировка единиц совокупности по признаку-фактору;
- •Принципы построения статистических группировок.
- •Статистические таблицы
- •Название таблицы
- •3. Информация, располагаемая в графах таблицы, завершается итоговой строкой.
- •4. Графы и строки полезно нумеровать. Графы подлежащего принято обозначать заглавными буквами алфавита а, в и т. Д., а графы сказуемого — цифрами в порядке возрастания.
- •9. Отсутствие данных об явлении может быть обусловлено различными причинами и по-разному отмечается в таблице;
- •По способу построения графики можно разделить на диаграммы, картограммы, картодиаграммы.
- •По характеру графического образа различают графики точечные, линейные плоскостные (столбиковые, квадратные, круговые, секторные фигурные) и объемные (график концентрации (кривая Лоренца).
- •Статистические показатели
- •Структура активов предприятия в I кв 2009г.
- •Средние величины
- •Виды степенных средних
- •3. Если известны численные значения числителя и знаменателя логической формулы, то средняя вычисляется непосредственно по этой формуле.
- •Средняя арифметическая обладает рядом свойств:
- •Структурные средние
- •Показатели вариации
- •Относительные показатели вариации
- •Выборочное наблюдение
- •Ошибка выборки
- •Малая выборка
- •Оптимальная численность выборки
- •Способы распространения характеристик выборки на генеральную совокупность
- •Способы отбора единиц из генеральной совокупности
- •Статистическое изучение взаимосвязи социально-экономических явлений Порядок изучения статистической связи. Классификация связей в статистике.
- •Количественные критерии оценки тесноты связи Таблица 1
- •Корреляционно-регрессионный анализ
- •Парная корреляция и построение однофакторной модели
- •Оценка существенности связи. Принятие решений на основе уравнения регрессии
- •Линейный коэффициент корреляции.
- •Методы изучения связи социальных явлений
- •Оценка влияния факторов на результативный признак
- •Показатели тесноты связи множественной корреляции
- •Показатели динамического ряда.
- •Средние характеристики ряда динамики
- •Изучение основной тенденции развития
- •Товарооборот предприятия по кварталам 2001-2004 г.Г., млн. Руб.
- •Среднедневная реализация, тыс. Руб.
- •Изучение сезонных колебаний
- •Агрегатная форма общего индекса.
- •Средние индексы
- •Индексы переменного и постоянного состава
- •Территориальные индексы
1) Производится группировка единиц совокупности по признаку-фактору;
2) по каждой полученной группе от6ираются соответствующие значения признака-результата и на их основе рассчитывается некоторый обобщающий показатель (чаще всего среднее значение);
3) анализируются изменения обобщающего показателя по группам и делается вывод о наличии или отсутствии взаимосвязи и ее направлении. Если изменение величены признака-фактора, положенного в основу группировки, вызывает изменение величины признака-результата в том же направлении, то связь прямая, в противном случае — связь обратная.
Приведем пример аналитической группировки студентов для характеристики зависимости признака-результата У – «оценка студента по статистике» от признака-фактора X — «посещаемость практических занятии по статистике». Исходные данные:
X 16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9
У 4 4 4 3 3 5 5 3 3 3 5 4 4 5 4 2 4 3 3 4
Результаты аналитической группировки представлены в табл.
Посещаемость
|
Количество студентов |
Оценка по статистике |
Средняя оценка студента в группе |
[0;7] |
7 |
4 5 2 3 3 3 4 |
3,4 |
(7:14] |
7 |
4 3 5 3 3 4 4 |
3,7 |
(14;16] |
6 |
4 4 4 3 5 5 |
4,2 |
Итого |
20 |
X |
X |
Анализируя данную таблицу, можно заметить прямую зависимость результативного признака У — «оценка по статистике» от признака-фактора X — «посещаемость практических занятий по статистике» чем 6ольше занятии посетил студент тем выше его оценка по статистике. Данная зависимость наблюдается в среднем по совокупности. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.
Группировки делятся на простые (построены по одному признаку) и сложные (построены по двум и более признакам).
При построении сложной группировки рекомендуется сначала производить группировку по атрибутивным признакам (значения которых имеют ярко выраженные качественные различия), а затем - по количественным.
Принципы построения статистических группировок.
Построение группировки начинается:
I) с определения состава группировочных признаков.
Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования.
В основание группировки могут быть положены как количественные, так и атрибутивные признаки. Первые имеют числовое выражение (возраст человека, доход семьи и т. д.), а вторые отражают состояние единицы совокупности (пол человека, семейное положение, отраслевую принадлежность предприятия, его форму собственности и т. д.).
необходимо определить количество групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от:
задач исследования и вида показателя, положенного в основание группировки;
численности совокупности;
степени вариации признака.
Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состоянии у этого признака. Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации.
Если группировка проводится по количественному признаку, то особое внимание обращается на число единиц исследуемого объекта и степень вариации группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как показатели, рассчитанные для таких групп, не будут представительными.
Определение числа групп можно осуществить и математическим путем с использованием формулы Стерджесса: n=1+3,322*lgN, (1)
где n - число групп;
N - число единиц совокупности.
Согласно формуле (1) выбор числа групп зависит от объема совокупности.
Недостаток формулы (1) состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному (Гаусса-Лапласа)
Другой способ определения числа групп основан на применении среднего квадратического отклонения (сигма). Если величина интервала равна 1/2 , то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 или , то совокупность делится соответственно на 9 и 6 групп. Однако при определении групп данным методом существует большая вероятность получения «пустых», или малочисленных, групп.
III) Когда определено число групп, то следует определить интервалы группировки.
Интервал - это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них, Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле: h=R/n=Xmax-Xmin/n
где хmax и хmin- максимальное и минимальное значения признака в совокупности; n - число групп.
Существуют следующие правила записи числа шага интервала. Если величина интервала рассчитанная по формуле (2), представляет собой величину, которая имеет один знак до запятой (например, 0,88; 1,585; 4,71), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере это будут соответственно значения: 0,9; 1,6; 4,7. Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой (например, 15,985), то это значение необходимо округлить до целого числа (до 16). В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 587 следует округлить до 600.
Если значение признака варьируется в широких пределах (от 10 до 1000то необходимо использовать группировку с неравными интервалами.
Например, по численности работающих предприятия могут быть разбиты на следующие группы с арифметически возрастающими величинами интервалов: до 100 человек, 100-200, 200-300, 300-500, 500-1000, 1000 и более человек, Это объясняется тем, что изменение количества работающих на 50—100 человек имеет существенное значение для мелких предприятий, а для крупных — не имеет;
Интервалы группировок могут быть закрытыми и открытыми.
Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. У открытых интервалов указана только одна граница: верхняя - у первого, нижняя - у последнего. Например, группы коммерческих банков по уровню дохода работающих в них сотрудников (чел.): до 2200, 2200 -2300, 2300 - 2400, 2400 и более.
В зависимости от того, какой признак положен в основании группировки прерывный или непрерывный границы интервалов могут быть обозначены по-разному.
Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему работ (тыс. руб.): до 1200, 1200 - 1400, 1400 - 1600, 1600 - 1800, 1800 и более), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов.
При таком обозначении границ возникает вопрос, в какую группу включать объект, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом работ 1600 тыс. руб. Если нижняя граница формируется по принципу «включительно»), а верхняя - по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае — ко второй. Для того чтобы правильно отнести к группе единицу объекта можно использовать открытые интервалы (например, группы строительных фирм по объему работ преобразуются в следующие: до 1400, 1400 - 1600, 1600 - 1800, 1800 и более). Возможны два случая обозначения открытого последнего интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае строительные фирмы с объемом работ 1800 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.
Если в основании группировки лежит прерывный признак, то нижняя граница i-го интервала равна верхней границе (i-1) интервала, увеличенной на 1. Например, до 1400, 1401 - 1600, 1601 - 1800, 1801 и более.
От группировок следует отличать классификацию. Классификацией это систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. В основу классификации кладется атрибутивный признак. Они остаются неизменными в течение длительного периода времени, и разрабатываются органами государственной и международной статистики.
Пример. Произведем анализ 30 самых малых и средних коммерческих банков одного из регионов на 01.01.2008 г.), применяя метод группировок (табл. 1)
В качестве группировочного признака возьмем уставный капитал. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле:
H=Xmax-Xmin/n = (23100-2100)/4= 5 250 тыс. руб.
Обозначим границы групп:
2 100 – 7 350 7 350–12 600
12 600–17 850 17 850–23 100
Определен группировочный признак - уставный капитал, задано число групп - 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по указанным группам, и подсчитываются итоги по группам. Результаты группировки наносятся в таблицу, и определяются общие итоги по каждому показателю (табл. 2).
Таблица 2
№ группы |
Группы банков по величине уставного капитала, тыс. руб. |
Число банков, ед. |
Работающие активы, тыс. руб. |
Капитал, тыс. руб. |
Уставный капитал, тыс. руб. |
1 |
2100-7350 |
18 |
504898 |
342889 |
71272 |
2 |
7350-12600 |
6 |
343932 |
204694 |
58227 |
3 |
12600-17850 |
3 |
174079 |
130680 |
48281 |
4 |
17850-23100 |
3 |
217842 |
128573 |
62238 |
Итого |
30 |
1240731 |
806836 |
240018 |
Структурная группировка коммерческих банков на основе данных табл.2 представ. в табл. 3
Таблица3. Структурная группировка характеризует состав однородной совокупности
№ группы |
Группы банков по величине уставного капитала, тыс. руб. |
Число банков, ед. |
Число банков в % к итогу |
Уставной капитал, % к итогу |
Капитал, % к итогу |
Работающие активы % к итогу |
1 |
2100-7350 |
18 |
60 |
29,7 |
42,5 |
40,7 |
2 |
7350-12600 |
6 |
20 |
24,3 |
25,4 |
27,7 |
3 |
12600-17850 |
3 |
10 |
20,1 |
16,2 |
14,0 |
4 |
17850-23100 |
3 |
10 |
25,9 |
15,9 |
17,6 |
Итого |
30 |
100 |
100 |
100,0 |
100,0 |
Из табл. 3 видно, что в основном преобладают малые банки –60%, на долю которых приходится 42,5% всего капитала.
Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки где признак результат величина работающих активов прямо зависим от признака фактора- величины уставного капитала (чем крупнее банк, тем эффективнее управление работающими активами.) табл. 4
№ группы |
Группы банков по величине уставного капитала, тыс. руб. |
Число банков, ед. |
Капитал, тыс. руб. |
Работающие активы, тыс. руб. |
||
Всего |
В среднем на один банк |
Всего |
В среднем на один банк |
|||
1 |
2100-7350 |
18 |
342889 |
19049 |
504898 |
28050 |
2 |
7350-12600 |
6 |
204694 |
34116 |
343932 |
57322 |
3 |
12600-17850 |
3 |
130680 |
43560 |
174079 |
58020 |
4 |
17850-23100 |
3 |
128573 |
42858 |
217842 |
72614 |
Итого |
30 |
806836 |
– |
1240731 |
– |
|
В среднем на один банк |
|
– |
26895 |
– |
41358 |
Ряды распределения
Ряды распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. Группировка, в которой для характеристики групп используется только один показатель–частота.
В зависимости от признака, положенного в основу ряда распределения, различают атрибутивные (построенные по качественным признакам) (пример, распределение студентов по полу) и вариационные ряды распределения (построенные по количественному признаку).
Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретное значение варьирующего признака. Частотами называются численности отдельных вариантов, т. е. это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1, или 100%.
В зависимости от характера вариации признака различают дискретные и интервальные ряды.
Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, распределение семей по числу детей, распределение рабочих по тарифному разряду. В случае непрерывной вариации признак может принимать определенные значения, отличающиеся друг от друга на сколь угодно малую величину. Построение интервальных вариационных рядов целесообразно при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах.
Примером такого ряда распределения может служить распределение работников организаций по уровню дохода.
Распределение работников строительной фирмы по уровню дохода в январе 2004г.
Группы работников по уровню дохода, руб. |
Число работников, чел. |
Удельный вес, % к итогу |
До 5000 |
20 |
50 |
5000-1000 |
10 |
25 |
10000-15000 |
6 |
15 |
15000 и более |
4 |
10 |
Итого |
40 |
100,0 |
Правила построения рядов распределения аналогичны правилам построения группировки.
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.
Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются значения вариантов, а по оси ординат величины частот. Полученные на пересечении абсцисс и ординат точки соединяют прямыми линиями и получают ломанную линию, называемую полигоном частот. Для замыкания полигона крайние точки (слева и справа на ломанной линии) соединяют с точками на оси абсцисс и получают многоугольник.
Гистограмма (рис.1) применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам.
Если середины верхних сторон прямоугольников соединить прямыми, то гистограмма может быть преобразована в полигон распределения (рис.2)
При построении гистограммы вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения (частота, рассчитанная на единицу ширины интервала) признака в соответствующих интервалах. Это необходимо сделать для того, чтобы получить возможности сравнивать частоты.
Для графического изображения вариационных рядов может использоваться также кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака, не большие, чем рассматриваемое значение.
При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат - накопленные частоты. Затем эти перпендикуляры соединяют и получают ломанную линию, т. е. кумуляту. Если по оси ординат откладывать варианты значений признака, а по оси абсцисс частости, то получим огиву распределения.