- •Конспект лекций по статистике
- •§5. Сезонные колебания, сезонные индексы и полное разложение дисперсии уровней динамического ряда 99
- •Глава 1. Статистика как наука
- •§1. Происхождение термина «статистика», его значение, особенности.
- •§2. Метод статистики
- •§3. Отрасли статистических наук
- •§4. Общая теория статистики как отрасль статистической науки.
- •§5. Статистический признак. Классификация.
- •§6. Понятие статистической закономерности.
- •Глава 2. Сбор статистической информации (теория статистического наблюдения)
- •§1. Понятие о статистическом наблюдении, этапы его проведения
- •§2. Программно-методологические вопросы статистического наблюдения
- •§3. Важнейшие организационные вопросы статистического наблюдения
- •§4. Основные организационные формы, виды и способы статистического наблюдения
- •§5. Точность наблюдения
- •Глава 3. Статистическая сводка и группировка §1. Задачи сводки и ее содержание
- •§2. Метод группировки и его место в системе статистических методов
- •§3. Виды статистических группировок
- •§4. Принципы построения статистических группировок и классификаций
- •§5. Ряды распределения и группировки
- •§5.1. Огива
- •§6. Сравнимость статистических группировок
- •§7. Метод группировок и многомерные классификации
- •§8. Группировки и классификации в практике статистики
- •Глава 4. Статистические таблицы §1. Элементы статистической таблицы
- •§2. Виды таблиц по подлежащему
- •§3. Виды таблиц по сказуемому
- •§4. Правила при построении таблиц
- •§5. Чтение и анализ таблицы
- •§6. Таблицы и матрицы
- •Глава 5. Статистические показатели
- •§1. Понятие, формы выражения и виды статистических показателей
- •§2. Абсолютные показатели
- •§3. Относительные показатели
- •§4. Средние показатели
- •Глава 6. Аналитическая статистика
- •§1. Структурные средние
- •1) Определение структурных средних в дискретных вариационных рядах
- •2) Определение структурных средних в интервальных вариационных рядах.
- •§2. Дисперсия
- •§4. Показатели вариации
- •§5. Относительные показатели вариации.
- •Глава 7. Корреляционно-регрессионный анализ
- •Изучение степени тесноты между двумя качественными признаками.
- •Глава 8. Выборочное наблюдение
- •Глава 9. Ряды динамики
- •Глава 10. Экономические индексы
- •§1. Понятие экономических индексов. Классификация индексов
- •§2. Индивидуальные и общие индексы
- •§3. Средние экономические индексы.
- •§4. Индексы средних величин.
- •Анализ взаимосвязей
- •Свойства коэффициента корреляции
- •Регрессионный анализ на основе комбинационной группировки
- •Оценка существенности параметров линейной регрессии и корреляции. F-критерий Фишера. Дисперсионный анализ
- •Ряды динамики Интерполяция и экстраполяция (прогнозирование) уровней ряда динамики
- •Экономические индексы
- •§1. Синтетическая и аналитическая концепции индексов
- •§2. Выбор базы и весов индексов
- •§3. Индексы пространственно-территориального сопоставления.
- •§4. Индексы Ласпейреса, Пааше, идеальный индекс Фишера
- •§5. Сезонные колебания, сезонные индексы и полное разложение дисперсии уровней динамического ряда
§4. Показатели вариации
Изменение величины признака от одной единицы совокупности к другой в статистике называют вариацией признака. Кроме средних величин для анализа исходной совокупности вычисляют абсолютные и относительные показатели вариации. К абсолютным показателям относятся:
1) Размах вариации (R) определяется, как разность между максимальным и минимальным значением признака в исходной совокупности R=Xmax-Xmin.
2) Среднее квартильное отклонение. Определяется как половина разности 3-его и 1-ого квартиля: .
3) Среднее линейное отклонение (d). Определяется, как средняя арифметическая величина из абсолютных отклонений индивидуальных значений признака от их средней величины. Применяют 2 формулы для не сгруппированных данных и сгруппированных.
Для не сгруппированных: ; для сгруппированных: .
4) Дисперсия ( ). Определяется, как средняя арифметическая величина из квадратов отклонений индивидуальных значений признака от из средней величины.
Для не сгруппированных: ; для сгруппированных: .
5) Среднее квадратическое отклонение представляет собой квадратный корень из дисперсии.
Для не сгруппированных: ; для сгруппированных: .
Среднее квадратическое отклонение показывает на сколько в среднем отличаются индивидуальные значения признака (варианты) в исходной совокупности от средней величины. Показатель среднего квадратического отклонения применяется при оценке возможного риска в финансово-экономических расчетах.
§5. Относительные показатели вариации.
1. Коэффициент квартильной вариации, который вычисляется по формуле:
2. Коэффициент осцилляции: .
3. Коэффициент вариации:
Исходная совокупность считается однородной по изучаемому признаку, если коэффициент вариации меньше 33%. В этом случае средняя величина объективно представляет свою исходную совокупность.
Глава 7. Корреляционно-регрессионный анализ
Одной из задач статистики является изучение существующих взаимосвязей между различными социально-экономическими явлениями и процессами.
При изучении этих взаимосвязей выявляются причинно-следственные отношения между явлениями или их признаками, при которых изменение причины приводит к изменению следствия. Поскольку на одно и то же социально-экономическое явление могут оказывать влияние различные факторы, то необходимо определить воздействие главных факторов, абстрагируясь от второстепенных. Признаки по их влиянию для изучения взаимосвязей подразделяются на факторные и результативные. Признаки, которые оказывают влияние на другие, связанные с ними признаки, называются факторными [х]. Признаки, которые изменяются под воздействием факторных, называются результативные [yx].
Регрессионный анализ заключается в определении аналитического выражения связи между изучаемыми признаками, а корреляционный анализ состоит в определении тесноты связи между этими признаками. Различают виды зависимости между признаками: функциональную и стохастическую. При функциональной зависимости каждому значению факторного признака соответствует только одно значение результативного признака. При стохастической зависимости каждому значению факторного признака могут соответствовать 2 и более значений результативного признака. Частным случаем стохастической зависимости является корреляционная связь.
Различают виды корреляционной зависимости между признаками:
парная корреляция, при которой изучается зависимость одного результативного признака от одного факторного признака или связь между двумя факторными признаками
частная корреляция, при которой изучается зависимость одного результативного признака от одного факторного признака, при фиксированном значении других факторных признаков
множественная корреляция, при которой изучается зависимость одного результативного признака от двух и более факторных признаков
Связи между признаками классифицируются по аналитическому выражению, направлению и степени тесноты. По аналитическому выражению различают линейную и нелинейную связь. Связь линейная. Если он может быть выражена с помощью линейной функции , в противном случае связь считается нелинейной. По направлению связи различают прямую и обратную связь. Прямая связь, при которой с увеличением (уменьшением) значений факторного признака, значения результативного признака увеличиваются (уменьшаются). В случае обратной связи между признаками, значение результативного признака изменяется под воздействием факторного в противоположном направлении. Степень тесноты связи между признаками изучается с помощью величины корреляционного отношения – [ ]. , где - межгрупповая дисперсия, - общая дисперсия; ; =1 – сильная связь между признаками; =0 – отсутствие связи.
В случае линейной зависимости между двумя признаками вместо корреляционного отношения вычисляют линейный коэффициент корреляции [r].
; ; где - средняя величина факторного признака; - средняя величина результативного признака; (n – число пар значений); и - среднее квадратическое отклонение в ряду факторного и результативного признаков; b – параметр линейной функции, выражающий зависимость результативного признака от факторного.
: - прямая связь между признаками; - обратная связь. В зависимости от величины линейного коэффициента корреляции различают следующие виды связи между признаками:
значение |
комментарий |
|
связь отсутствует |
|
связь слабая |
|
связь умеренная |
|
связь сильная |
Параметр “b” – показывает на сколько, в среднем, изменяется значение результативного признака при изменении факторного признака на 1 единицу.
Пример: По имеющимся данным составим уравнение линейной функции, выражающее зависимость среднемесячной заработной платы от уровня производительности труда в 5 отраслях промышленности в РФ за 2002 год:
Отрасль промышленности |
Уровень производительности труда (млн. руб. на 1 работника), Х |
Размер среднемесячной зарплаты (тыс. руб.), Y |
Х2 |
ХY |
Y2 |
Электроэнергетика |
0.916 |
7,49 |
0,839 |
6,86 |
56,1001 |
Топливная |
1,450 |
12,70 |
2,1025 |
18,415 |
161,29 |
Черная металлургия |
0,684 |
5,92 |
0,468 |
4,049 |
35,0464 |
Цветная металлургия |
0,780 |
9,48 |
0,6084 |
7,3944 |
89,8704 |
Машиностроение |
0,322 |
4,18 |
0,104 |
1,346 |
17,4724 |
Итого: |
4,152 |
39,77 |
4,1219 |
38,0644 |
359,7793 |
Для определения параметров a и b линейной функции, составляют систему уравнений:
; ; a=1,74; b=7,48; ; y=1,74+7,48х; ; ; ; r=0,93 – связь очень сильная и прямая.
В некоторых случаях для определения степени тесноты связи между двумя признаками вычисляют ранговые коэффициенты связи Спирмена и Кендалла. Ранжирование – процедура упорядочения объектов изучения в порядке возрастания или убывания количественных значений. Коэффициент корреляции рангов (коэффициент Спирмена):
, где - квадрат разности рангов; n – число наблюдений (число пар рангов).
Пример:
Отрасли промышленности |
X |
Y |
Rx |
Px |
di |
|
Электроэнергетика |
0,916 |
7,49 |
4 |
3 |
1 |
1 |
Топливная |
1,450 |
12,70 |
5 |
5 |
0 |
0 |
Черная М. |
0,684 |
5,92 |
2 |
2 |
0 |
0 |
Цветная М. |
0,780 |
9,48 |
3 |
4 |
-1 |
1 |
Машиностроение |
0,322 |
4,18 |
1 |
1 |
0 |
0 |
Итого: |
|
|
|
|
|
2 |
Значения факторного признака ранжируют и ранги по Х записывают строго в порядке возрастания количественных значений.
Значения результативного признака записывают строго в порядке возрастания.
Находят разность рангов: .
Полученные разности возводят в квадрат и рассчитывают их сумму.
Для вычисления коэффициента Кендалла значения факторного признака предварительно ранжируют, то есть ранги по Х записывают строго в порядке возрастания количественных значений.
Отрасли промышленности |
X |
Y |
Rx |
Px |
P |
Q |
Машиностроение |
0,322 |
4,18 |
1 |
1 |
4 |
0 |
Черная М. |
0,684 |
5,92 |
2 |
2 |
3 |
0 |
Цветная М. |
0,780 |
9,48 |
3 |
4 |
1 |
1 |
Электроэнергетика |
0,916 |
7,49 |
4 |
3 |
1 |
0 |
Топливная |
1,450 |
12,70 |
5 |
5 |
10 |
0 |
Итого: |
|
|
|
|
+9 |
-1 |
Для каждого ранга по Y находят общее количество следующих за ним рангов, больших по значению, чем данный ранг. Общее количество таких случаев учитывают со знаком “+” и обозначают P.
Для каждого ранга по Y определяют количество следующих за ним рангов, меньших по значению, чем данный ранг. Общее количество таких случаев учитывают со знаком “-” и обозначают Q.
Рассчитывают S=P+Q=9+(-1)=8
Коэффициент Кенделла вычисляют по формуле:
Коэффициент Кенделла может принимать значения от -1 до +1 и чем ближе к , тем сильнее связь между признаками.
В некоторых случаях для определения направления связи между двумя признаками вычисляют коэффициент Фехнера. Этот коэффициент основан на сравнении поведения отклонений индивидуальных значений факторного и результативного признаков от своей средней величины. Коэффициент Фехнера вычисляют по формуле:
; где сумма С – общее число совпадений знаков отклонений, сумма Н – общее число несовпадений знаков отклонений.
Отрасли промышленности |
X |
Y |
|
|
Электроэнергетика |
0,916 |
7,49 |
+ |
- |
Топливная |
1,450 |
12,70 |
+ |
+ |
Черная М. |
0,684 |
5,92 |
- |
- |
Цветная М. |
0,780 |
9,48 |
- |
+ |
Машиностроение |
0,322 |
4,18 |
- |
- |
Вычисляют среднюю величину факторного признака:
Определяют знаки отклонений индивидуальных значений факторного признака от средней величины.
Рассчитывают среднюю величину результативного признака: .
Находят знаки отклонений индивидуальных значений результативного признака от средней величины:
Вывод: связь прямая, о тесноте связи коэффициент не говорит.
Для определения степени тесноты связи между тремя ранжированными признаками вычисляют коэффициент конкордации. Он рассчитывается по формуле:
, где m – число ранжированных признаков; n – число ранжированных единиц наблюдения.
Отрасли промышленности |
X1 |
X2 |
X3 |
R1 |
R2 |
R3 |
|
|
Электроэнергетика |
970 |
669 |
7,49 |
4 |
3 |
3 |
10 |
1 |
Топливная |
774 |
1122 |
12,70 |
3 |
4 |
5 |
12 |
9 |
Черная М. |
690 |
472 |
5,92 |
2 |
2 |
2 |
6 |
9 |
Цветная М. |
569 |
444 |
9,48 |
1 |
1 |
4 |
6 |
9 |
Машиностроение |
3495 |
1126 |
4,18 |
5 |
5 |
1 |
11 |
4 |
Итог: |
|
|
|
|
|
|
45 |
32 |
X1 – число работников (тыс. чел.); X2 – объем промышленных продаж (млрд. руб.); X3 – среднемесячная зарплата.
Значения всех признаков ранжируем и ранги устанавливаем строго в порядке возрастания количественных значений.
По каждой строке определяют сумму рангов. По этому столбцу вычисляется итоговая строка.
Вычисляют .
По каждой строке находят квадраты отклонений сумм рангов и величин Т. По этому же столбцу рассчитаем итоговую строку, которую обозначим через S. Коэффициент конкордации может принимать значения от 0 до 1 и чем ближе к 1, тем сильнее связь между признаками.