- •Оглавление
- •Введение. Статистика как наука
- •Вопрос 1. Понятие, предмет и методы статистики
- •Вопрос 2. Основные категории статистики
- •Вопрос 3. Организация государственной статистики в Российской Федерации
- •Тема 1. Статистическое наблюдение
- •Вопрос 1. Сущность и принципы статистического наблюдения
- •Вопрос 2. Основные формы, виды и способы статистического наблюдения
- •Вопрос 3. Организационно-методологические основы наблюдения
- •Тема 2. Сводка и группировка статистических данных
- •Вопрос 1. Понятие сводки и группировки в статистике
- •Вопрос 2. Основные положения теории группировок
- •2.1. Определение числа интервалов группировки данных
- •1). Для качественного (атрибутивного) группировочного признака:
- •2.2. Расчет числа и ширины интервалов группировки данных
- •Вопрос 3. Виды группировок
- •Тема 3. Статистический анализ рядов распределения
- •Вопрос 1. Понятие и виды рядов распределения
- •Вопрос 2. Графическое изображение рядов распределения
- •30 Компаний мира по размеру годового дохода
- •Тема 4. Обобщающие статистические показатели
- •Вопрос 1. Абсолютные показатели: сущность и единицы измерения
- •Вопрос 2. Относительные показатели: сущность и значение, формы выражения и виды
- •Тема 5. Средние величины
- •Вопрос 1. Сущность средних величин и правила их применения
- •Вопрос 2. Виды средних величин
- •1. Средняя арифметическая
- •Вопрос 3. Мода и медиана – структурные средние величины
- •3.1. Расчет моды в дискретных и интервальных рядах распределения по наибольшей частоте
- •3.2. Расчет медианы в дискретных и интервальных рядах по накопленным частотам
- •Вопрос 4. Показатели дифференциации признака в ряду распределения
- •Тема 6. Статистический анализ вариации признака
- •Вопрос 1. Сущность и виды показателей вариации
- •Вопрос 2. Виды дисперсий в аналитических группировках. Правило сложения дисперсий
- •Вопрос 3. Дисперсия альтернативного признака
- •Тема 7. Выборочное наблюдение
- •Вопрос 1. Сущность и виды выборочного наблюдения
- •Вопрос 2. Ошибка репрезентативности выборки
- •Вопрос 3. Способы отбора в выборочную совокупность
- •2. Механическая выборка
- •3. Типический отбор с механической выборкой
- •6. Серийная (гнездовая) выборка
- •Вопрос 4. Распространение выборочных данных на генеральную совокупность
- •Вопрос 5. Определение необходимой численности выборки
- •Тема 8. Статистические методы анализа связи социально-экономических явлений
- •Вопрос 1. Виды взаимосвязей в статистике
- •Вопрос 2. Корреляционный анализ связи
- •2.1. Аналитические методы корреляционного анализа
- •1. Метод приведения параллельных данных
- •2. Метод построения корреляционных таблиц
- •3. Графический метод
- •4. Дисперсионный анализ
- •2.2. Эмпирические методы корреляционного анализа
- •1. Коэффициент Фехнера:
- •2. Коэффициент корреляции рангов Спирмена:
- •Вопрос 3. Регрессионный анализ связи
- •1 Этап. Теоретическое обоснование регрессионной модели
- •2 Этап. Расчет параметров уравнения регрессии
- •3 Этап. Измерение тесноты связи
- •4 Этап. Проверка существенности связи
- •Тема 9. Анализ рядов динамики
- •Вопрос 1. Ряды динамики и их виды
- •Виды рядов динамики
- •Вопрос 2. Сопоставимость статистических величин
- •Вопрос 3. Показатели анализа рядов динамики
- •3.1. Расчет среднего уровня ряда
- •I. Интервальный ряд динамики
- •II. Моментный ряд динамики
- •3.2. Расчет абсолютных, относительных и средних показателей анализа рядов динамики
- •Абсолютные показатели анализа рядов динамики
- •Относительные показатели анализа рядов динамики
- •Средние показатели анализа рядов динамики
- •Вопрос 4. Приемы анализа и обработки рядов динамики
- •4.1. Приемы анализа рядов динамики
- •2. Приемы обработки рядов динамики
- •Вопрос 5. Проверка ряда динамики на наличие тренда
- •5.1. Сглаживание рядов динамики методом скользящей средней
- •5.2. Аналитическое выравнивание ряда динамики
- •Вопрос 6. Изучение сезонных колебаний в ряду динамики
- •1). Метод скользящей средней
- •2). Метод аналитического выравнивания ряда динамики:
- •Тема 10. Индексный метод анализа
- •Вопрос 1. Сущность и виды индексов
- •Вопрос 2. Построение индивидуальных и сводных индексов
- •Расчет агрегатных индексов
- •Расчет средних индексов
- •Вопрос 3. Изучение динамики явлений при помощи индексов
- •2. Общие индексы:
- •3. Абсолютное изменение товарооборота:
- •Вопрос 4. Система индексов динамики средней величины
- •Тема 11. Статистические таблицы и графики
- •Вопрос 1. Статистические таблицы и правила их построения
- •Правила построения статистических таблиц
- •Вопрос 2. Статистический график и его элементы, правила построения графиков
- •Вопрос 3. Виды статистических графиков
- •Вопрос 4. Статистические карты
- •Вопросы и задания для самопроверки
- •Тема 1. Статистическое наблюдение
- •Тема 2. Сводка и группировка статистических данных
- •Тема 3. Статистические ряды распределения
- •Тема 4. Обобщающие статистические показатели
- •Тема 5. Средние величины
- •Тема 6. Показатели вариации признака
- •Тема 7. Выборочное наблюдение
- •Тема 8. Статистические методы анализа связи
- •Тема 9. Анализ рядов динамики
- •Тема 10. Индексный метод анализа
- •Тема 11. Статистические таблицы и графики
3 Этап. Измерение тесноты связи
Измерение тесноты связи так же, как и в корреляционном анализе, основано на расчете дисперсий для аналитической группировки. Однако составляющие общей дисперсии вычисляются несколько иначе:
- общая дисперсия, измеряющая общую вариацию результативного признака за счет действия всех факторов:
. (8.7)
- факторная (теоретическая) дисперсия, измеряющая вариацию результативного признака у за счет действия факторного признака х:
. (8.8)
- остаточная дисперсия, характеризующая вариацию признака у за счет всех факторов, кроме х (т.е. при исключенном х):
. (8.9)
Согласно правилу сложения дисперсий:
. (8.10)
Оценивается теснота линейной связи с помощью ряда показателей:
1. Коэффициент детерминации – представляет собой удельный вес факторной дисперсии в общей и характеризует не всю вариацию у от факторного признака х, а лишь ту ее часть, которая соответствует линейному уравнению регрессии, т.е. показывает удельный вес вариации результативного признака, линейно связанной с вариацией факторного признака:
. (8.11)
2. Индекс корреляции (теоретическое корреляционное отношение) – характеризует тесноту корреляционной зависимости, т.е. степень ее приближения к функциональной связи:
. (8.12)
Если R = 1 – связь функциональная (, =0 – эмпирически значения уi совпадают с ух, линия регрессии проходит через все эмпирические точки);
R = 0 – связь отсутствует (=0 – все теоретические значения ух совпадают со средними значениями у и линия регрессии проходит параллельно оси абсцисс);
R 0,3 – связь слабая;
R 0,7 – связь тесная.
Индекс корреляции пригоден для измерения тесноты связи при любой ее форме. Выравнивая уi по разным функциям, можно по величине дисперсии, характеризующей остаточную вариацию (2у/х) судить о том, какая функция в наилучшей степени выравнивает эмпирическую линию связи (предпочтение отдается форме связи с меньшим значением остаточной дисперсии 2у/х).
3. Линейный коэффициент корреляции – частный случай общего индекса корреляции. Его применение ограничено только линейной формой связи, однако он характеризует не только тесноту, но и направление связи:
. (8.13)
После преобразований он может быть представлен в более удобном виде:
. (8.14)
r=-1…0 – связь обратная; r=0…+1 – связь прямая; |
r1 – связь близка к функциональной. |
Важно! При правильном подсчете численные значения индекса корреляции и линейного коэффициента корреляции практически совпадают. |
Тогда коэффициент регрессии для уравнения прямой можно определить по формуле:
. (8.15)
4 Этап. Проверка существенности связи
При проверке существенности связи в регрессионном анализе применяются те же критерии, что и в аналитической группировке – критерий Фишера:
или . (8.16)
где v1=s-1, v2=n-s;
n – число единиц совокупности;
s – число параметров уравнения регрессии (для уравнения прямой s=2).
Полученные значения Fрасч сравниваются с критическими значениями (табличными) Fкр: если Fрасч Fкр , то существенность связи подтверждается.
Следует учитывать, что в регрессионной модели, как и в аналитической группировке, результаты проверки существенности связи являются корректными лишь в том случае, если признак у имеет распределение, близкое к нормальному.
Пример.
1 этап. На основании рисунка 10.1 предположим, что связь между стажем работы и уровнем оплаты труда рабочих описывается линейным уравнением регрессии .
2 этап. Для расчета коэффициентов a0, a1 построим таблицу вспомогательных расчетов 8.4.
Таблица 8.4.
Таблица вспомогательных расчетов для уравнения регрессии
№ рабочего
|
№ рабочего п/п i |
Стаж работы рабочего, лет xi |
Среднемесячный уровень оплаты труда, тыс. руб. yi |
Вспомогательные расчеты |
|||
xi ∙ yi |
|
Выровненные значения по уравнению прямой
|
|
||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
1 |
0 |
3,5 |
0 |
0 |
3,445 |
0,0030 |
2 |
2 |
0 |
3,7 |
0 |
0 |
3,445 |
0,0649 |
3 |
3 |
0 |
3,8 |
0 |
0 |
3,445 |
0,1259 |
18 |
4 |
0 |
3,5 |
0 |
0 |
3,445 |
0,0030 |
28 |
5 |
0 |
3,7 |
0 |
0 |
3,445 |
0,0649 |
4 |
6 |
1 |
3,5 |
3,5 |
1 |
3,841 |
0,1161 |
5 |
7 |
1 |
3,8 |
3,8 |
1 |
3,841 |
0,0017 |
6 |
8 |
1 |
3,9 |
3,9 |
1 |
3,841 |
0,0035 |
7 |
9 |
2 |
4,1 |
8,2 |
4 |
4,236 |
0,0186 |
8 |
10 |
2 |
4,5 |
9 |
4 |
4,236 |
0,0695 |
20 |
11 |
2 |
4,1 |
8,2 |
4 |
4,236 |
0,0186 |
24 |
12 |
2 |
4,1 |
8,2 |
4 |
4,236 |
0,0186 |
9 |
13 |
3 |
4,6 |
13,8 |
9 |
4,632 |
0,0010 |
10 |
14 |
3 |
4,6 |
13,8 |
9 |
4,632 |
0,0010 |
11 |
15 |
3 |
4,7 |
14,1 |
9 |
4,632 |
0,0046 |
12 |
16 |
3 |
4,7 |
14,1 |
9 |
4,632 |
0,0046 |
13 |
17 |
3 |
4,7 |
14,1 |
9 |
4,632 |
0,0046 |
19 |
18 |
3 |
4,6 |
13,8 |
9 |
4,632 |
0,0010 |
23 |
19 |
3 |
3,7 |
11,1 |
9 |
4,632 |
0,8684 |
30 |
20 |
3 |
4,7 |
14,1 |
9 |
4,632 |
0,0046 |
14 |
21 |
4 |
4,9 |
19,6 |
16 |
5,027 |
0,0162 |
15 |
22 |
4 |
4,7 |
18,8 |
16 |
5,027 |
0,1072 |
16 |
23 |
4 |
4,9 |
19,6 |
16 |
5,027 |
0,0162 |
17 |
24 |
4 |
4,5 |
18 |
16 |
5,027 |
0,2782 |
25 |
25 |
4 |
4,5 |
18 |
16 |
5,027 |
0,2782 |
21 |
26 |
5 |
5,0 |
25 |
25 |
5,423 |
0,1789 |
26 |
27 |
5 |
5,2 |
26 |
25 |
5,423 |
0,0497 |
22 |
28 |
5 |
6,0 |
30 |
25 |
5,423 |
0,3329 |
27 |
29 |
5 |
6,3 |
31,5 |
25 |
5,423 |
0,7692 |
29 |
30 |
5 |
6,5 |
32,5 |
25 |
5,423 |
1,1600 |
|
Сумма |
80 |
135 |
392,7 |
296 |
135 |
4,585 |
|
Среднее |
2,67 |
4,5 |
13,09 |
– |
4,5 |
0,164 |
Составим систему нормальных уравнений:
Решив систему уравнений, получаем значения параметров:
=3,445 ; =0,396.
Таким образом, уравнение связи принимает вид: . Подставляя в него поочередно все значения стажа работы xi, получаем теоретические значения оплаты труда (выровненные по уравнению прямой) (графа 3 таблицы 8.4). Правильность произведенных расчетов подтверждает тот факт, что сумма теоретических уровней ряда равна сумме фактических уровней:
135 тыс. руб.
Параметр – коэффициент регрессии – показывает, что при изменении стажа работы на 1 год средний размер оплаты труда увеличивается в среднем на 0,396 тыс. руб. (396 руб.).
Коэффициент эластичности показывает, что при увеличении стажа работы на 1% размер оплаты труда увеличивается в среднем на 0,23%.
Оценим среднюю квадратическую ошибку уравнения регрессии ():
тыс. руб.,
где s – число параметров уравнения регрессии (для уравнения прямой s=2).
Поскольку у (у= тыс. руб.), то использование данного уравнения регрессии является целесообразным.
Отдельно оценим средние квадратические ошибки параметров уравнения регрессии по формулам (10.6):
тыс. руб.; тыс. руб./год,
где (лет);
Нанесем фактические и теоретические значения оплаты труда, а также линию среднего размера оплаты труда на график (рис. 8.2).
Рис. 8.2. Эмпирические линии регрессии фактических и теоретических значений оплаты труда рабочих в зависимости от стажа работы, постоянная средняя линия
Как видно из рисунка 8.2, переменная средняя сильно отличается от постоянной средней, что говорит о значительном влиянии фактора х (стажа работы) на результативный признак y (уровень оплаты труда). Однако несовпадение линии теоретических и фактических значений уровня оплаты говорит о том, что связь между стажем и уровнем оплаты труда не функциональная (не полная).
Измерим, насколько связь близка к функциональной.
3 этап. Измерение тесноты связи
Рассчитаем все виды дисперсий:
- общая дисперсия, измеряющая общую вариацию результативного признака за счет действия всех факторов:
- факторная (теоретическая) дисперсия, измеряющая вариацию результативного признака у за счет действия факторного признака х:
- остаточная дисперсия, характеризующая вариацию признака у за счет всех факторов, кроме х (т.е. при исключенном х):
Проверим, выполняется ли правило сложения дисперсий:
0,152 + 0,432 = 0,584 (верно).
Оценим тесноту связи численно с помощью ряда показателей:
1. Коэффициент детерминации:
- удельный вес вариации результативного признака (уровня отплаты труда), линейно связанной с вариацией факторного признака (стажа работы), составляет 74%.
2. Индекс корреляции (теоретическое корреляционное отношение) составляет:
- поскольку численное значение индекса корреляции больше 0,7, то линейная связь между стажем работы и уровнем оплаты труда рабочих тесная.
3. Линейный коэффициент корреляции:
,
где ;
(лет); тыс. руб.;
(лет);
тыс. руб.
.
Поскольку линейный коэффициент корреляции положителен, то связь между признаками прямая, т.к. он больше 0,7 – связь тесная.
4 этап. Проверка существенности связи с использованием критерия Фишера:
где s – число параметров уравнения регрессии (у прямой два параметра).
В данном примере расчетное значение критерия Фишера Fкр =4,2. Поскольку полученное значение Fрасч Fкр , то существенность линейной связи между стажем работы и размером оплаты труда рабочих подтверждается.