
- •Теория вероятностей. Математическая статистика часть 2
- •Isbn Севмашвтуз, 2007
- •Введение
- •1. Выборки и их характеристики
- •Предмет математической статистики
- •1.2. Генеральная и выборочная совокупности
- •1.3. Статистическое распределение выборки
- •1.4. Эмпирическая функция распределения
- •1.5. Графическое изображение статистического распределения
- •2. Статистическое оценивание
- •2.1. Точечные оценки. Выборочная средняя и выборочная дисперсия
- •2.2. Метод моментов
- •2.3. Метод максимального правдоподобия
- •В случае пуассоновского распределения
- •2.4. Интервальное оценивание параметров
- •3. Проверка статистических гипотез
- •3.1. Задачи статистической проверки гипотез
- •3.2. Статистическая гипотеза. Статистический критерий
- •3.3. Проверка гипотез о законе распределения
- •4. Корреляционно-регрессионный анализ
- •Понятие о корреляционной и регрессионной связи
- •Коэффициент корреляции
- •4.3. Линейная парная регрессия.
- •Указания к выполнению контрольной работы
- •Варианты заданий для контрольной работы
- •Пример выполнения контрольной работы
- •Решение.
- •Решение.
- •Список рекомендуемой литературы
- •Продолжение приложения 2
- •Часть 2
- •164500, Г. Северодвинск, ул. Воронина, д.6
4. Корреляционно-регрессионный анализ
Понятие о корреляционной и регрессионной связи
Различают два вида зависимостей между экономическими явлениями: функциональную и корреляционную (статистическую).
При
функциональной зависимости каждому
значению независимой переменной
соответствует вполне определенное
значение зависимой переменной
.
В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость получила название статистической (или стохастической, вероятностной)
Статистическую зависимость называют корреляционной, если при изменении значений одной величины меняется среднее значение другой.
При сравнении функциональных и корреляционных зависимостей следует иметь в виду, что при функциональной зависимости, зная , можно вычислить величину , а при корреляционной зависимости устанавливается лишь тенденция изменения при изменении .
Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей регрессионного анализа является установление формы и изучение зависимости между переменными. Основной задачей корреляционного анализа – выявление связи между случайными величинами и оценка тесноты связи.
Коэффициент корреляции
Для характеристики корреляционной зависимости между случайными величинами вводится понятие коэффициента корреляции .
Коэффициент корреляции между двумя случайными величинами и вычисляется по формуле:
,
где
,
-
средние квадратические отклонения
случайных величин
соответственно.
Отметим некоторые свойства коэффициента корреляции:
Если независимые случайные величины, то коэффициент корреляции равен нулю.
Коэффициент корреляции принимает значения на отрезке
, то есть
. В зависимости от того, насколько
приближается к 1, в математической статистике различают (шкала Шеддока): связи нет (
), связь слабую (
), умеренную (
), тесную
и очень тесную
.
Если
, то между случайными величинами имеет место функциональная, а именно линейная зависимость.
Коэффициент корреляции указывает на направление связи. Если
, то связь прямая, если
отрицателен, то это свидетельствует о наличии обратной связи.
Квадрат коэффициента корреляции называется коэффициентом детерминации:
.
Коэффициент
детерминации
показывает, какая часть общей вариации
обусловлена вариацией
.
Пример 15. С целью анализа влияния заработной платы на текучесть рабочей силы на пяти однотипных предприятиях проведены измерения уровня зарплаты (тыс.руб.) и числа уволившихся за год рабочих :
|
3 |
4 |
5 |
5,5 |
6 |
|
60 |
35 |
20 |
20 |
15 |
Определить степень влияния заработной платы на текучесть рабочей силы.
Решение.
Для определения тесноты связи вычислим коэффициент корреляции, для чего составим расчетную таблицу:
-
1
2
3
4
5
6
1
3
60
9
3600
180
2
4
35
16
1225
140
3
5
20
25
400
100
4
5,5
20
30,25
400
110
5
6
15
36
225
90
23,5
150
116,25
5850
620
Так как коэффициент корреляции рассчитывается по формуле
, то:
1. Найдем средние значения: (сумма значений второго столбца, деленная на число строк:
;
среднее
значение
(сумма значений третьего столбца,
деленная на число строк):
;
среднее
значение
(среднее значение шестого столбца):
.
2.
Найдем средние квадратические отклонения
:
где рассчитывается как среднее значение четвертого столбца.
Аналогично
,
где
- среднее значение пятого столбца.
3. Подставляя найденные значения в формулу коэффициента корреляции, получим:
.
Таким
образом, можно сделать вывод, что связь
между заработной платой и текучестью
рабочей силы очень тесная и обратная,
так как полученный коэффициент корреляции
отрицательный. Это говорит о том, что
чем меньше заработная плата (
),
тем больше число уволившихся.
Выясним, какая часть вариации обусловлена вариацией . Вычислим коэффициент детерминации:
.
То есть вариации текучести рабочей силы ( ) на 92% обусловлена вариацией заработной платы ( ).