- •Методические рекомендации по разделам курса
- •Тема 1. Сводка и группировка статистических материалов. Статистические таблицы и графики
- •Процентные ставки и кредиты банков
- •Распределение банков по размеру кредитов
- •Распределение банков по величине процентной ставки и сумме выданных кредитов
- •Тема 2. Абсолютные и относительные показатели
- •Тема 3. Средние величины и показатели вариации
- •Процентные ставки и доходы банков
- •Купюрное строение денег
- •Остатки вкладов на начало месяца, млн руб.
- •Капитал коммерческих банков
- •Капитал коммерческих банков
- •Тема 4. Ряды динамики
- •1 2 3 4 5 6 7 8 9 T, время
- •Тема 5. Индексы
- •Исчисление индексов цен
- •Тема 6. Выборочный метод
- •Тема 7. Статистическое изучение взаимосвязей
- •Список литературы
- •Статистика
- •630039, Новосибирск, ул. Никитина, 155
Тема 7. Статистическое изучение взаимосвязей
Задача. Имеются данные по восьми фирмам о часовой оплате труда х и уровне текучести кадров у. Необходимо измерить тесноту связи между х и у.
Расчетная таблица для определения линейного коэффициента корреляции
-
№ п/п
Часовая оплата труда, руб. х
Уровень текучести кадров, % у
х2
ху
у2
1
30
34
2
40
35
3
50
33
4
60
28
5
70
20
6
80
24
7
90
15
8
100
11
Σ
520
200
Средняя величина
Предположив линейную зависимость между ними, сначала рассчитаем σx и σy:
Линейный коэффициент корреляции:
Таким образом, получен результат: r = ______, что позволяет сделать вывод о том, что между оплатой труда х и уровнем текучести кадров у существует сильная ________ связь, т.е. с увеличением оплаты труда текучесть кадров снижается.
Проверка коэффициента корреляции на значимость (существенность)
Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, как и сами значения х и у, на основе которых он рассчитан, т.е., как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями.
Для того чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции σr.
Оценка существенности (значимости) линейного коэффициента корреляции основана на сопоставлении значения r с его средней квадратической ошибкой:
Укажем особенности расчета этого критерия в зависимости от числа наблюдений (объема выборки) – n.
1. Если число наблюдений достаточно велико (n > 50) и есть основания полагать, что выборка осуществлена из нормальной совокупности, то средняя ошибка коэффициента корреляции рассчитывается по следующей приближенной формуле:
.
Обычно при большом n, если коэффициент корреляции r превышает свою среднюю ошибку σr.больше чем в 3 раза, т.е.
он считается значимым (существенным), а связь - реальной. Задавшись определенной вероятностью, можно определить доверительные пределы (границы) r. Так, при вероятности 0,95, для которой коэффициент доверия t = 1.96, доверительные границы r составят:
При вероятности 0,997, для которой коэффициент доверия t = 3, доверительные границы r составят:
Поскольку значение r не может превышать единицу, то в случае, если следует указывать только нижний предел, т.е. утверждать, что реальный r не менее чем
2. При небольшом числе наблюдений (n < 30) средняя ошибка линейного коэффициента корреляции определяется как:
а значимость r проверяется на основе t-критерия Стьюдента. При этом выдвигается и проверяется нулевая гипотеза о равенстве коэффициента корреляции нулю, т.е. гипотеза об отсутствии связи между х и у в генеральной совокупности. Для этого определяется расчетное значение критерия:
и сопоставляется с tтабл.
Если нулевая гипотеза верна, т.е. r = 0, то распределение t-критерия подчиняется закону Стьюдента (с заданными параметрами: уровнем значимости α, принимаемым обычно за 0,05, и числом степеней свободы v = n – 2). Поэтому в каждом конкретном случае по таблице распределения t-критерия Стьюдента находится критическое значение t, которое допустимо при справедливости нулевой гипотезы, и с ним сравнивается фактическое (расчетное) значение t.
Если tрасч>tтабл, то нулевая гипотеза отвергается и линейный коэффициент считается значимым, а связь между х и у - реальной.
Если tрасч<tтабл, то нулевая гипотеза не отвергается и коэффициент корреляции считается незначимым, т.е. считается, что связь между х и у отсутствует, и значение r отличное от нуля, получено случайно.
Проверим на значимость рассчитанный в нашем случае линейный коэффициент корреляции. Так как n = 8, r = ______, средняя ошибка коэффициента корреляции:
Отсюда:
По таблице находим (при α = 0,05 и числе степеней свободы v = 8 – 2 = 6: tтабл = 2.4469).
Так как полученное tрасч =______ > tтабл = 2,4469, то нулевая гипотеза об отсутствии связи между х и у в генеральной совокупности отвергается, т.е. мы делаем вывод, что коэффициент корреляции значим и существенно отличается от нуля, подтверждая тем самым реальную связь между х и у.