
- •Глава 1. Применение математического ожидания и стандартного
- •Глава 2. Линейная регрессия стр. 5
- •Глава 3. Временные ряды стр. 20
- •Глава 1. Применение математического ожидания и стандартного отклонения для оценки риска
- •Глава 2. Линейная регрессия
- •1. Простая модель линейной регрессии
- •2. Ошибки
- •3. Коэффициент корреляции пирсона. Коэффициент детерминации
- •4. Предсказания и прогнозы на основе линейной модели регрессии
- •5. Основные предпосылки модели парной линейной регрессии
- •6. Процедура испытания гипотез
- •7. Испытание гипотезы для оценки линейности связи
- •7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
- •7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
- •8. Доверительные интервалы в линейном регрессионном анализе
- •9. Регрессия и ms excel
- •Глава 3. Временные ряды
- •1. Анализ аддитивной модели
- •2. Анализ мультипликативной модели
- •3. Преимущества и недостатки метода скользящей средней
- •Список вопросов для зачета
7. Испытание гипотезы для оценки линейности связи
Между переменными x, y предполагается наличие линейной связи y = α + βx + ε, где ошибка ε — это отклонение значения y от линии y = α + βx. Мы производим парную выборку значений переменных x, y и методом наименьших квадратов получаем оценки коэффициентов α и β – a и b соответственно. Очевидно, что для другой выборки оценки a и b будут другими. Как, зная оценки a и b, убедиться, что Связь между переменными x, y действительно линейная?
7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
Показатель наличия линейной связи в генеральной совокупности – это коэффициент корреляции. Для генеральной совокупности он равен ρ. Нам это значение неизвестно. По данным выборки мы Получаем оценку для ρ – выборочный коэффициент корреляции r – и на основании r проводим испытание гипотезы о наличии линейной связи между переменными x, y в генеральной совокупности. Наш вывод о наличии линейной связи между переменными x, y генеральной совокупности зависит от объема выборки. Чем больше чем нашей выборки, тем надежнее полученный результат.
H0: ρ = 0, то есть между переменными x, у отсутствует линейная связь в генеральной совокупности.
H1: ρ ≠ 0, то есть между переменными x, у есть линейная связь в генеральной совокупности.
Задается доверительная вероятность p. Пусть n — объем парной выборки. Двусторонняя проверка, α = (1 – p)/2.
По таблице t-распределения находим tα; n-2. В Excel для двусторонней проверки tα; n-2 = СТЬЮДРАСПОБР (1 – p; n – 2), для односторонней проверки tα; n-2 = СТЬЮДРАСПОБР (2×(1 – р); n – 2).
Граничные точки tα; n-2.
Статистика t = √r2(n – 2)/(1 – r2).
Пример 4. Вернемся к примерам 1, 2. Проверим гипотезу о наличии линейной связи между переменными x, y в генеральной совокупности. Доверительная вероятность p = 95%. n = 5.
H0: ρ = 0, то есть между переменными x, у отсутствует линейная связь в генеральной совокупности.
H1: ρ ≠ 0, то есть между переменными x, у есть линейная связь в генеральной совокупности.
Проведем двустороннюю проверку.
α = (1 – p)/2 (1 – 0,95)/2 = 0,025.
По таблице t-распределения находим tα; n-2 = t0,025; 5-2 = 3,182. Граничные точки ±3,182.
Статистика t = √r2(n – 2)/(1 – r2) = √0,817× (5 – 2)/(1 – 0,817) ≈ 3,660.
Отметим значения на числовой оси.
H0 H1 2 ,5% |
H0 9 5% |
H0 H1 2 ,5% |
-3,182 |
3,182 |
3,660 |
Мы отклоняем гипотезу H0 и принимаем гипотезу H1 на уровне значимости 5%. Между переменными x, y есть линейная связь в генеральной совокупности.
7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
В случае парной линейной регрессии функция показателя наклона β аналогична функции коэффициента корреляции. Поэтому нужно ограничиться только одной проверкой.
H0: β = 0, то есть между переменными x, y отсутствует линейная связь в генеральной совокупности.
H1: β ≠ 0, то есть между переменными x, y есть линейная связь в генеральной совокупности.
Задается доверительная вероятность p. п — объем парной выборки. Проведем двустороннюю проверку. В этом случае а = (1 — р)/2. По таблице t-распределения находим tα; n-2. Граничные точки ± tα; n-2 .
Дисперсия распределения
остатков вдоль линии регрессии
,
S
– стандартная ошибка.
Стандартная ошибка коэффициента b:
Статистика t = b/Sb.
Пример 5. Вернемся к примерам 1, 2. Проверим гипотезу о наличии линейной связи между переменными x, у в генеральной совокупности. Доверительная вероятность p = 95%. n = 5.
H0: β = 0, то есть между переменными x, y отсутствует линейная связь в генеральной совокупности.
H1: β ≠ 0, то есть между переменными x, y есть линейная связь в генеральной совокупности.
Проведем двустороннюю проверку.
α = (1 – р)/2 = (1 – 0,95)/2 = 0,025.
По таблице t-распределения находим tα; n-2 = t0,025; 5-2 = 3,182. Граничные точки ±3,182.
Номер |
ei |
ei2 |
1 |
0 |
0 |
2 |
-0,09 |
0,0081 |
3 |
0,12 |
0,0144 |
4 |
0,03 |
0,0009 |
5 |
-0,06 |
0,0036 |
Сумма |
|
0,0270 |
Статистика t = b/Sb = -0,11/0,03 ≈ 3,667.
Отметим значения на числовой оси.
H0 H1 2 ,5% |
H0 9 5% |
H0 H1 2,5% |
-3,667 |
-3,182 |
3,182 |
Мы отклоняем гипотезу H0 и принимаем гипотезу H1 на уровне значимости 5%. Между переменными x, y есть линейная связь в генеральной совокупности.
Замечание. Для
расчета стандартной ошибки вместо
формулы
можно воспользоваться
статистической функцией СТОШУХ
(изв_знач_y;
изв_знач_x)
мастера функций fx
пакета Excel.