- •Содержание
- •Парная линейная регрессия
- •1. Построение линейного уравнения парной регрессии
- •2. Расчет линейного коэффициента парной корреляции
- •3. Оценка линейной модели (коэффициент детерминации и f-критерий Фишера)
- •4. Оценка значимости параметров уравнения регрессии с помощью t-статистики
- •5. Точечный прогноз
- •6. Доверительный интервал прогноза
- •Список использованной литературы
2. Расчет линейного коэффициента парной корреляции
Уравнение парной линейной регрессии всегда дополняется определением коэффициента линейной корреляции:
Коэффициент линейной корреляции равен:
Полученное значение коэффициента говорит о наличии прямой корреляционной связи между продолжительностью эксперимента и длиной кристалла. Согласно шкале Чеддока, значение 0,7336 свидетельствует о сильной связи между факторами.
3. Оценка линейной модели (коэффициент детерминации и f-критерий Фишера)
Коэффициент
детерминации
равен квадрату коэффициента линейной
корреляции и показывает, какая доля
дисперсии результативного признака y
объясняется изменением факторного
признака (отражает качество подбора
линейной функции). В данном случае
коэффициент детерминации равен:
Это означает, что 53,8% дисперсии результативного признака объясняется изменением факторного признака. Полученное значение говорит о том, что линейная регрессия недостаточно точно описывает зависимость между продолжительностью эксперимента и длиной кристалла.
Оценка значимости уравнения в целом производится обычно с помощью F-критерия Фишера, значение которого вычисляется как
,
где
.
Используя коэффициент детерминации, можно вычислить значение F-критерия Фишера по формуле:
.
F-критерий Фишера равен:
Значение F-критерия для степеней свободы k1=1 и k2=31 и уровня значимости 0,05 (Fкрит) равно 4,16 (FРАСПОБР(0,05;1;31). Поскольку Fфакт>Fкрит (36.122 >4.16), нулевая гипотеза отклоняется, уравнение регрессии на уровне значимости 0,05 признается статистически значимым, а воздействие признака х на у – существенным.
При построении регрессионной модели с помощью процедуры Регрессия рассчитывается Значимость F – вероятность значения Fфакт. В данном случае эта величина равна 0. Поскольку рассчитанная значимость F ниже установленного уровня значимости, уравнение регрессии является статистически значимым.
4. Оценка значимости параметров уравнения регрессии с помощью t-статистики
Параметры a, b и коэффициент корреляции были вычислены для одной выборки, для другой выборки из той же генеральной совокупности они будут иметь другие значения, но изменчивость этих значений можно измерить с помощью величины, которая называется стандартной ошибкой. Обозначим стандартные ошибки a, b и коэффициента корреляции соответственно ma, mb и mr. Они вычисляются по формулам:
.
Значения стандартных ошибок рассчитываются автоматически при построении модели с помощью процедуры Регрессия.
Стандартная ошибка для коэффициента регрессии:
Стандартная ошибка для свободного члена:
Стандартная ошибка для коэффициента корреляции:
Оценку статистической значимости параметров a, b уравнения регрессии и коэффициента корреляции проводят с помощью t-статистики Стьюдента и построения доверительных интервалов для каждого из показателей.
Нулевая гипотеза (Н0) заключается в том, что показатели a, b и незначительно отличаются от нуля, т.е. можно считать a=b= =0.
Фактические значения t-статистики Стьюдента определяются по формулам:
T-критерий Стьюдента для коэффициента регрессии:
Критерий Стьюдента для свободного члена:
Критерий Стьюдента для коэффициента корреляции:
Фактические значения t-статистики Стьюдента сравниваются с критическими. Критическое значение t-статистики для уровня значимости 0,05 и числа степеней свободы 31 равно 2,040. Поскольку все рассчитанные значения t-статистик превышают критическое значение, параметры регрессии являются статистически значимыми.
Построим
доверительные интервалы для a
–
,
где
,
и для b
–
,
где
.
С вероятностью
параметры a
и
b,
находясь в указанных границах, не
принимают нулевых значений, т.е. не
являются статистически незначимыми и
существенно отличны от нуля.
Расчет доверительных интервалов для параметров регрессии приведен в табл. 2.
Таблица 2
Расчет доверительных интервалов для параметров регрессии
|
a |
b |
Rxy |
Стандартные ошибки |
0,0201 |
2,3600 |
0,1221 |
t-статистики (фактические) |
6,010 |
6,649 |
6,010 |
t-статистика критическая |
2,040 |
2,040 |
2,040 |
Нижняя граница доверительного интервала |
0,080 |
10,879 |
|
Верхняя граница доверительного интервала |
0,162 |
20,505 |
|
Нижняя граница доверительного интервала для параметра a:
Верхняя граница доверительного интервала для параметра a:
Доверительный интервал для параметра b рассчитывается аналогично.
