Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Линейная регрессия_316862.doc
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
373.25 Кб
Скачать

2. Расчет линейного коэффициента парной корреляции

Уравнение парной линейной регрессии всегда дополняется определением коэффициента линейной корреляции:

Коэффициент линейной корреляции равен:

Полученное значение коэффициента говорит о наличии прямой корреляционной связи между продолжительностью эксперимента и длиной кристалла. Согласно шкале Чеддока, значение 0,7336 свидетельствует о сильной связи между факторами.

3. Оценка линейной модели (коэффициент детерминации и f-критерий Фишера)

Коэффициент детерминации равен квадрату коэффициента линейной корреляции и показывает, какая доля дисперсии результативного признака y объясняется изменением факторного признака (отражает качество подбора линейной функции). В данном случае коэффициент детерминации равен:

Это означает, что 53,8% дисперсии результативного признака объясняется изменением факторного признака. Полученное значение говорит о том, что линейная регрессия недостаточно точно описывает зависимость между продолжительностью эксперимента и длиной кристалла.

Оценка значимости уравнения в целом производится обычно с помощью F-критерия Фишера, значение которого вычисляется как

,

где .

Используя коэффициент детерминации, можно вычислить значение F-критерия Фишера по формуле:

.

F-критерий Фишера равен:

Значение F-критерия для степеней свободы k1=1 и k2=31 и уровня значимости 0,05 (Fкрит) равно 4,16 (FРАСПОБР(0,05;1;31). Поскольку Fфакт>Fкрит (36.122 >4.16), нулевая гипотеза отклоняется, уравнение регрессии на уровне значимости 0,05 признается статистически значимым, а воздействие признака х на у – существенным.

При построении регрессионной модели с помощью процедуры Регрессия рассчитывается Значимость F – вероятность значения Fфакт. В данном случае эта величина равна 0. Поскольку рассчитанная значимость F ниже установленного уровня значимости, уравнение регрессии является статистически значимым.

4. Оценка значимости параметров уравнения регрессии с помощью t-статистики

Параметры a, b и коэффициент корреляции были вычислены для одной выборки, для другой выборки из той же генеральной совокупности они будут иметь другие значения, но изменчивость этих значений можно измерить с помощью величины, которая называется стандартной ошибкой. Обозначим стандартные ошибки a, b и коэффициента корреляции соответственно ma, mb и mr. Они вычисляются по формулам:

.

Значения стандартных ошибок рассчитываются автоматически при построении модели с помощью процедуры Регрессия.

Стандартная ошибка для коэффициента регрессии:

Стандартная ошибка для свободного члена:

Стандартная ошибка для коэффициента корреляции:

Оценку статистической значимости параметров a, b уравнения регрессии и коэффициента корреляции проводят с помощью t-статистики Стьюдента и построения доверительных интервалов для каждого из показателей.

Нулевая гипотеза (Н0) заключается в том, что показатели a, b и незначительно отличаются от нуля, т.е. можно считать a=b= =0.

Фактические значения t-статистики Стьюдента определяются по формулам:

T-критерий Стьюдента для коэффициента регрессии:

Критерий Стьюдента для свободного члена:

Критерий Стьюдента для коэффициента корреляции:

Фактические значения t-статистики Стьюдента сравниваются с критическими. Критическое значение t-статистики для уровня значимости 0,05 и числа степеней свободы 31 равно 2,040. Поскольку все рассчитанные значения t-статистик превышают критическое значение, параметры регрессии являются статистически значимыми.

Построим доверительные интервалы для a , где , и для b , где . С вероятностью параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.

Расчет доверительных интервалов для параметров регрессии приведен в табл. 2.

Таблица 2

Расчет доверительных интервалов для параметров регрессии

a

b

Rxy

Стандартные ошибки

0,0201

2,3600

0,1221

t-статистики (фактические)

6,010

6,649

6,010

t-статистика критическая

2,040

2,040

2,040

Нижняя граница доверительного интервала

0,080

10,879

 

Верхняя граница доверительного интервала

0,162

20,505

 

Нижняя граница доверительного интервала для параметра a:

Верхняя граница доверительного интервала для параметра a:

Доверительный интервал для параметра b рассчитывается аналогично.