Простая линейная регрессия
Простая линейная регрессия используется для исследования зависимости двух переменных.
Для определения оценок параметров в уравнении используем метод наименьших квадратов (МНК).
yi = a0 + a1xi + i Y = 11,5 + 1,4x + 2ε
|
Y |
X |
2 |
|
21,464284 |
6,5 |
0,764000366 |
|
26,784284 |
10,3 |
0,201361126 |
|
23,144284 |
7,7 |
1,192968535 |
|
34,484284 |
15,8 |
1,798211615 |
|
22,724284 |
7,4 |
1,769219031 |
|
32,384284 |
14,3 |
1,916928617 |
|
33,924284 |
15,4 |
0,028992584 |
|
41,904284 |
21,1 |
0,814844203 |
|
43,304284 |
22,1 |
1,726493118 |
|
29,164284 |
12 |
0,277169103 |
|
25,664284 |
9,5 |
0,490066225 |
|
23,704284 |
8,1 |
0,090945158 |
|
24,124284 |
8,4 |
0,064760277 |
|
33,784284 |
15,3 |
0,328257088 |
|
18,384284 |
4,3 |
0,439222388 |
|
25,384284 |
9,3 |
0,034180731 |
|
20,344284 |
5,7 |
0,570085757 |
|
30,424284 |
12,9 |
0,686178167 |
|
19,504284 |
5,1 |
1,107272561 |
|
17,684284 |
3,8 |
0,714743492 |
|
36,304284 |
17,1 |
0,743675039 |
|
23,844284 |
8,2 |
0,711203345 |
|
23,704284 |
8,1 |
1,820612201 |
|
28,744284 |
11,7 |
0,932035279 |
|
30,564284 |
13 |
0,852320933 |
|
33,784284 |
15,3 |
0,607806635 |
|
31,264284 |
13,5 |
1,951414533 |
|
27,064284 |
10,5 |
1,613330485 |
|
22,584284 |
7,3 |
1,982482376 |
|
31,684284 |
13,8 |
0,512527848 |
|
26,924284 |
10,4 |
1,903378399 |
|
26,644284 |
10,2 |
0,10687582 |
|
37,564284 |
18 |
1,410077212 |
|
31,684284 |
13,8 |
1,633045442 |
|
20,764284 |
6 |
1,945005646 |
|
29,024284 |
11,9 |
0,93264565 |
|
25,524284 |
9,4 |
0,600421155 |
|
31,544284 |
13,7 |
1,500412 |
|
29,164284 |
12 |
0,702963347 |
|
28,604284 |
11,6 |
1,551316874 |
|
25,104284 |
9,1 |
0,148686178 |
|
21,604284 |
6,6 |
0,396862697 |
|
23,004284 |
8,1 |
0,128116703 |
|
26,224284 |
11,7 |
0,716696677 |
|
32,944284 |
13 |
0,974089785 |

ryx = a1sx/sy
sx
=
,
sy
=
,

Xсредн= 11,07556
Yсредн=27,87006
a1=2.516358 a0=25.3537 Sx =3.327996 Sy=5.27921 R=ryx=1.586303 F=43
Y = 22.35+ 2.51xi
Полученное уравнение регрессии: Y = 22.35+ 2.51xi
Вывод. Степень связи Rнаходиться в интервале 0,1-0,3. Это означает, что менее 50% вариации результирующей переменной объяснятся случайными факторами.
Проверка статистических гипотез.
Для проверки статистических гипотез применим: H0: mx=myH1: mx≠my
И проведём несколько тестов для их проверки.
Двухвыборочный z-тест для средних
Дисперсия
для автомата 1:
=
5 мм2.
Дисперсия
для автомата 2:
=7
мм2.
Уровень
значимости
=
0,05.
,

|
Автомат 1 |
182,3 |
183,0 |
181,8 |
181,4 |
181,8 |
181,6 |
183,2 |
182,4 |
182,5 |
179,7 |
179,9 |
181,9 |
182,8 |
183,4 |
|
Автомат 2 |
185,3 |
185,6 |
184,8 |
186,2 |
185,8 |
184,0 |
184,2 |
185,2 |
184,2 |
|
|
|
|
|
|
Двухвыборочный z-тест для средних |
| ||
|
|
|
| |
|
|
Переменная 1 |
Переменная 2 | |
|
Среднее |
181,9786 |
185,0333 | |
|
Известная дисперсия |
5 |
7 | |
|
Наблюдения |
14 |
9 | |
|
Гипотетическая разность средних |
0 |
| |
|
z |
-2,86744 |
| |
|
P(Z<=z) одностороннее |
0,002069 |
| |
|
z критическое одностороннее |
1,644854 |
| |
|
P(Z<=z) двухстороннее |
0,004138 |
| |
|
z критическое двухстороннее |
1,959964 |
| |
Вывод. Поскольку zкрит < zрасч, то гипотезу H0 (о равности средних значений) отвергаем и применяем гипотезу H1 (о их неравности) принимая во внимание мощность критерия (1-β) и двусторонний критерий при уровне значимости 0,05.
|
Старая технология |
308 |
308 |
307 |
308 |
304 |
307 |
307 |
308 |
307 |
|
|
|
|
|
Новая технология |
308 |
304 |
306 |
306 |
306 |
304 |
304 |
304 |
306 |
304 |
303 |
304 |
303 |
Уровень
значимости
=
0,05




|
4.2Двухвыборочный t-тест с одинаковыми дисперсиями | |||
|
|
|
| |
|
|
Переменная 1 |
Переменная2 | |
|
Среднее |
307,1111 |
304,5455 | |
|
Дисперсия |
1,611111 |
1,472727 | |
|
Наблюдения |
9 |
11 | |
|
Объединенная дисперсия |
1,959829 |
| |
|
Гипотетическая разность средних |
0 |
| |
|
df |
18 |
| |
|
t-статистика |
4,608459 |
| |
|
P(T<=t) одностороннее |
0,00109 |
| |
|
t критическое одностороннее |
1,734064 |
| |
|
P(T<=t) двухстороннее |
0,000218 |
| |
|
t критическое двухстороннее |
2,100922 |
| |
|
Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.
| |||
|
Двухвыборочный t-тест с различными дисперсиями |
| ||
|
|
|
| |
|
|
Переменная 1 |
Переменная2 | |
|
Среднее |
307,11 |
304,7692 | |
|
Дисперсия |
1,6111 |
2,1923 | |
|
Наблюдения |
9 |
13 | |
|
Гипотетическая разность средних |
0 |
| |
|
df |
19 |
| |
|
t-статистика |
3,971849 |
| |
|
P(T<=t) одностороннее |
0,000409 |
| |
|
t критическое одностороннее |
1,729133 |
| |
|
P(T<=t) двухстороннее |
0,000817 |
| |
|
t критическое двухстороннее |
2,093024 |
| |
|
Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05. | |||
|
Двухвыборочный F-тест для дисперсии |
| ||
|
|
|
| |
|
|
Переменная 1 |
Переменная 2 | |
|
Среднее |
307,1111 |
304,7692 | |
|
Дисперсия |
1,611111 |
2,192308 | |
|
Наблюдения |
9 |
13 | |
|
df |
8 |
12 | |
|
F |
0,734893 |
| |
|
P(F<=f) одностороннее |
0,338654 |
| |
|
F критическое одностороннее |
0,304512 |
| |

Вывод. Поскольку Fкрит<Fрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.
|
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Низкая температура |
10,40 |
10,36 |
10,38 |
10,41 |
10,43 |
10,42 |
10,39 |
10,41 |
10,38 |
10,40 |
|
Высокая температура |
10,41 |
10,38 |
10,38 |
10,43 |
10,44 |
10,42 |
10,40 |
10,42 |
10,38 |
10,41 |
|
4.3Парный двухвыборочный t-тест для средних |
| |
|
|
|
|
|
|
Переменная 1 |
Переменная 2 |
|
Среднее |
10,368 |
10,407 |
|
Дисперсия |
0,00044 |
0,000468 |
|
Наблюдения |
10 |
10 |
|
Корреляция Пирсона |
0,940464883 |
|
|
Гипотетическая разность средних |
0 |
|
|
df |
9 |
|
|
t-статистика |
--3,85714 |
|
|
P(T<=t) одностороннее |
0,001932 |
|
|
t критическое одностороннее |
1,833113 |
|
|
P(T<=t) двухстороннее |
0,003864 |
|
|
t критическое двухстороннее |
2,262158887 |
|


Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,01.Поскольку p – уровень имеет маленькое значение (0,003863898). Следовательно, можно утверждать, что температура влияет на величину растяжения проволоки.
