Простая линейная регрессия
Простая линейная регрессия используется для исследования зависимости двух переменных.
Для определения оценок параметров в уравнении используем метод наименьших квадратов (МНК).
yi = a0 + a1xi + i Y = 11,5 + 1,4x + 2ε
|
Y |
X |
2 |
|
25,09746 |
9,095126 |
0,539962 |
|
25,16155 |
9,140904 |
1,792296 |
|
19,10045 |
4,811548 |
1,01427 |
|
12,8206 |
0,325938 |
1,52744 |
|
21,25298 |
6,349071 |
0,340882 |
|
12,56082 |
0,140385 |
1,51004 |
|
18,66977 |
4,503922 |
0,646390 |
|
12,70353 |
0,242317 |
0,058730 |
|
38,13057 |
18,40449 |
1,729968 |
|
15,43628 |
2,194281 |
1,499406 |
|
16,26601 |
2,78695 |
0,921172 |
|
33,01799 |
14,75265 |
1,90764 |
|
13,97505 |
1,150548 |
0,59032 |
|
25,08379 |
9,08536 |
1,113246 |
|
15,06969 |
1,932432 |
1,77966 |
|
15,47131 |
2,219306 |
0,793252 |
|
24,31814 |
8,538469 |
0,662622 |
|
22,24252 |
7,055879 |
0,322177 |
|
29,21538 |
12,0365 |
0,225648 |
|
21,6341 |
6,621296 |
0,488186 |
|
27,64905 |
10,91769 |
0,679366 |
|
31,93788 |
13,98114 |
1,746489 |
|
21,62555 |
6,615192 |
1,971274 |
|
18,25533 |
4,207892 |
0,50532 |
|
29,22307 |
12,04199 |
0,50468 |
|
38,5604 |
18,71151 |
1,339502 |
|
31,99257 |
14,0202 |
0,75531 |
|
35,17479 |
16,29322 |
0,775222 |
|
20,21902 |
5,610523 |
0,893154 |
|
36,24123 |
17,05496 |
1,52906 |
|
27,93532 |
11,12217 |
1,487276 |
|
31,88917 |
13,94635 |
0,455388 |
|
25,97249 |
9,720145 |
0,281752 |
|
14,71506 |
1,679128 |
0,418555 |
|
15,02013 |
1,897031 |
1,33546 |
|
33,93318 |
15,40635 |
0,818904 |
|
24,41897 |
8,610492 |
1,130266 |
|
36,74454 |
17,41447 |
1,802814 |
|
13,51532 |
0,822169 |
0,70602 |
|
20,67362 |
5,93524 |
1,494444 |
|
12,64371 |
0,199591 |
0,655871 |
|
28,81291 |
11,74902 |
1,740559 |
|
32,82231 |
14,61287 |
0,556507 |
|
14,99107 |
1,876278 |
0,476611 |
|
36,65567 |
17,35099 |
0,22739 |

ryx = a1sx/sy
sx
=
,
sy
=
,

Xсредн= 8,292978
Yсредн=23,97445
a1=2.890934 a0=21.08352 Sx =2.879753 Sy=4.896371 R=ryx=1.700275 F=43
Y = 22.35+ 2.51xi
Полученное уравнение регрессии: Y = 22.35+ 2.51xi
Вывод. Степень связи Rнаходиться в интервале 0,1-0,3. Это означает, что менее 50% вариации результирующей переменной объяснятся случайными факторами.
Проверка статистических гипотез.
Для проверки статистических гипотез применим: H0: mx=myH1: mx≠my
И проведём несколько тестов для их проверки.
Двухвыборочный z-тест для средних
Дисперсия
для автомата 1:
=
5 мм2.
Дисперсия
для автомата 2:
=7
мм2.
Уровень
значимости
=
0,05.
,

|
Автомат 1 |
182,3 |
183,0 |
181,8 |
181,4 |
181,8 |
181,6 |
183,2 |
182,4 |
182,5 |
179,7 |
179,9 |
181,9 |
182,8 |
183,4 |
|
Автомат 2 |
185,3 |
185,6 |
184,8 |
186,2 |
185,8 |
184,0 |
184,2 |
185,2 |
184,2 |
|
|
|
|
|
|
Двухвыборочный z-тест для средних |
| ||
|
|
|
| |
|
|
Переменная 1 |
Переменная 2 | |
|
Среднее |
181,9786 |
185,0333 | |
|
Известная дисперсия |
5 |
0,7 | |
|
Наблюдения |
14 |
9 | |
|
Гипотетическая разность средних |
0 |
| |
|
z |
-2,86744 |
| |
|
P(Z<=z) одностороннее |
0,002069 |
| |
|
z критическое одностороннее |
1,644854 |
| |
|
P(Z<=z) двухстороннее |
0,004138 |
| |
|
z критическое двухстороннее |
1,959964 |
| |
Вывод. Поскольку zкрит<zрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.
|
Старая технология |
308 |
308 |
307 |
308 |
304 |
307 |
307 |
308 |
307 |
|
|
|
|
|
Новая технология |
308 |
304 |
306 |
306 |
306 |
304 |
304 |
304 |
306 |
304 |
303 |
304 |
303 |
Уровень
значимости
=
0,05




|
4.2Двухвыборочный t-тест с одинаковыми дисперсиями | |||
|
|
|
| |
|
|
Переменная 1 |
Переменная2 | |
|
Среднее |
307,1111 |
304,7692 | |
|
Дисперсия |
1,611111 |
2,192308 | |
|
Наблюдения |
9 |
13 | |
|
Объединенная дисперсия |
1,959829 |
| |
|
Гипотетическая разность средних |
0 |
| |
|
df |
20 |
| |
|
t-статистика |
3,857778 |
| |
|
P(T<=t) одностороннее |
0,00049 |
| |
|
t критическое одностороннее |
1,724718 |
| |
|
P(T<=t) двухстороннее |
0,000981 |
| |
|
t критическое двухстороннее |
2,085963 |
| |
|
Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.
| |||
|
Двухвыборочный t-тест с различными дисперсиями |
| ||
|
|
|
| |
|
|
Переменная 1 |
Переменная2 | |
|
Среднее |
307,11 |
304,7692 | |
|
Дисперсия |
1,6111 |
2,1923 | |
|
Наблюдения |
9 |
13 | |
|
Гипотетическая разность средних |
0 |
| |
|
df |
19 |
| |
|
t-статистика |
3,887 |
| |
|
P(T<=t) одностороннее |
0,0005 |
| |
|
t критическое одностороннее |
1,7291 |
| |
|
P(T<=t) двухстороннее |
0,001 |
| |
|
t критическое двухстороннее |
2,093 |
| |
|
Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05. | |||
|
Двухвыборочный F-тест для дисперсии |
| ||
|
|
|
| |
|
|
Переменная 1 |
Переменная 2 | |
|
Среднее |
307,1111 |
304,7692 | |
|
Дисперсия |
1,611111 |
2,192308 | |
|
Наблюдения |
9 |
13 | |
|
df |
8 |
12 | |
|
F |
0,734893 |
| |
|
P(F<=f) одностороннее |
0,338654 |
| |
|
F критическое одностороннее |
0,304512 |
| |

Вывод. Поскольку Fкрит<Fрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.
|
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Низкая температура |
10,40 |
10,36 |
10,38 |
10,41 |
10,43 |
10,42 |
10,39 |
10,41 |
10,38 |
10,40 |
|
Высокая температура |
10,41 |
10,38 |
10,38 |
10,43 |
10,44 |
10,42 |
10,40 |
10,42 |
10,38 |
10,41 |
|
4.3Парный двухвыборочный t-тест для средних |
| |
|
|
|
|
|
|
Переменная 1 |
Переменная 2 |
|
Среднее |
10,368 |
10,407 |
|
Дисперсия |
0,00044 |
0,000468 |
|
Наблюдения |
10 |
10 |
|
Корреляция Пирсона |
0,940464883 |
|
|
Гипотетическая разность средних |
0 |
|
|
df |
9 |
|
|
t-статистика |
--3,85714 |
|
|
P(T<=t) одностороннее |
0,001932 |
|
|
t критическое одностороннее |
1,833113 |
|
|
P(T<=t) двухстороннее |
0,003864 |
|
|
t критическое двухстороннее |
2,262158887 |
|


Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,01.Поскольку p – уровень имеет маленькое значение (0,003863898). Следовательно, можно утверждать, что температура влияет на величину растяжения проволоки.
