1. Парные зависимости.
1.1. Построение полей рассеяния.
На основе визуального анализа поля рассеяния выдвигаю гипотезу о том, что зависимость цены y от возраста автомобиля x1 описывается линейной моделью вида: y = a0 + a1x1 + ε, где a0, a1 – неизвестные постоянные коэффициенты, ε - случайная переменная, отражающая влияние неучтенных факторов от погрешностей измерений.
На основе визуального анализа поля рассеяния выдвигаю гипотезу о том, что зависимость цены y от мощности автомобиля x1 описывается линейной моделью вида: y = β0 + β1x2 + δ, где β0, β1 – неизвестные постоянные коэффициенты, δ - случайная переменная, отражающая влияние неучтенных факторов от погрешностей измерений.
2.2. Вычисление оценок параметров моделей.
Таблица 2
i |
yi |
yi2 |
xi1 |
xi12 |
xi1*yi |
xi2 |
xi22 |
xi2*yi |
1 |
9,0 |
81,0 |
5,0 |
25,0 |
45,0 |
119,0 |
14161,0 |
1071,0 |
2 |
8,6 |
73,96 |
4,0 |
16,0 |
34,4 |
89,0 |
7921,0 |
765,4 |
3 |
7,4 |
54,76 |
6,0 |
36,0 |
44,4 |
114,0 |
12996,0 |
843,6 |
4 |
4,4 |
19,36 |
7,0 |
49,0 |
30,8 |
54,0 |
2916,0 |
237,6 |
5 |
5,6 |
31,36 |
7,0 |
49,0 |
39,2 |
82,0 |
6724,0 |
459,2 |
6 |
4,2 |
17,64 |
8,0 |
64,0 |
33,6 |
78,0 |
6084,0 |
327,6 |
7 |
10,3 |
106,09 |
3,0 |
9,0 |
30,9 |
104,0 |
10816,0 |
1071,2 |
8 |
9,3 |
86,49 |
5,0 |
25,0 |
46,5 |
145,0 |
21025,0 |
1348,5 |
9 |
5,5 |
30,25 |
7,0 |
49,0 |
38,5 |
83,0 |
6889,0 |
456,5 |
10 |
8,4 |
70,56 |
4,0 |
16,0 |
33,6 |
84,0 |
7056,0 |
705,6 |
11 |
9,7 |
94,09 |
4,0 |
16,0 |
38,8 |
139,0 |
19321,0 |
1348,3 |
12 |
11,0 |
121,0 |
3,0 |
9,0 |
33,0 |
147,0 |
21609,0 |
1617,0 |
13 |
10,4 |
108,16 |
3,0 |
9,0 |
31,2 |
132,0 |
17424,0 |
1372,8 |
14 |
9,4 |
88,36 |
4,0 |
16,0 |
37,6 |
123,0 |
15129,0 |
1156,2 |
15 |
9,3 |
86,49 |
4,0 |
16,0 |
37,2 |
112,0 |
12544,0 |
1041,6 |
16 |
10,8 |
116,64 |
3,0 |
9,0 |
32,4 |
125,0 |
15625,0 |
1350,0 |
Сумма |
133,3 |
1186,21 |
77,0 |
413,0 |
587,1 |
1730,0 |
198240,0 |
15172,1 |
Среднее значение возраста автомобилей:
Среднее значение цены автомобилей:
Среднее значение мощности двигателей автомобилей:
=
= -1,2821.
.
Следовательно, уравнение линейной регрессии примет вид:
β1
=
=
=
.
Следовательно, уравнение линейной регрессии примет вид:
1.3. Коэффициент парной корреляции характеризует тесноту линейной зависимости между x и y.
Коэффициент парной корреляции для линейной зависимости «Возраст – цена».
Коэффициент парной корреляции для линейной зависимости «Мощность двигателя – цена».
Проверка значимости коэффициента парной корреляции.
где
- квантиль распределения Стьюдента, (n
– 2) – число степеней свободы.
Статистической надежности в 90% соответствует доверительная вероятность 0,9. Соответственно, уровень значимости (α) при надежности 90% равен 0,1.
=
=1,7613.
Для
получаем:
Условие выполняется, следовательно коэффициент корреляции существенно отличается от нуля, и существует сильная линейная отрицательная связь между ценой и возрастом автомобиля.
Для
получаем:
.
Условие выполняется, следовательно, коэффициент корреляции существенно отличается от нуля, и существует сильная линейная положительная связь между ценой автомобиля и мощностью двигателя.
1.4. Проверка статистической значимости параметров и уравнений регрессии с надежностью 0,9.
Для зависимости цены от возраста автомобиля коэффициент детерминации:
R2
=
=
=
0,9220. То есть вариация цены на 92,2%
объясняется вариацией возраста
автомобиля.
Для зависимости цены от мощности двигателя автомобиля коэффициент детерминации:
R2
=
=
= 0,6810. То есть вариация цены на 68,1%
объясняется вариацией мощности двигателя.
Рассчитаем фактическое значение F-статистики Фишера по формуле:
Для зависимости «Возраст – цена» фактическое значение F-статистики Фишера:
=
165,4872.
Для зависимости «Возраст – цена» фактическое значение F-статистики Фишера:
=
29,8871.
F- распределение Фишера зависит от степеней свободы df1 и df2 и от уровня значимости. Количество степеней свободы df1 равно числу m объясняющих переменных модели. Для парной регрессии число m = 1, поэтому df1 = 1. Количество степеней свободы df2 определяется объемом выборки n за вычетом числа объясняющих переменных модели df1, минус единица. В данном случае, df2 = 16 – 1 – 1 = 14.
Статистической надежности 0,9 соответствует доверительная вероятность 0,9. Соответственно, уровень значимости (α), соответствующий надежности 0,9, равен 0,1.
При уровне значимости α = 0,1 табличное значение Fm = 3,10221.
Качество уровня регрессии оценивает F-тест (проверка гипотезы H0 о статистической незначимости уровня регрессии и показателя тесноты связи). Сравниваем фактической значение Fф и табличное значение Fm. Если Fm < Fф, то гипотеза H0 отклоняется, и признается статистическая значимость уравнения регрессии. Если Fm > Fф, то гипотеза H0 не отклоняется, и признается статистическая незначимость, ненадежность уравнения регрессии.
Для зависимости «Возраст – цена» выполняется неравенство Fm < Fф [3,10221 < 165,4872], гипотеза H0 отклоняется, и признается статистическая значимость уравнения регрессии.
Для зависимости «Мощность двигателя – цена» также выполняется неравенство Fm < Fф [3,10221 < 29,8871], гипотеза H0 отклоняется, и признается статистическая значимость уравнения регрессии.
Для
оценки статистической значимости
коэффициентов регрессии используется
t
– критерий Стьюдента. Выдвигается
гипотеза H0:
αj
= 0 о незначимом отклонении от нуля
каждого отдельного параметра модели.
Если для параметра αj
модуль фактического значения t-статистики
превышает табличное
,
то гипотеза H0
отклоняется, и отклонение от нуля
параметра αj
признается значимым. В противном случае
гипотеза H0
принимается.
Для парной регрессии существует связь между статистиками Стьюдента и Фишера:
=
F.
Для зависимости «Возраст – цена» получаем:
=
12,8642.
=
= 1,7613.
.
Поскольку выполняется неравенство, гипотеза H0 отклоняется, и отклонение от нуля параметра α1 признается значимым.
Для зависимости «Мощность двигателя – цена» получаем:
=
5,4669.
= = 1,761.
Поскольку выполняется неравенство, гипотеза H0 отклоняется, и отклонение от нуля параметра β1 признается значимым.
1.5.
Доверительная
полоса для теоретического уравнения
регрессии – это множество доверительных
интервалов, содержащихся между нижней
и верхней доверительными границами
неравенства
.
Доверительные интервалы среднего значения цены для y = α0 + α1x1:
,
где
,
- соответственно верхняя и нижняя границы
доверительного интервала в точке
.
- значение независимой переменной x1,
для которого определяется доверительный
интервал,
.
Стандартная
ошибка
:
.
Остаточная дисперсия уравнения регрессии:
,
Построение
доверительной полосы для среднего
значения цены автомобиля в зависимости
от его возраста (с надежностью 0,95). При
статистической надежности 0,95 уровень
значимости (α) = 0,05.
Таблица 3
i |
yi |
xi1 |
|
ei |
|
(xi1
-
|
Корень |
|
|
|
|||||||||
1 |
9,0 |
5,0 |
8,0909 |
0,9091 |
0,8265 |
0,0352 |
0,2517 |
0,1871 |
7,7404 |
8,4414 |
|||||||||
2 |
8,6 |
4,0 |
9,373 |
-0,773 |
0,5975 |
0,6602 |
0,2794 |
0,2077 |
8,9839 |
9,7621 |
|||||||||
3 |
7,4 |
6,0 |
6,8088 |
0,5912 |
0,3495 |
1,4102 |
0,3094 |
0,2300 |
6,3779 |
7,2397 |
|||||||||
4 |
4,4 |
7,0 |
5,5267 |
-1,1267 |
1,2695 |
4,7852 |
0,4186 |
0,3112 |
4,9436 |
6,1098 |
|||||||||
5 |
5,6 |
7,0 |
5,5267 |
0,0733 |
0,0054 |
4,7852 |
0,4186 |
0,3112 |
4,9436 |
6,1098 |
|||||||||
6 |
4,2 |
8,0 |
4,2446 |
-0,0446 |
0,0020 |
10,1602 |
0,5495 |
0,4085 |
3,4793 |
5,0099 |
|||||||||
7 |
10,3 |
3,0 |
10,6551 |
-0,3551 |
0,1261 |
3,2852 |
0,3740 |
0,2781 |
10,1341 |
11,1761 |
|||||||||
8 |
9,3 |
5,0 |
8,0909 |
1,2091 |
1,4619 |
0,0352 |
0,2517 |
0,1871 |
7,7404 |
8,4414 |
|||||||||
9 |
5,5 |
7,0 |
5,5267 |
-0,0267 |
0,0007 |
4,7852 |
0,4186 |
0,3112 |
4,9436 |
6,1098 |
|||||||||
10 |
8,4 |
4,0 |
9,373 |
-0,973 |
0,9467 |
0,6602 |
0,2794 |
0,2077 |
8,9839 |
9,7621 |
|||||||||
11 |
9,7 |
4,0 |
9,373 |
0,327 |
0,1069 |
0,6602 |
0,2794 |
0,2077 |
8,9839 |
9,7621 |
|||||||||
12 |
11,0 |
3,0 |
10,6551 |
0,3449 |
0,1190 |
3,2852 |
0,3740 |
0,2781 |
10,1341 |
11,1761 |
|||||||||
13 |
10,4 |
3,0 |
10,6551 |
-0,2551 |
0,0651 |
3,2852 |
0,3740 |
0,2781 |
10,1341 |
11,1761 |
|||||||||
14 |
9,4 |
4,0 |
9,373 |
0,027 |
0,0007 |
0,6602 |
0,2794 |
0,2077 |
8,9839 |
9,7621 |
|||||||||
15 |
9,3 |
4,0 |
9,373 |
-0,073 |
0,0053 |
0,6602 |
0,2794 |
0,2077 |
8,9839 |
9,7621 |
|||||||||
16 |
10,8 |
3,0 |
10,6551 |
0,1449 |
0,0210 |
3,2852 |
0,3740 |
0,2781 |
10,1341 |
11,1761 |
|||||||||
Сумма |
77 |
133,3 |
0 |
5,9038 |
42,4375 |
5,5111 |
4,0972 |
125,6247 |
140,9767 |
||||||||||
Среднее |
4,8125 |
8,3313 |
0,0000 |
0,3690 |
2,6523 |
0,3444 |
0,2561 |
7,8515 |
8,8110 |
||||||||||
В
графе «Корень» таблицы рассчитаны
значения квадратного корня в
:
=
0,6494.
Коэффициент
детерминации:
=0,9220.
Совпадает с результатами, полученными
в п.1.4. [R2
=
=
=
0,9220.]
На
рис. 3 показаны: поле рассения, линия
регрессии
;
доверительные интервалы. Самое узкое
место доверительной полосы соответствует
среднему значению аргумента.
.
На рис. 3 проведена вертикальная прямая
x
= 4,8125. В этой точке доверительный интервал
минимальный.
Построение доверительной полосы для среднего значения цены автомобиля в зависимости от мощности двигателя (с надежностью 0,95).
Таблица 4
i |
yi |
xi2 |
|
ei |
|
(xi2
-
|
Корень |
*2,1448 |
|
|
|||||||||
1 |
9,0 |
119,0 |
9,0697 |
-0,0697 |
0,0049 |
118,2656 |
0,2703 |
0,7614 |
8,7994 |
9,8311 |
|||||||||
2 |
8,6 |
89,0 |
7,0327 |
1,5673 |
2,4564 |
365,7656 |
0,3086 |
0,8691 |
6,7241 |
7,9018 |
|||||||||
3 |
7,4 |
114,0 |
8,7302 |
-1,3302 |
1,7694 |
34,5156 |
0,2561 |
0,7213 |
8,4741 |
9,4515 |
|||||||||
4 |
4,4 |
54,0 |
4,6562 |
-0,2562 |
0,0656 |
2929,5156 |
0,5696 |
1,6043 |
4,0866 |
6,2605 |
|||||||||
5 |
5,6 |
82,0 |
6,5574 |
-0,9574 |
0,9166 |
682,5156 |
0,3515 |
0,9899 |
6,2059 |
7,5473 |
|||||||||
6 |
4,2 |
78,0 |
6,2858 |
-2,0858 |
4,3506 |
907,5156 |
0,3790 |
1,0675 |
5,9068 |
7,3533 |
|||||||||
7 |
10,3 |
104,0 |
8,0512 |
2,2488 |
5,0571 |
17,0156 |
0,2530 |
0,7127 |
7,7982 |
8,7639 |
|||||||||
8 |
9,3 |
145,0 |
10,8351 |
-1,5351 |
2,3565 |
1359,7656 |
0,4291 |
1,2085 |
10,4060 |
12,0436 |
|||||||||
9 |
5,5 |
83,0 |
6,6253 |
-1,1253 |
1,2663 |
631,2656 |
0,3449 |
0,9714 |
6,2804 |
7,5967 |
|||||||||
10 |
8,4 |
84,0 |
6,6932 |
1,7068 |
2,9132 |
582,0156 |
0,3384 |
0,9532 |
6,3548 |
7,6464 |
|||||||||
11 |
9,7 |
139,0 |
10,4277 |
-0,7277 |
0,5295 |
953,2656 |
0,3844 |
1,0826 |
10,0433 |
11,5103 |
|||||||||
12 |
11,0 |
147,0 |
10,9709 |
0,0291 |
0,0008 |
1511,2656 |
0,4446 |
1,2521 |
10,5263 |
12,2230 |
|||||||||
13 |
10,4 |
132,0 |
9,9524 |
0,4476 |
0,2003 |
570,0156 |
0,3369 |
0,9488 |
9,6155 |
10,9012 |
|||||||||
14 |
9,4 |
123,0 |
9,3413 |
0,0587 |
0,0034 |
221,2656 |
0,2869 |
0,8079 |
9,0544 |
10,1492 |
|||||||||
15 |
9,3 |
112,0 |
8,5944 |
0,7056 |
0,4979 |
15,0156 |
0,2527 |
0,7117 |
8,3417 |
9,3061 |
|||||||||
16 |
10,8 |
125,0 |
9,4771 |
1,3229 |
1,7501 |
284,7656 |
0,2966 |
0,8354 |
9,1805 |
10,3125 |
|||||||||
Сумма |
1730,0 |
133,30 |
0,00 |
24,1388 |
11183,750 |
|
|
|
|
||||||||||
Среднее |
108,125 |
|
0,00 |
1,5087 |
|
|
|
|
|
||||||||||
.
=
1,3131.
Коэффициент
детерминации:
=
0,6810. Совпадает с результатами, полученными
в п.1.4 [R2
=
=
= 0,6810].
На
рис. 4 показаны: поле рассения, линия
регрессии:
доверительные
интервалы. Самое узкое место доверительной
полосы соответствует среднему значению
аргумента.
.
На рис. 4 проведена вертикальная прямая
x
= 108,1250. В этой точке доверительный
интервал минимальный.
1.6. Точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95.
Рассчитаем
точечный и интервальный прогноз средней
цены поступивших автомобилей по первой
регрессионной модели
+ ε. Возраст автомобилей – 3 года, поэтому
= 3. Точечный прогноз средней цены:
=
10,6551
у.е.
Интервальный прогноз средней цены в зависимости от возраста автомобилей:
Стандартная
ошибка
:
=
0,2429.
=
10,6551+(2,1448*0,2429) = 11,1761 у.е.
=
10,6551-(2,1448*0,2429) = 10,1341 у.е.
Рассчитаем
точечный и интервальный прогноз средней
цены поступивших автомобилей по второй
регрессионной модели
.
Мощность двигателей автомобилей = 165
л.с., поэтому
=
165. Точечный прогноз средней цены:
12,1931
у.е.
Интервальный прогноз средней цены в зависимости от мощности двигателя:
Стандартная
ошибка
:
0,7788.
=
12,1931+(2,1448*0,7788) = 13,8634 у.е.
=
12,1931-(2,1448*0,7788) =10,5228 у.е.

)2
*2,1448
)2