- •Содержание
- •Задание № 1
- •Пункт 1
- •Пункт 2
- •2. Найти уравнение линейной регрессии
- •Пункт 3
- •3. Найти среднюю ошибку аппроксимации. Сделать вывод о качестве модели.
- •Пункт 4
- •4. Найти парный коэффициент линейной корреляции. Сделать вывод о тесноте и направлении связи между переменными. С доверительной вероятностью 0,95 проверить значимость коэффициента корреляции.
- •Пункт 5
- •5. Проверить значимость уравнения регрессии на уровне значимости 0,05.
- •Пункт 6
- •Пункт 7
- •7. Сделать точечный и интервальный прогноз для случая расходов на рекламу, равных 5 млн. Руб.
- •Пункт 8
- •8. Построить график линии регрессии с нанесением на него опытных данных.
- •Задание № 2
- •Задание № 3
- •Задание № 4
- •Задание № 5
- •Задание № 6
- •Список использованных источников
Пункт 2
2. Найти уравнение линейной регрессии
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x |
y |
x2 |
y2 |
x • y |
1.5 |
39.5 |
2.25 |
1560.25 |
59.25 |
2 |
40.3 |
4 |
1624.09 |
80.6 |
2.5 |
40.7 |
6.25 |
1656.49 |
101.75 |
3 |
40.8 |
9 |
1664.64 |
122.4 |
3.5 |
43.1 |
12.25 |
1857.61 |
150.85 |
4 |
42.7 |
16 |
1823.29 |
170.8 |
4.5 |
45.3 |
20.25 |
2052.09 |
203.85 |
5 |
46.2 |
25 |
2134.44 |
231 |
5.5 |
47.4 |
30.25 |
2246.76 |
260.7 |
6 |
49.5 |
36 |
2450.25 |
297 |
37.5 |
435.5 |
161.25 |
19069.91 |
1678.2 |
Для наших данных система уравнений имеет вид
10a + 37.5 b = 435.5
37.5 a + 161.25 b = 1678.2
Домножим уравнение (1) системы на (-3.75), получим систему, которую решим методом алгебраического сложения.
-37.5a -140.63 b = -1633.13
37.5 a + 161.25 b = 1678.2
Получаем:
20.62 b = 45.08
Откуда b = 2.1855
Теперь найдем коэффициент «a» из уравнения (1):
10a + 37.5 b = 435.5
10a + 37.5 • 2.1855 = 435.5
10a = 353.55
a = 35.3545
Получаем эмпирические коэффициенты регрессии: b = 2.1855, a = 35.3545
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 2.1855 x + 35.3545
Пункт 3
3. Найти среднюю ошибку аппроксимации. Сделать вывод о качестве модели.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
1.5 |
39.5 |
38.63 |
16.4 |
0.75 |
5.06 |
0.022 |
2 |
40.3 |
39.73 |
10.56 |
0.33 |
3.06 |
0.0143 |
2.5 |
40.7 |
40.82 |
8.12 |
0.014 |
1.56 |
0.0029 |
3 |
40.8 |
41.91 |
7.56 |
1.23 |
0.56 |
0.0272 |
3.5 |
43.1 |
43 |
0.2 |
0.00929 |
0.0625 |
0.00224 |
4 |
42.7 |
44.1 |
0.72 |
1.95 |
0.0625 |
0.0327 |
4.5 |
45.3 |
45.19 |
3.06 |
0.0123 |
0.56 |
0.00245 |
5 |
46.2 |
46.28 |
7.02 |
0.00669 |
1.56 |
0.00177 |
5.5 |
47.4 |
47.37 |
14.82 |
0.000648 |
3.06 |
0.000537 |
6 |
49.5 |
48.47 |
35.4 |
1.07 |
5.06 |
0.0209 |
37.5 |
435.5 |
435.5 |
103.88 |
5.38 |
20.63 |
0.13 |
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
В среднем, расчетные значения отклоняются от фактических на 1.27%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
