ЗФ_ПР3Прогнозирование
.pdf
Сравнение линейного и квадратичного приближений
1.Вычисляется сумма квадратов отклонений для линейной и для квадратичной регрессии.
2.Сравниваются результаты. Функция с наименьшей суммой квадратов отклонений даёт лучшее приближение.
Использование для приближения многочленов степени n
600 |
|
500 |
|
400 |
|
300 |
y = -2E-05x4 + 0,0088x3 - 1,6432x2 + 127,05x - 3259,8 |
200 |
|
100
0
0 |
50 |
100 |
150 |
200 |
250 |
В общем случае можно найти многочлен степени (k-1), который идеально будет описывать k точек исходных данных. Однако такое приближение обманчиво, т.к. не информативно для получения прогнозируемых значений.
Кроме того, чем больше степень многочлена, тем выше изменчивость значений многочлена на относительно коротких интервалах. Поэтому значения x, незначительно отличающиеся друг от друга, дадут значения переменной y, значительно отличающиеся друг от друга.
Выбор функции регрессии
Для того, чтобы оценить, какое приближение лучше использовать, можно использовать сравнение по величине среднего квадратов ошибок. Вычисляется среднее квадратов ошибок как сумма квадратов отклонений, поделенная на число точек данных минус число параметров кривой приближения.
Для линейного приближения число параметров равно 2(коэффициенты a и b),
Для квадратичного приближения число параметров равно 3 (коэффициенты a0, a1, a2). Выбирается то приближение, которое даёт меньшую величину среднего квадратов ошибок .
Пример: Определить необходимость в АЗС, если интенсивность ТС на данном участке равна 183 авт./час. Известна интенсивность движения ТС на участках УДС, где уже находятся АЗС и средний объем продаж в час.
|
|
300 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ТС, авт/ч |
Продажи |
|
|
|
|
|
|
|
|
y = 0,93x + 57,104 |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
150 |
220 |
250 |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
55 |
75 |
200 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
220 |
250 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
130 |
145 |
150 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
95 |
200 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
50 |
100 |
150 |
200 |
250 |
||||||||||||
Решение: Строим график зависимости
. Задаём вид функции регрессии (линейная, квадратичная, и т.д.).
Находим по формуле (2) коэффициенты a и b. Получаем b=0,93 и a=57,104 Полученное уравнение регрессии y=0,93x+57,104 используем для прогноза:
Объём продаж=0,93*183+57,104=227,29
Определяем стандартную ошибку Se=44,18
Определяем доверительный интервал прогноза: [227,29-2*44,18; 227,29+2*44,18] Т.е. с уверенностью 95% можно говорить, что реальное значение объёма продаж попадёт в интервал [138,93; 315,65].
Определяем доверительный интервал коэффициентов a и b. Доверительный интервал для коэффициента b включает 0, => статистическая зависимость между x и y может отсутствовать.
Задание
Перед транспортным предприятием стоит задача обновления парка ТС. Известно, что прибыль от перевозок напрямую зависит от грузоподъемности ТС. Необходимо спрогнозировать прибыль от перевозок в зависимости от грузоподъемности ТС.
Для прогноза использовать линейную и квадратичную функции. Оценить тесноту связи между зависимой и независимой переменными, стандартную ошибку прогноза, доверительный интервал для прогноза и для коэффициентов регрессии. Оценить, какое приближение лучше использовать для прогнозирования.
Номер ТС |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
Грузоподъём |
1.7 |
1.6 |
2.8 |
5.6 |
1.3 |
2.2 |
1.3 |
1.1 |
3.2 |
1.5 |
5.2 |
4.6 |
5.8 |
2.3 |
ность, тн |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Прибыль за |
3.7 |
3.9 |
6.7 |
9.5 |
3.4 |
5.6 |
3.7 |
2.7 |
5.5 |
2.9 |
10.7 |
7.6 |
11.8 |
4.1 |
год, млн.руб |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
