- •3.1. Простая линейная регрессия.
- •Пример построения линейной регрессии.
- •3.1.1. Определение параметров уравнения регрессии с помощью метода наименьших квадратов.
- •3.1.2. Критерии значимости коэффициентов и в уравнении регрессии.
- •Коэффициент детерминации .
- •Гетероскедастичность.
- •Автокорреляция.
- •Мультиколлинеарность.
- •Фиктивные переменные.
- •Исходные данные
- •Результаты вычислений.
- •3.4. Использование регрессии для прогнозирования.
- •Матрица коэффициентов парной корреляции
- •Множественный коэффициент корреляции
- •Частный коэффициент корреляции
- •Исходные данные.
- •Результаты расчета.
- •Проверка точности.
- •Проверка адекватности и оценка точности модели парной линейной регрессии.
- •Проверка адекватности.
- •Курс доллара сша и предположительно влияющие на него факторы.
- •Корреляционная матрица системы показателей.
- •Параметры модели зависимости курса доллара от цены золота и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота и dj-индекса и ее статистические характеристики.
- •Параметры модели зависимости курса доллара от цены золота, dj-индекса и тn-индекса и ее статистические характеристики.
- •Результаты моделирования зависимости курса доллара от цены золота и dj-индекса.
- •Исходные данные.
- •Коэффициенты корреляции.
- •Исходные данные.
- •Исходные данные.
Проверка точности.
Под точностью понимается величина случайных остатков . Сразу же отметим, что сравнительный анализ точности с целью выбора лучшей модели имеет смысл только для адекватных моделей: среди них лучшей признается модель с меньшими значениями характеристик точности. Приведем обзор наиболее употребляемых точностных характеристик, иллюстрируя их на примере соответствующих характеристик модели (3.24), которые представлены в табл. 3.7.
Максимальная ошибка соответствует максимальному отклонению расчетных значений от фактических (в первой графе табл. 3.4 максимальная ошибка 140.42 выделена жирным шрифтом).
Таблица 3.7.
Проверка адекватности и оценка точности модели парной линейной регрессии.
Остатки |
|
|
|
|
|
-106,22 |
11283,68 |
|
|
-1198604,59 |
127321354,54 |
-109,26 |
11938,70 |
-3,03 |
9,24 |
-1304474,93 |
142532635,91 |
140,42 |
19716,66 |
249,68 |
62340,31 |
2768535,95 |
388746856,21 |
27,88 |
777,53 |
-112,53 |
12663,40 |
21680,89 |
604555,39 |
-46,88 |
2198,09 |
-74,76 |
5590,27 |
-103055,33 |
4831633,02 |
124,32 |
15456,80 |
171,20 |
29312,61 |
1921672,67 |
238912690,75 |
-84,50 |
7141,46 |
-208,83 |
43611,04 |
-603504,83 |
51000488,13 |
71,09 |
5053,54 |
155,59 |
24209,95 |
359247,77 |
25538306,85 |
-14,48 |
209,72 |
-85,57 |
7322,27 |
-3037,28 |
43985,87 |
-2,35 |
5,53 |
12,13 |
147,13 |
-13,01 |
30,60 |
Суммы |
73781,74 |
|
185206,23 |
1858447,31 |
979532537,26 |
Средняя ошибка 0,0000 |
Остаточная дисперсия 378,17 |
|
|
|
|
Средняя абсолютная ошибка 72,74 |
Средне-квадратическая ошибка 82,83 |
|
DW = 2,52 |
Аs =0,293242 |
Ех = -1,200628 |
Средняя абсолютная ошибка рассчитывается по формуле:
(3.25)
и показывает, насколько в среднем отклоняются фактические значения от модели. (Для рассматриваемого примера ее значение приведено в последней строке первой колонки табл.3.7 и составляет 72.74).
Дисперсия ряда остатков, или остаточная дисперсия, вычисляется по формуле (3.26):
(3.26).
Её расчет для модели (3.24) приведен во второй колонке таблицы (3.7).Среднеквадратическая ошибка представляет собой корень квадратный из дисперсии (уравнение 3.26). Среднеквадратическая ошибка является наиболее часто используемой характеристикой точности (что объясняется ее связью с остаточной дисперсией, которая играет центральную роль в вариационном анализе). Но наряду с ней также могут быть использованы и другие характеристики, так как все они несут аналогичную смысловую нагрузку: чем меньше значение любой из приведенных характеристик, тем точнее модель. Значение среднеквадратической ошибки всегда несколько больше значения средней абсолютной ошибки, но они имеют схожий смысл - характеризуют среднюю удаленность расчетных значений модели от фактических исходных данных (в нашем примере среднеквадратическая ошибка равна 82.83). Обычно точность модели признается удовлетворительной, если среднеквадратическая ошибка не превышает 5% среднего значения показателя Y, в нашем случае она составляет 10.5%, что свидетельствует о недостаточной точности модели.
К характеристикам точности модели можно отнести также коэффициент детерминации (3.6).
