- •Предисловие
- •Введение
- •Пример 1.
- •Пример 2.
- •Глава 1. Анализ данных
- •§1. Состав исходной информации
- •§2. Интерполяционный полином Лагранжа
- •Случай 1.
- •Случай 2.
- •Случай 3.
- •Случай n.
- •§3. Парная линейная регрессия. Метод наименьших квадратов
- •§4. Множественная линейная регрессия
- •§5. Нелинейные модели
- •§6. Системы одновременных эконометрических уравнений
- •Глава 2. Временные ряды §7. Составляющие временного ряда
- •§8. Определение составляющих временного ряда
- •При этом коэффициенты ak, bk будут равны
- •§9. Временной ряд как случайный процесс
- •§10. Модели arima
- •§11. Учет сезонных составляющих
- •Глава 3. Оценка качества спецификации модели §12. Анализ погрешностей исходной информации
- •§13. Доверительные интервалы
- •§14. Расчет погрешностей
- •§15. Коэффициент детерминации
- •§16. Средняя ошибка аппроксимации
- •§17. Принцип максимального правдоподобия. Построение регрессионных моделей при гетероскедастичности ошибок
- •§18. Статистические гипотезы
- •Список литературы
- •Оглавление
§18. Статистические гипотезы
В предыдущих параграфах рассматривалась методика моделирования взаимосвязей экономических показателей и процессов. С помощью полученных уравнений регрессии моделировалась эта связь. Качество выбранной модели оценивалось коэффициентом детерминации; её соответствие фактической, реально существующей связи, коэффициентом аппроксимации. Эти оценки необходимо дополнить оценкой значимости полученной модели в целом и отдельных её параметров. Оценка значимости модели в целом производится с помощью F- критерия Фишера, а отдельных её параметров - посредством t-критерия Стьюдента. Для получения искомых оценок формулируются и проверяются статистические гипотезы: основная или нулевая гипотеза (обозначается Н0 ) и альтернативная Н1.
Суть нулевой гипотезы заключается в том, что делается предположение об отсутствии связи между рассматриваемыми экономическими показателями или явлениями, т.е. о несущественности рассматриваемой связи. Альтернативная гипотеза Н1 утверждает наличие связи между анализируемыми величинами и явлениями. По оценке «истинности» или «ложности» нулевой гипотезы, делается вывод о значимости модели.
Как уже отмечалось, количественные оценки исходной информации носят случайный характер и, следовательно, параметры разработанных моделей носят элементы случайности. В связи с этим «истинность» или «ложность» нулевой гипотезы может быть принята лишь с определенной степенью вероятности. Вероятность отвергнуть правильную гипотезу, т.е. совершить ошибку 1-го рода, называется уровнем значимости нулевой гипотезы, обозначается α и обычно принимается равной 0,05 или 0,01.
Если нулевая гипотеза «ложна», но принимается, то совершается ошибка 2-го рода, вероятность которой обозначается β. Число (1 – β) называется мощностью критерия, являясь вероятностью того, что справедлива альтернативная гипотеза Н1.
Схема возможных вариантов осуществления метода нулевой гипотезы приведены на рис. 7.

Рис. 7. Схема вариантов нулевой гипотезы.
§19. F – статистика
Значимость регрессионной модели определяется с помощью F-критерия Фишера. Для этого вычисляется отношение
(19.1)
где
n
число
парных наблюдений;
m
число
независимых
переменных xi;
R2
коэффициент детерминации; RSS
сумма квадратов отклонений yi
от среднего
,
объясненная регрессией;ESS
остаточная сумма квадратов отклонений
(см. §15).
Для парной регрессии m = 1, поэтому формула (19.1) примет вид:
(19.2)
Можно сказать, что F-критерий определяет отношение факторной и остаточной дисперсии, рассчитанных на одну степень свободы. Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии мало отличаются друг от друга. Для опровержения нулевой гипотезы необходимо, чтобы факторная дисперсия превышала остаточную в несколько раз.
Величина F имеет распределение Фишера с ν1 = m и ν2 = n-m-1 степенями свободы [3]. Задавая уровень значимости α (в частности, принимая α = 0,05) и находя из таблиц или с помощью пакетов EXCEL , STATISTICA и др. величину Fтабл(ν1, ν2 , α), сравниваем F и Fтабл . Табличное значение Fтабл - критерия -- это максимальная величина отношения дисперсий, которая может иметь место при случайном расхождении для данного уровня вероятности и при условии, что нулевая гипотеза справедлива. Если F > Fтабл , то уровень регрессии признается статистически значимым и нулевая гипотеза отвергается. Если же F < Fтабл, то нулевая гипотеза принимается, т.е. зависимость между x и y признается несущественной.
§20. t – статистика
Для оценки значимости отдельных параметров регрессионной модели y=a+bx+ их величина сравнивается с их стандартной ошибкой. При этом рассчитывается так называемый t – критерий Стьюдента
(20.1)
где a, b – параметры модели; sa , sb – ошибки параметров; r – линейный коэффициент корреляции; sr – ошибка линейного коэффициента корреляции.
Значение t—критерия сравнивается с табличным значением при определенном уровне α и числом степеней свободы.
Ошибки параметров модели определяются по следующим формулам:
(20.2)
(20.3)
где S2 оценка (13.8) при m = 2.
Ошибка линейного коэффициента корреляции r, введенного в §15, определяется по формуле
(20.4)
По формулам (20.1) – (20.4) рассчитываются значения t - критерия .
Величины t имеют распределение Стьюдента. Задавая уровень значимости α при числе степеней свободы =n-2 и находя из таблиц или с помощью пакетов EXCEL , STATISTICA и т.п. величину tтабл(ν, α), сравниваем t и tтабл . Если t > tтабл , то соответствующий параметр признается статистически значимым (при уровне ошибки α) и нулевая гипотеза, утверждающая ,что данный параметр равен нулю, отвергается. Если же t < tтабл, то нулевая гипотеза принимается, т.е. значимость данного параметра несущественна.
