
- •Экономические науки
- •Э конометрика
- •1. Вероятность и случайная величина
- •1.1. Основные понятия теории вероятностей.
- •1.2. Случайная величина.
- •1.3. Вероятностные характеристики случайной величины.
- •1.1. Основные понятия теории вероятностей
- •1.1.1. Классический подход вероятности
- •Общее число возможных результатов
- •1.1.2. Эмпирический подход
- •1.1.3. Субъективный подход (интуитивный)
- •1.2. Случайная величина
- •1.2.1. Дискретные и непрерывные случайные величины
- •1.3. Вероятностные характеристики случайной величины
- •1.3.2. Примеры законов распределения
- •1.3.3. Математическое ожидание
- •1.3.4. Дисперсия случайной величины
- •1.3.5. Многомерное распределение вероятности
- •2. Элементы математической статистики
- •2.1. Предмет и основные понятия математической статистики
- •2.2. Оценивание «Хорошие» свойства оценок
- •2.3. Проверка гипотез и интервальное оценивание
- •2.1. Предмет и основные понятия математической статистики
- •2.2. Оценивание «Хорошие» свойства оценок
- •Описательный статистический анализ
- •С татистический анализ
- •Описательный вид цель - выводы
- •Оценивание проверка гипотез
- •2.3. Проверка гипотез и интервальное оценивание
- •Проверка гипотез методом определения уровня вероятности.
- •Интервальное оценивание.
- •3. Однофакторные регрессионные уравнения
- •Понятие регрессионных уравнений
- •Метод наименьших квадратов
- •Проверка адекватности регрессионных уравнений
- •Показатели качества подгонки регрессионных уравнений
- •Проверка различных гипотез относительно регрессионных уравнений
- •«Хорошие» свойства оценок
- •3.1. Понятие регрессионных уравнений
- •3.2. Метод наименьших квадратов
- •3.3. Проверка адекватности регрессионных уравнений
- •3.3.1. Показатели качества подгонки регрессионного уравнения
- •Различные гипотезы относительно параметров регрессионного уравнения
- •3.3.3. Проверка выполнения условий для получения «хороших» оценок мнк
- •4. Многофакторное регрессионное уравнение (мру)
- •4.1. Необходимость использования многофакторных регрессионных уравнений (мру)
- •4.2. Оценка коэффициентов регрессии и условия применения метода наименьших квадратов (мнк) Параметры уравнения множественной регрессии оцениваются методом наименьших квадратов по формуле:
- •4.3. Показатели адекватности
- •4.4. Отбор существенных факторов
- •4.5. Нелинейные регрессионные модели (нрм).
- •4.6. Использование регрессионных моделей для прогнозирования.
- •4.7. Этапы построений регрессионных уравнений
- •Определение «входов» и «выходов» модели.
- •Сбор исходных статистических данных.
- •Установление наличия статистической связи между переменными.
- •Выбор математической формулы регрессионного уравнения.
- •Оценка коэффициентов регрессионного уравнения.
- •Оценка качества подгонки регрессионного уравнения.
- •Оценка стандартных ошибок и t- статистика для коэффициентов регрессии.
- •Проверка условий метода наименьших квадратов (мнк) для получения «хороших» оценок.
- •Экспериментальная проверка моделей.
- •Вывод об адекватности модели.
- •Эксплуатация моделей.
- •5. Прогнозирование на основе одномерного динамического ряда (др)
- •5.1. Строго периодические колебания (Vt)
- •V продаж
- •5.2. Тренд и нестрого периодические циклические колебания (Ut и Kt)
- •6. Три основных класса экономико-математических моделей применяемых для анализа и прогнозирования
- •1 Класс:
- •2 Класс:
- •3 Класс:
- •6.1. Структурная форма модели
- •6.2. Приведенная форма модели
- •6.3. Проблема идентификации
- •Дисперсионный анализ
Различные гипотезы относительно параметров регрессионного уравнения
Приведенные ранее
показатели качества подгонки не позволяют
принять статистического решения о
пригодности регрессионного уравнения,
хотя и дают некоторые представления о
качестве подгонки. Такие решения
принимаются на основе статистических
критериев. Одним из таких критериев
является F-статистика.
Принятие решений на основе F-статистики
опирается на общую процедуру проверки
любой гипотезы. После оценки коэффициента
регрессии и свободного члена уравнения,
выдвигается гипотеза о том, что линейная
связь между х
и у
не подтверждается. Отсутствие связи
можно изучить на основе отклонения
расчетных значений
от
среднеарифметического значения
и отклонения расчетных значений
от фактических значений
.
F-статистика
Близкое к 0
значение
свидетельствует
об отсутствии какой-либо тенденции для
уi в
связи с изменением хi.
Строгое решение об опровержении линейной
связи между х
и
у принимается
на основе F-статистики.
Если Fтабл меньше Fрасч, то гипотезу об отсутствии линейной связи отвергаем с заданной вероятностью р. Fтабл находим из таблицы распределения Фишера (F-распределение). Для Fтабл используются степени свободы: n1=1, n2 = n-2.
Стьюдраспобр, Fраспобр
t-статистика
Отдельно исследуется коэффициент регрессии b. Выдвигается гипотеза о том, что х влияет на у несущественно, т.е. изменяется по каким-либо другим причинам, а не в связи с изменениями х. Выдвинутая гипотеза равноценна тому, что Н0: b=0. Если эта гипотеза верна, то t-статистика подчиняется t-распределению со степенью свободы n-2.
t-статистика вычисляется по формуле:
,
где
– стандартная ошибка коэффициента b.
Стандартная ошибка
коэффициента вычисляется:
По общей процедуре проверки гипотезы находим tтабл с заданной вероятностью р и степенью свободы n-2. Если tрасч > tтабл, то с заданной вероятностью р гипотезу Н0: b=0 отвергаем.
t-статистика используется при построении доверительного интервала для коэффициента b.
;
3.3.3. Проверка выполнения условий для получения «хороших» оценок мнк
Возможность применения регрессионных уравнений определяется «хорошими» свойствами оценок коэффициента регрессии: несмещенностью, состоятельностью и эффективностью.
МНК дает «хорошие» оценки коэффициентов а и b при выполнении некоторых условий, эти условия касаются εi.
Основными предположениями классической модели линейной регрессии являются:
Математическое ожидание случайной компоненты равно 0: М(εi)=0.
Дисперсия должна быть постоянной: D(εi)=const
Ковариация должна быть равна 0: cov(εi,εj) = 0
Ковариация - показатель, измеряющий тесноту связей между случайными переменными.
Нарушение тех или иных условий проверяется на основе выдвижения соответствующих гипотез относительно εi. Оценочными значениями εi является величина, которая рассчитывается по формуле:
Все критерии относительно εi основываются на этих оценочных значениях.
Рассмотрим более подробно каждое условие:
Нарушение условия 1: М(εi) ≠0
. . .
. . . .
.
. . .
. .
.
. .
Проверка,
равенства математического ожидания
уровней ряда остатков нулю, осуществляется
в ходе проверки соответствующей нулевой
гипотезы. Н0:
.
С
этой целью строится t
– статистика
где
-
среднее арифметическое значение уровней
ряда остатков
;
–
среднеквадратическое
отклонение для этой последовательности,
рассчитанное по формуле для малой
выборки.
На
уровне значимости
гипотеза отклоняется, если
>
,
– критерий распределения Стьюдента с
доверительной
вероятностью (1–
)
и
=
n–1
степенями свободы.
Нарушение условия 2: D(εi) ≠const
Если остатки имеют постоянную дисперсию (рассеивание), то они называются гомоскедастичными.
Если остатки непостоянны (нарушение условия 2), то они называются гетероскедастичными.
Воздействие гетероскедастичности на оценку интервалов прогнозирования и проверку гипотезы заключается в том, что хоть оценки не смещены, но стандартные ошибки будут смещены. Если смещение отрицательно, то оценочная стандартная ошибка будет меньше, чем она должна быть, а критерии проверки будут больше, чем в реальности. Можно сделать вывод, что коэффициент значим, когда он таковым не является, и наоборот, если смещение положительно, то оценочные ошибки будут большими, чем они должны быть, а критерий проверки меньше. Значит, мы можем принять нулевую гипотезу, в то время как она должна быть отвергнута.
Для проверки условия 2 существует несколько критериев. Один из них основывается на том, что величина F подчиняется F-распределению со степенями свободы n1=n/2-1 и n2=n/2-1
Если проверяется гипотеза Н0 о росте дисперсии, то Fрасч должно быть меньше Fтабл. Если проверяется гипотеза об уменьшении дисперсии, то Fрасч больше Fтабл.
Нарушение условия 3 означает, что между ошибками разных наблюдений есть какая-то взаимосвязь. Графически это можно представить в следующем виде:
у
х
Нарушение условия 3 называется автокорреляцией, известной также как серийная корреляция.
Автокорреляция имеет место, когда остатки не являются независимыми друг от друга. Зависимость между остатками описывается с помощью авторегрессионой схемы.
Допустим, что
остаток
находится
под влиянием остатка из предшествующего
периода времени и какого-либо текущего
значения случайной переменной уt
, тогда остаток
будет описываться следующей
авторегрессионной моделью:
- форма
авторегрессионной модели первого
порядка (или модель
АR(1)).
Наличие (отсутствие) автокорреляции в отклонениях от модели роста проще всего проверить с помощью критерия Дарвина-Уотсона. С этой целью строится статистика Дарвина-Уотсона (d-статистика (D-W)), в основе которой лежит расчетная формула
Теоретическое основание применения этого критерия обусловлено тем, что в динамических рядах, как сами наблюдения, так и отклонения от них распределяются в хронологическом порядке.
При
отсутствии автокорреляции значение
dрасч
примерно равно 2,
а при полной автокорреляции – 0
или 4.
Следовательно, оценки, получаемые по
критерию, являются не точечными, а
интервальные. Верхние (d2)
и нижние (d1)
критические значения, позволяющие
принять или отвергнуть гипотезу об
отсутствии автокорреляции, зависят
от количества уровней динамического
ряда и числа независимых переменных
модели. Фрагмент табличных значений
этих
границ для различного числа уровней
ряда n
и числа определяемых параметров модели
k
представлен в таблице (уровень значимости
=0,05).
Таблица
n |
k=1 |
k=2 |
k=3 |
|||
d1 |
d2 |
d1 |
d2 |
d1 |
d2 |
|
15 20 30 |
1,08 1,20 1,35 |
1,36 1,41 1,49 |
0,95 1,10 1,28 |
1,54 1,54 1,57 |
0,82 1,00 1,21 |
1,75 1,68 1,65 |
При сравнении расчетного значения dрасч с табличным могут возникнуть следующие ситуации:
d 2 < dрасч < 2 – ряд остатков не коррелирован;
dрасч < d1 – остатки содержат автокорреляцию;
d1< dрасч < d2 – область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции.
Если dрасч превышает 2, то при наличии автокорреляции это свидетельствует о наличие отрицательной корреляции. Перед входом в таблицу такие значения следует преобразовать по формуле d'расч= 4 - dрасч
Если же ситуация оказалась неопределенной (ситуация 3.), применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции:
Для суждения о наличии или отсутствии автокорреляции в исследуемом ряду расчетное значение коэффициента автокорреляции сопоставляется с табличным (критическим) для 5%-го или 1%-го уровня значимости (вероятности допустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если расчетное значение коэффициента автокорреляции меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята. Когда же расчетное значение больше табличного, делают вывод о наличии автокорреляции в ряду динамики.
Установив наличие автокорреляции остатков, надо улучшать модель.