
- •1. Предмет и метод исследования
- •1.1. Некоторые сведения из математической статистики
- •1.2. Распределение оценок для малых выборок
- •1.3. Методы оценивания параметров
- •1.4. Спецификация моделей регрессии
- •1.5. Вопросы для обсуждения
- •2. Линейные однофакторные модели регрессии
- •2.1. Свойства коэффициентов парной корреляции
- •2.2. Метод наименьших квадратов
- •2.3. Предпосылки мнк
- •2.4. Линейная модель парной регрессии
- •2.5. Оценка значимости параметров и качества модели
- •2.6. Точечный и интервальный прогноз
- •2.7. Вопросы для обсуждения
- •3. Нелинейные однофакторные модели регрессии
- •3.1. Методы линеаризации
- •3.2. Оценка тесноты связи и качества нелинейной модели
- •3.3. Обобщенный метод наименьших квадратов
- •4. Многофакторные модели регрессии
- •4.1. Мнк для расчета параметров двухфакторной модели
- •4.2. Оценка тесноты связи в многофакторной модели
- •4.3. Оценка качества модели
- •4.4. Принципы отбора факторов модели
- •4.5. Анализ мультиколлинеарности в нелинейных моделях
- •4.6. Вопросы для обсуждения
- •5. Динамические ряды
- •5.1. Выявление аномальных наблюдений
- •5.2. Сглаживание временного ряда
- •5.3. Аппроксимация сезонных колебаний
- •5.4. Корреляционная зависимость уровней ряда
- •5.5. Оценка адекватности модели. Проверка предпосылок мнк
- •2.2) Критерий поворотных точек.
- •5.6. Точечный и интервальный прогноз
- •5.7. Вопросы для обсуждения
- •6. Адаптивные модели прогнозирования
- •6.1. Линейная модель Брауна
- •6.2. Модель Хольта-Уинтерса
- •7. Эконометрические исследования динамического ряда
- •8. Эконометрические исследования статистического ряда
- •1. Найти параметры уравнения линейной регрессии, дать экономическую оценку коэффициента регрессии.
- •2. Вычислить остатки, найти остаточную сумму квадратов, оценить дисперсию остатков, построить график остатков.
- •3. Проверить выполнение предпосылок мнк (оценить адекватность модели).
- •4. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента ( ).
- •5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью f-критерия Фишера ( ), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
- •6. Осуществить прогнозирование среднего значения показателя y при уровне значимости , если прогнозное значение фактора X составит 80% от его максимально значения.
- •7. Представить графически: фактические и модельные значения y, точки прогноза.
- •8. Составить уравнения гиперболической (а), степенной (б), показательной (в) регрессий и построить их графики.
- •9. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод об их качестве.
- •9. Приложения
- •10. Тесты по эконометрике
- •11. Тест-глоссарий
- •12. Ключевые вопросы
- •Литература
- •Оглавление
- •1. Предмет и метод исследования…………………………..…
- •8. Эконометрические исследования статистического ряда
4.3. Оценка качества модели
Качество
модели в целом характеризует коэффициент
множественной детерминации, который
равен квадрату коэффициента (индекса)
множественной корреляции
.
Однако не стоит передоверяться слишком
высокому значению
,
так как величины y
и какая-то xi
могут иметь общий тренд, не связанный
с причинно-следственной зависимостью.
В большей степени это, впрочем, относится
к временным рядам.
Величина коэффициента детерминации приближается к единице при увеличении числа факторов и приближении их количества к – числу степеней свободы общей дисперсии, поскольку остаточная дисперсия в этом случае имеет систематическую ошибку в сторону преуменьшения. При этом, не важно имеют ли вводимые в модель факторы экономический смысл или нет. Чтобы исключить эту неэкономическую погрешность, рассчитывается скорректированный на число степеней свободы, а точнее сказать на их потерю, исправленный коэффициент детерминации:
где
n
– число наблюдений, k
– число коэффициентов при переменных
xi,
– число степеней свободы остаточной
дисперсии,
– число степеней свободы в целом по
совокупности,
.
Для дисперсионного уравнения множественной регрессии
значения дисперсий на одну степень свободы представим таблицей
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
Общая |
|
n |
|
Факторная |
|
k |
|
Остаточная |
|
n-k-1 |
|
Степени свободы – это количества элементов, которые можно варьировать, не изменяя заданных характеристик.
Значимость модели множественной регрессии в целом оценивается с помощью критерия Фишера:
где
– факторная дисперсия на одну степень
свободы,
– остаточная дисперсия на одну степень
свободы, k
– число
параметров при переменных
(в линейной регрессии совпадает с числом
факторов модели). Для парной модели
регрессии
,
тогда, в частности, будет
Если вычисленное значение больше табличного, то совокупная связь признаков считается существенной, а коэффициент множественной корреляции – значимым.
В
случае двухфакторной модели, общее
число параметров
и, соответственно,
,
тогда
Наблюдаемое
значение, сравнивается с табличным
при заданном уровне значимости α
и числе степеней свободы
,
для факторной и случайной дисперсии,
соответственно. Если оказывается
,
то уравнение в целом признается значимым.
При
большом количестве факторов,
корреляционно-регрессионный анализ
проводится с помощью стандартных
статистических программ. Величина
показывает долю изменения результативного
признака, обусловленную изменением
факторов
и
,
включенных в модель.
4.4. Принципы отбора факторов модели
Не
включенные в модель и, соответственно,
неучтенные в ней прочие факторы могут
составить значительную долю в общей
вариации результативного признака. Эта
недостача в определенной мере учитывается
коэффициентом
.
Многофакторный регрессионный анализ решает три задачи:
1)
определяет специфику модели – вид
функции неслучайных переменных
,
включенных в модель;
2) выявляет тесноту связи между факторами;
3) устанавливает влияние отдельных факторов на результативный признак.
При отборе факторов модели представляет интерес матрица коэффициентов парной корреляции
В случае линейной зависимости множественной регрессии исследуется так же расширенная матрица
Элементы
матриц
и
позволяют сделать отбор факторов и
определить их минимальное, но достаточное
количество для описания результативной
переменной.
Многофакторная модель линейной регрессии может быть представлена как
или
в матричном виде
,
где
Факторы, включаемые в модель, должны быть количественно измеримы. Так, если фактор изначально качественный, то ему нужно придать количественную определенность. Подобная ситуация возникает, когда при построении регрессионных моделей помимо количественных переменных необходимо отразить и некоторые атрибутивные признаки (регион, образование, пол и т.д.). Такого рода переменные называются качественными или фиктивными. Они отражают неоднородность статистической совокупности и используются для более качественного моделирования по совокупности неоднородных объектов наблюдения. Учет влияния фиктивных переменных осуществляется с помощью булевых переменных, которые могут принимать только одно из двух возможных значений: 0 или 1.
Однако в некоторых случаях бывает целесообразно разделить неоднородную совокупность на однородные и применять моделирование к отдельным однородным совокупностям данных.
Пример. Пусть эконометрическая модель включает такие факторы: а) пол работника (мужской, женский); б) уровень образования (среднее, высшее); в) категория жилья (общежитие, отдельная квартира); г) социальный статус (замужем, не замужем); д) стаж работы (лет, месяцев); е) среднемесячная зарплата; ж) величина прожиточного минимума в регионе. Какие из этих факторов являются количественными, а какие качественными?
Ответ. Первые четыре фактора являются качественными, поскольку не могут быть измерены. Последние три, напротив, могут быть измерены и потому являются количественными.
Пример.
При продаже-покупке квартиры в городе
ее цена y
может зависеть от полезной площади x
и таких
качественных факторов как:
– дом кирпичный,
– дом панельный. Придадим качественным
(фиктивным) переменным количественное
значение:
Теперь
уравнение регрессии можно представить
в виде
.
Пусть теоретическая функция регрессии
(цена квартиры) имеет вид
тогда цены отдельных типов квартир
даются формулами:
– дом кирпичный;
– дом панельный.
Важное
требование, предъявляемое к эффективности
линейной эконометрической модели,
состоит в том, что взаимодействия фактора
x
и фиктивных
переменных быть не должно. В противном
случае анализ зависимости результата
от факторов сильно усложняется, а
уравнение регрессии принимает вид
Аппроксимация зависимости
при корреляции
и фиктивной переменной
весьма затрудняется. Эту ситуацию можно
проиллюстрировать, см. рис. а) и б).
На рисунке а) схематически представлена зависимость результативного признака y от x при отсутствии связи между x и z, а на рисунке б) – при наличии такой связи.
Ф
акторы,
включаемые в модель должны быть
некоррелированы.
При сильной интеркорреляции объясняющих
факторов, когда
,
невозможно определить их раздельное
влияние на результативный признак. В
этом случае характеристики уравнения
регрессии плохо интерпретируются, а их
оценки ненадежны. Так, в уравнении
,
при
с изменением
будет меняться и
.
Тогда
и
нельзя интерпретировать как показатели
силы раздельного влияния
и
на
.
Дублирующие факторы из модели необходимо
исключить. Из двух факторов
,
для которых
,
исключить следует тот, который имеет
менее выраженный экономический смысл
и слабее связан с результативным
признаком y.
Отбор факторов модели осуществляется в два этапа:
1) включаются факторы, исходя из экономической природы явления, а экономически немотивированное включение в модель факторов – нецелесообразно;
2) на основе анализа корреляционной матрицы исключаются дублирующие факторы, т.е. факторы, имеющие неслучайную связь с уже отобранными.
Следует понимать, что матрица коэффициентов парной корреляции позволяет исключить лишь явную коллинеарность двух факторов.
В случае линейной зависимости между факторами и результативной переменной анализ корреляционной матрицы и выборочных коэффициентов множественной корреляции исчерпывает анализ мультиколлинеарности.