- •Эконометрика
- •Введение
- •1. Модели статистической взаимосвязи
- •1.1. Типы взаимосвязи между явлениями
- •1.2. Типы данных
- •1.3. Типы моделей
- •Контрольные вопросы
- •2. Двухмерная модель линейной регрессии
- •2.1. Определение параметров млр. Метод наименьших квадратов
- •2.2. Матричная форма записи при определении параметров млр
- •2.3. Корреляционный анализ млр
- •2.4. Оценка ошибок моделирования
- •2.4.1. Основные условия (гипотезы) анализа ошибок
- •2.4.2. Ошибки оценок параметров модели
- •2.4.3. Оптимальность оценок мнк Теорема Гаусса-Маркова.
- •2.4.4. Оценка прогноза показателя и ошибок прогнозирования
- •2.5. Установление существенности связи на основе теории статистической проверки гипотез
- •2.5.1. Распределения случайных величин Нормальное распределение (Гаусса)
- •Распределение Пирсона (2-распределение)
- •Распределение Фишера
- •Распределение Стьюдента (t-распределение)
- •Статистическая проверка гипотез
- •Контрольные вопросы
- •3. Многомерная модель линейной регрессии
- •3.1. Определение параметров модели методом наименьших квадратов
- •3.2. Определение оценок параметров млр через отклонения (уменьшение числа уравнений системы до k – 1)
- •3.3. Статистические свойства оценок параметров млр
- •3.3.1. Условия анализа
- •3.3.2. Среднеквадратичные ошибки оценок параметров млр
- •3.3.3. Ошибки прогнозирования
- •3.4. Коэффициент детерминации многомерной млр
- •3.5. Определение существенности статистической связи между факторами и показателем
- •Контрольные вопросы
- •4. Мультиколлинеарность
- •4.1. Выражение для оценки параметров млр в стандартизованной форме
- •4.2. Тестирование на мультиколлинеарность методом Феррара-Глобера
- •4.2.1. Проверка на общую мультиколлинеарность
- •4.2.2. Проверка мультиколлинеарности между парами факторов
- •Контрольные вопросы
- •5. Автокорреляция
- •5.1. Обобщенный метод наименьших квадратов
- •5.2. Авторегрессионый процесс первого порядка
- •5.3. Тест Дарбина-Уотсона на автокорреляцию
- •Контрольные вопросы
- •6. Двухмерная модель нелинейной регрессии
- •6.1. Трехпараметрическая парабола
- •6.2. Двухпараметрическая парабола
- •6.3. Обзор двухпараметрических нелинейных моделей парной регрессии
- •Экспоненциальная модель
- •Логарифмическая модель
- •Гиперболическая модель
- •Контрольные вопросы
- •Литература
- •Приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
- •Приложение 5
1.2. Типы данных
Данные являются исходным материалом при построении моделей. Показатели в последовательно взятые моменты времени называют временными рядами (рядами динамики). Это могут быть показатели инфляции, курсов валют, цен и т.д. через определенные интервалы времени. Такие данные часто являются коррелированными тем больше, чем меньше временные интервалы. Температура на улице через час меньше изменится (больше коррелированна с предыдущей), чем через день или месяц.
Данные, не являющиеся временными, принято называть пространственными. Обычно они собираются из разнесенных пространственно точек и являются точками (уi, х1i, х2i,…, xki), i=1,…, n выборки объема n и размерности k (число k на 1 больше числа факторов). Требования репрезентативности выборки предполагает случайность (равновозможность) отбора и достаточный объем выборки. Это всегда следует помнить при построении моделей, иначе возможно получение смещенных оценок. О среднем курсе доллара в городе, например, нельзя судить по обменным пунктам в районе городского вокзала. Примерами пространственных данных являются данные по производству, продаже, потреблению, ценам в разных точках города (страны) в определенный момент времени.
1.3. Типы моделей
В зависимости от характера фактора (независимой переменной Х) различают два типа моделей:
модели временных рядов (тренды);
регрессионные модели.
Тренды описываются как функции времени
,
где – набор параметров модели,
f(t, ) – детерминированная (известная) функция,
t – текущая ошибка моделирования (случайная компонента).
Приведенная зависимость для y(t) с учетом случайной ошибки называется спецификацией модели. Собственно моделью является полученная методами аппроксимации функция f(t, ). Среднеквадратичные ошибки могут быть оценены по выборочным данным и принятым гипотезам относительно генеральной совокупности (последней приписываются вероятностные свойства).
Тренды часто используют при анализе и прогнозировании, например, курсов валют и ценных бумаг, изменении во времени экономических показателей (валового продукта, производства и потребления и пр.).
Регрессионные модели в качестве факторов Х обычно используют пространственные показатели и описываются детерминированной функцией f(Х, ), к которой в спецификации модели добавляется случайная составляющая (ошибка) х:
. (1.2)
Если рассматривается один фактор, то модель является двухмерной регрессионной моделью (или моделью парной регрессии). Включение в модель более одного фактора дает многомерную регрессионную модель (или модель множественной регрессии).
В обычных регрессионных моделях исследуется один показатель (результат Y). Более общими и сложными являются системы регрессионных уравнений, в которых число показателей не менее двух. Например, для двух показателей составляется система:
,
.
Примером может служить система одновременных уравнений для спроса (у1) и предложения (у2) на определенный вид товара, к которым добавляется условие равновесия: у1 = у2. Факторами в уравнениях могут служить цены и их изменение, а параметрами – коэффициенты, зависящие от объема продаж.
По типу зависимости f(X) различают линейные и нелинейные модели. К примеру, двухмерная модель линейной регрессии описывается линейной функцией
,
в которой β = (β1, β2) – двухмерный вектор параметров модели. Например, можно построить модель зависимости уровня (у) частного потребления продуктов питания в семье от доходов (х) семьи (один из типов модели Кейнса). Разумеется, такая модель дает лишь первый срез, так как потребление существенно зависит также от числа членов семьи, их возраста и т.д. Это требует построения и анализа многомерных моделей.
Линейные модели часто дают более-менее адекватное представление о зависимости у(х) лишь при жестких временных или пространственных ограничениях. Скажем, в предыдущем примере зависимости потребления продуктов питания от доходов семьи рост потребления наблюдается до некоторого уровня доходов, за пределами которого наступает “насыщение”. Миллиардер вряд ли ест больше, чем миллионер. Он больше инвестирует бизнес, чем потребляет. В связи с этим нелинейные модели часто точнее линейных. Они обычно строятся с помощью элементарных алгебраических функций, таких как параболическая (или более общая полиномиальная), гиперболическая, экспоненциальная, логарифмическая, синусоидальная и т.д.
Вместе с тем отметим, что линейные модели (особенно в многофакторном анализе) распространены более, чем нелинейные. Это связано в первую очередь с относительной простотой их построения и анализа, наличием множества разработанных и апробированных программных продуктов. Грамотное применение этих программ предполагает введение обоснованных ограничений в вводимые данные. При необходимости переход от линейной модели к нелинейной легко осуществить на основе метода линеаризации (при равном числе параметров линейной и нелинейной модели). Всегда, однако, следует помнить, что жизнь гораздо сложней любой модели, и условия её построения могут либо не выполняться, либо с течением времени нарушаться. Как правило, это заставляет либо адаптировать к новым условиям прежнюю модель, либо строить новую модель, более совершенную и, возможно, более сложную.