- •Эконометрика
- •Введение
- •1. Модели статистической взаимосвязи
- •1.1. Типы взаимосвязи между явлениями
- •1.2. Типы данных
- •1.3. Типы моделей
- •Контрольные вопросы
- •2. Двухмерная модель линейной регрессии
- •2.1. Определение параметров млр. Метод наименьших квадратов
- •2.2. Матричная форма записи при определении параметров млр
- •2.3. Корреляционный анализ млр
- •2.4. Оценка ошибок моделирования
- •2.4.1. Основные условия (гипотезы) анализа ошибок
- •2.4.2. Ошибки оценок параметров модели
- •2.4.3. Оптимальность оценок мнк Теорема Гаусса-Маркова.
- •2.4.4. Оценка прогноза показателя и ошибок прогнозирования
- •2.5. Установление существенности связи на основе теории статистической проверки гипотез
- •2.5.1. Распределения случайных величин Нормальное распределение (Гаусса)
- •Распределение Пирсона (2-распределение)
- •Распределение Фишера
- •Распределение Стьюдента (t-распределение)
- •Статистическая проверка гипотез
- •Контрольные вопросы
- •3. Многомерная модель линейной регрессии
- •3.1. Определение параметров модели методом наименьших квадратов
- •3.2. Определение оценок параметров млр через отклонения (уменьшение числа уравнений системы до k – 1)
- •3.3. Статистические свойства оценок параметров млр
- •3.3.1. Условия анализа
- •3.3.2. Среднеквадратичные ошибки оценок параметров млр
- •3.3.3. Ошибки прогнозирования
- •3.4. Коэффициент детерминации многомерной млр
- •3.5. Определение существенности статистической связи между факторами и показателем
- •Контрольные вопросы
- •4. Мультиколлинеарность
- •4.1. Выражение для оценки параметров млр в стандартизованной форме
- •4.2. Тестирование на мультиколлинеарность методом Феррара-Глобера
- •4.2.1. Проверка на общую мультиколлинеарность
- •4.2.2. Проверка мультиколлинеарности между парами факторов
- •Контрольные вопросы
- •5. Автокорреляция
- •5.1. Обобщенный метод наименьших квадратов
- •5.2. Авторегрессионый процесс первого порядка
- •5.3. Тест Дарбина-Уотсона на автокорреляцию
- •Контрольные вопросы
- •6. Двухмерная модель нелинейной регрессии
- •6.1. Трехпараметрическая парабола
- •6.2. Двухпараметрическая парабола
- •6.3. Обзор двухпараметрических нелинейных моделей парной регрессии
- •Экспоненциальная модель
- •Логарифмическая модель
- •Гиперболическая модель
- •Контрольные вопросы
- •Литература
- •Приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
- •Приложение 5
Логарифмическая модель
Логарифмическая функция обратна экспоненциальной (функция и аргумент у них меняются местами). Например, при основании е из у = ех следует обратная зависимость х = lny. Поменяв обозначения зависимой и независимой переменных, получим логарифмическую функцию
f(x) = lnx, x > 0.
Её график приведен на рис.6.6. Она растет с уменьшением скорости как производной Иначе говоря, изменение скорости логарифмической функции существенно меньше изменения скорости экспоненциальной функции.
Рис.6.6
Спецификация логарифмической модели со смещением х0 фактора представляется как
yi = a+ bln(xi – x0) + i, i = 1,2,…, n, x > x0. (6.25)
Линеаризация заменой z = ln(xi – x0) дает выражения для оценок параметров (6.19), (6.20)
Для нарастающих трендов коэффициент регрессии b > 0, для убывающих b < 0. Постоянная составляющая a смещает график функции вверх (a > 0) или вниз (a < 0).
В прикладном отношении логарифмическая модель (6.25) полезна для описания трендов с небольшим, но непрерывным уменьшением скорости изменения показателя. Скажем, расходы на питание в зависимости от дохода семьи в известных границах могут описываться логарифмической моделью.
Гиперболическая модель
Гипербола со смещением аргумента описывается функцией
(6.26)
и имеет вид, приведенный на рис 6.7. Уравнение двухпараметрической гиперболической модели записывается как
,
а её параметры МНК оцениваются выражениями (6.19), (6.20) с учетом (6.26)
Очевидно, что при моделировании область особой точки х х0 исключается. Обычно для описания трендов достаточно пользоваться правой ветвью функции f(x), при этом можно получить нарастающие и убывающие тренды, подобные экспоненциальным, рис. 6.4, или логарифмическим.
Выбор одной из 3-х моделей (экспоненциальной, логарифмической или гиперболической) для переходных к стабилизации процессов может быть не очевидным и требует поочередной апробации с расчетом функционалов ошибок для всех моделей. Лучшей будет модель с минимальными ошибками.
Рис.6.7
Расчет параметров экспоненциальной и логарифмической моделей запрограммирован на калькуляторе CASIO (fx-82-TL, fx-82W) в режиме REG.
Разумеется, рассмотренными выше примерами не исчерпываются все нелинейные модели. В качестве f(x) можно использовать любую известную функцию, близкую к наблюдаемым данным.
Кроме нелинейности для фактора х может встретиться нелинейность по отношению к показателю у. Характерным примером этого является функция
Ее линеаризация состоит в двойной замене переменных: v = y –1= a + bz, z = f(x). Параметры линейной модели v(z) определяются известными соотношениями (6.19), (6.20) с подстановкой у–1 вместо у:
Другим примером нелинейной зависимости показателя и фактора может быть функция
у = a* bf(x).
Её логарифмирование дает
v(z) = lny = lna + f(x)lnb = A + Bz, z = f(x). А = lna, B = lnb.
Здесь линеаризованная модель v(z) также получена двойной заменой переменных. Подобные примеры можно множить.
Рассмотренный в данной теме подход можно обобщить на случай многомерной нелинейной регрессии. При её линеаризации можно использовать как одинаковые, так и различные (для каждого фактора) нелинейные функции fr (Xr), r = 2, 3,…, k. Анализ таких моделей усложняется по сравнению с линейными.
Задачи
1. Выборочные данные парной регрессии определяются 10-ю точками {X,Y} = {(3,2); (3,3); (4,5); (5,8); (5,7); (6,7); (7,7); (8,5); (9,6); (9,4)}.
Определить оценки МНК параметров нелинейной параболической модели (трехпараметрической), построить её график на фоне выборочных точек, рассчитать функционал ошибок (сумму квадратов остатков регрессии).
2. Для выборочных данных задачи 1 определить оценки параметров двухпараметрической параболической модели, построить её график и рассчитать функционал ошибок. Сравнить результаты с результатами задачи 1 (графически и по величине ошибок).
3. Произвести линеаризацию двухмерной модели – кривой В. Парето y*= a (x – xmin)–b, где х – семейный доход с минимальным значением xmin, у* - число лиц с доходом х, а и b – параметры модели, определяемые на основе статистических данных.
4. Получить оценки МНК параметров линеаризованной модели Парето для числа у лиц с доходом х: у*= a (x – xmin)–b при минимальном доходе 150 грн. и данных выборки
хi (грн.) |
200 |
300 |
400 |
500 |
600 |
800 |
1000 |
1200 |
1600 |
2000 |
yi (тыс. чел.) |
1800 |
1100 |
800 |
500 |
300 |
150 |
100 |
70 |
30 |
20 |
Построить график модели, определить оценку дисперсии и СКО ошибок (остатков регрессии). Определить прогноз числа лиц с доходом 1700 грн. и доверительный интервал этого прогноза с вероятностью 68%.
5. Получить оценки МНК параметров линеаризованной экспоненциальной модели для числа у лиц с доходом х: y* = a + be – (x – xmin) при минимальном доходе 100 грн. и данных выборки
хi (грн.) |
200 |
300 |
400 |
500 |
600 |
800 |
1000 |
1200 |
1600 |
2000 |
yi (тыс. чел.) |
1800 |
1100 |
800 |
500 |
300 |
150 |
100 |
70 |
30 |
20 |
Построить график модели, определить прогноз числа лиц с доходом 2300 грн. и доверительный интервал этого прогноза с вероятностью 95%.
6. Получить оценки МНК параметров линеаризованной логарифмической модели для числа у лиц с доходом х: y* = a + bln(x/xmin– 1) при минимальном доходе 100 грн. и данных выборки
хi, грн. |
200 |
300 |
400 |
500 |
600 |
800 |
1000 |
1200 |
1600 |
2000 |
yi, тыс. чел. |
1800 |
1100 |
800 |
500 |
300 |
150 |
100 |
70 |
30 |
20 |
Построить график модели, определить прогноз числа лиц с доходом 2200 грн. и доверительный интервал этого прогноза с вероятностью 95%.
7. Получить выражения для оценок дисперсий параметров двухмерной экспоненциальной и логарифмической модели.
8. Получить выражение для оценки дисперсии прогноза показателя двухмерной экспоненциальной модели.