- •Тема 1. Природа эконометрики
- •1.1. Общие понятия эконометрических моделей
- •1. 2. Типы эконометрических моделей
- •1. 3. Типы данных
- •Тема 2. Корреляционный анализ в эконометрических исследованиях
- •2.1. Функциональная, статистическая и корреляционная зависимости
- •2.2. Понятие о двумерном корреляционном анализе
- •2.3. Понятие о многомерном корреляционном анализе
- •2.4. Ранговая корреляция
- •Тема 3. Регрессионный анализ в эконометрических исследованиях
- •3.1. Задача регрессионного анализа
- •3.2. Идентификация модели регрессии
- •3.3. Линейная парная регрессия и оценка параметров
- •3.4. Проверка значимости параметров линейной парной регрессии
- •3.5. Интервалы прогноза по линейному уравнению регрессии
- •3.6. Нелинейная регрессия
- •3.7. Корреляционное отношение и индекс корреляции
- •3.8. Множественный регрессионный анализ
- •4.9. Ковариационная матрица и ее выборочная оценка
- •4.10. Определение доверительных интервалов для коэффициентов и функции множественной регрессии
- •4.11. Мультиколлинеарность
- •Тема 5. Методы и модели анализа динамики экономических процессов
- •5.1. Понятия экономических рядов динамики
- •5.2. Предварительный анализ динамических рядов экономических показателей
- •5.3. Сглаживание динамических рядов
- •4.3. Расчет показателей динамики развития эконометрических процессов
- •4.4. Тренд-сезонные экономические процессы и их анализ
- •Тема 5. Модели прогнозирования экономических процессов
- •5.7. Трендовые модели на основе кривых роста
- •5.2. Оценка адекватности и точности трендовых моделей
- •5.3. Прогнозирование экономической динамики на основе трендовых моделей
- •5.4. Адаптивные модели прогнозирования
- •Лучшая модель ар(1,1)
- •Характеристика остатков
- •Тема 8. Системы взаимозависимых эконометрических моделей
- •8.1. Особенности систем взаимозависимьех моделей
- •8.2. Формы представления систем взаимозависимых эконометрических моделей
- •8.3. Косвенный метод оценки коэффициентов структурной формы систем взаимозависимых эконометрических моделей
- •8.4. Оценивание параметров структурной формы на основе двухшагового мнк с использованием инструментальных переменных
- •1. На первом шаге конструируются новые значения зависимых
- •2. На втором шаге значения используются вместо значений
- •8.5. Оценки параметров системы взаимозависимых эконометрических моделей с использованием трехшагового мнк
3.7. Корреляционное отношение и индекс корреляции
Введенный выше коэффициент корреляции, как уже отмечено, является полноценным показателем тесноты связи лишь в случае линейной зависимости между переменными. Однако часто возникает необходимость в достоверном показателе интенсивности связи при любой форме зависимости.
Для получения такого показателя вспомним правило сложения дисперсий (8.12):
,
(3.37)
где
общая
дисперсия переменной
,
(3.38)
средняя
групповых дисперсий
,
или остаточная дисперсия
,
(3.39)
,
(3.40)
межгрупповая
дисперсия
.
(3.41)
Остаточной дисперсией измеряют ту часть колеблемости Y, которая возникает из-за изменчивости неучтенных факторов, не зависящих от X. Межгрупповая дисперсия выражает ту часть вариации Y, которая обусловлена изменчивостью X. Величина
(3.42)
получила
название эмпирического
корреляционного отношения Y
по
X.
Чем
теснее связь, тем большее влияние на
вариацию переменной Y
оказывает
изменчивость X
по
сравнению с неучтенными факторами,
тем выше
.
Величина
,
называемаяэмпирическим
коэффициентом детерминации,
показывает,
какая часть общей вариации Y
обусловлена
вариацией X.
Аналогично
вводится эмпирическое
корреляционное отношение X по Y.
.
(3.43)
Отметим основные свойства корреляционных отношений (при достаточно большом объеме выборки n):
1. Корреляционное
отношение есть неотрицательная
величина,
не превосходящая
.
2. Если
,
то
корреляционная связь отсутствует.
3. Если
,
то
между переменными существует функциональная
зависимость.
4.
,
т.е.
в отличие от коэффициента корреляции
r
(для
которого
)
при
вычислении корреляционного отношения
существенно, какую переменную считать
независимой, а какую — зависимой.
Эмпирическое
корреляционное отношение
является показателем рассеяния точек
корреляционного поля относительно
эмпирической линии регрессии,
выражаемой
ломаной, соединяющей значения
Однако
в связи с тем, что закономерное изменение
нарушается
случайными зигзагами ломаной, возникающими
вследствие остаточного действия
неучтенных факторов,
преувеличивает тесноту связи. Поэтому
наряду с
рассматривается показатель тесноты
связи
характеризующий
рассеяние
точек корреляционного поля относительно
линии регрессии
(3.3).
Показатель
получил
названиетеоретического
корреляционного отношения или
индекса
корреляции Y
по
X:
.
(3.44)
где
дисперсии
и
определяются
по формулам (12.54)—
(12.56),
в
которых групповые средние
заменены
условными средними
,
вычисленными по уравнению регрессии(12.16).
Подобно вводится и индекс корреляции X по Y:
.
(3.45)
Достоинством
рассмотренных показателей
и
R
является
то, что они могут быть вычислены при
любой форме связи между переменными.
Хотя
и завышает тесноту связи по сравнению
сR,
но
для его вычисления не нужно знать
уравнение регрессии. Корреляционные
отношения
и
R
связаны
с коэффициентом корреляции r
следующим
образом:
.
(3.46)
Коэффициент
детерминации R2,
равный
квадрату индекса корреляции (для парной
линейной модели
),
показывает
долю общей вариации зависимой переменной,
обусловленной регрессией или
изменчивостью объясняющей переменной.
Чем ближе R2 к единице, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее наблюдения примыкают к линии регрессии. Если R2 = 1, то эмпирические точки (x, y) лежат на линии регрессии и между переменными YиX существует линейная функциональная зависимость. Если R2 = 0, то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных, и линия регрессии параллельна оси абсцисс.
Расхождение
между
и
(или
)
может
быть использовано для проверки
линейности
корреляционной зависимости.
Проверка
значимости корреляционного отношения
основана
на том, что статистика
(3.47)
имеет
распределение Фишера—Снедекора
и
степенями
свободы. Поэтому
значимо
отличается от нуля, если
,
где
табличное
значение
критерия
на уровне значимости
при числе степеней свободы
и
.
Индекс корреляции R двух переменных значим, если значение статистики
(3.48)
больше
табличного
,
где
и
.
Пример
12.8. Рассмотрим
в качестве примера зависимость между
суточной выработкой продукции Y
(т) и величиной основных производственных
фондов (ОПФ) X
(млн руб.) для совокупности 50 однотипных
предприятий (12.1). По данным таблицы
вычислить корреляционное отношение и
индекс корреляции и проверить их
значимость на уровне
.
Таблица 12.1
|
Величина ОПФ, млн руб. (X) |
Середины интервалов |
|
Всего
|
Групповая средняя, т
| ||||||
|
7-11 |
11-15 |
15-19 |
19-23 |
23-27 |
|
| ||||
|
|
9 |
13 |
17 |
21 |
25 |
|
| |||
|
20-25 25-30 30-35 35-40 40-45 |
22,5 27,5 32,5 37,5 42,5 |
2 3 - - - |
1 6 3 1 - |
- 4 11 2
|
- - 7 6 1 |
- - - 2 1 |
3 13 21 11 2 |
10,3 13,3 17,8 20,3 23,0 | ||
|
Всего
|
- |
5 |
11 |
17 |
14 |
3 |
50 |
| ||
|
Групповая
средняя
|
- |
22,5 |
29,3 |
31,9 |
35,4 |
39,2 |
- |
- | ||
В
таблице через
и
обозначены середины соответствующих
интервалов, а
и
соответственно
их частоты.
В таблице групповые средние получены по формулам:
;
.
Решение. По данным табл. 12.1 на первом этапе вычислим общую среднюю признака y, для этого воспользуемся формулой:
.
Для вычисления общей дисперсии воспользуемся известной формулой:

Межгрупповую дисперсию получим по формуле (12.57):

Эмпирическое корреляционное отношение получим по формуле (1.58):

Теперь
по (12.57)
=517,8/50
= 10,36 и по (12.58)
.
Значение
близко к величине
0,740 (полученной ранее в примере 12.3).
Поэтому оправдано сделанное выше на
основании графического изображения
эмпирической линии (ломаной) регрессии
предположение о линейной корреляционной
зависимости между переменными.
Для
расчета
по уравнению регрессии
(см. пример12.1)
находим
значения
,
представленные в предпоследней графе
табл. 12.4. Затем аналогично
и
.
Как и следовало ожидать,
оказался
равным
(небольшое
расхождение объясняется округлением
промежуточных результатов при вычислении
.
Поэтому
в случае линейной связи нет смысла
вычислять
,
а
достаточно ограничиться вычислением
.
Величина коэффициента детерминации
показывает, что вариация зависимой
переменнойY
(суточной
выработки продукции) на 55,1% объясняется
вариацией независимой переменной Х
(величиной основных производственных
фондов).
Для
проверки значимости
,
учитывая, что количество интервалов по
группировочному признаку
,
по (12.63)
.
Табличное
значение
. Так как
,
то
значимо отличается от нуля. Аналогично
проверяется значимость найдем
.
По (12.64)
.
Так как
,
то индекс корреляции
значим.







,
млн руб.