
- •План лекции:
- •1Й учебный вопрос. Конфлюэнтный анализ
- •Вспомогательная таблица для расчета параметров парной линейной регрессии
- •2Й учебный вопрос. Анализ мультиколлинеарности
- •Вспомогательная таблица для расчета парного линейного коэффициента корреляции между показателями x1 и y
- •После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:
- •Матрица коэффициентов парной корреляции
- •Вспомогательная таблица для расчета параметров уравнения
- •Вспомогательная таблица для расчета ошибки аппроксимации и индекса детерминации
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ПРИБОРОСТРОЕНИЯ И ИНФОРМАТИКИ
Кафедра ЭФ-4 «Бухучет, финансы и аудит»
УТВЕРЖДАЮ
Заведующий кафедрой ЭФ-4
_______(Бондарчук Н.В.)
«__» июня 2007г.
Для студентов 2го курса экономического факультета
Специальностей 08.0105 и 08.0109
Кандидат экономических наук, доцент, Нечаева Т.В.
(ученая степень, ученое звание, фамилия и инициалы автора)
ЛЕКЦИЯ № 4
по дисциплине 5483 (Эконометрика)
ТЕМА «Отбор факторов, включаемых в уравнение множественной регрессии, на основе анализа мультиколлинеарности»
Обсуждена на заседании кафедры
(предметно-методической секции)
«___»___________2007г.
Протокол № __
МГУПИ – 2007г.
Тема лекции: «Отбор факторов, включаемых в уравнение множественной регрессии на основе анализа мультиколлинеарности»
Учебные и воспитательные цели:
Создание у студентов представления о важной роли правильного отбора факторов (независимых переменных), включаемых в уравнение множественной регрессии
Изучение сущности конфлюэнтного анализа, как одного из самых первых методов, предложенных для решения проблемы отбора факторов
Усвоение основных методов анализа мультиколлинеарности
Время: 2 часа (90 мин.).
Литература (основная):
«Эконометрика», под редакцией Елисеевой И.И., М., «Финансы и статистика», 2005г
Елисеева И.И., Курышева С.В., Гордеенко Н.М., Бабаева И.В., Костеева Т.В., Михайлов Б.А., «Практикум по эконометрике», Изд-во «Финансы и статистика», Москва, 2004.
Литература (дополнительная):
Тихомиров Н.П., Дорохина Е.Ю., «Учебно-методическое пособие по дисциплине «Эконометрика», Изд-во РЭА., Москва, 2004.
Кремер Н.Ш., Путко Б.А., «Эконометрика: Учебник для вузов», ЮНИТИ-ДАНА, Москва, 2004.
Доугерти К., «Введение в эконометрику», Инфра-М, Москва, 2004.
Учебно-материальное обеспечение:
Наглядные пособия: раздаточный материал в виде плакатов
Технические средства обучения: электронный конспект лекций
План лекции:
Введение – до 5 мин.
Основная часть (учебные вопросы) – до 80 мин.
1-й учебный вопрос: Конфлюэнтный анализ - 40 мин.
2-й учебный вопрос: Анализ мультиколлинеарности – 40 мин.
Заключение – до 5 мин.
ТЕКСТ ЛЕКЦИИ
Введение.
При построении уравнений множественной регрессии одной из важнейших проблем является отбор факторов, которые целесообразно включить в модель.
В 30-е г. XX в. увлечение множественной регрессией сменилось разочарованием. Стремясь включить как можно больше факторов в модель, исследователи часто сталкивались с бессмысленными результатами. Для проведения правильного анализа необходимо исследовать всю совокупность связей между переменными. Поэтому специалисты по эконометрике пытались предлагать различные подходы к отбору факторов, включаемых в модель множественной регрессии. Мы рассмотрим на данной лекции сущность так называемого конфлюэнтного анализа и затем более подробно изучим анализ мультиколлинеарности.
1Й учебный вопрос. Конфлюэнтный анализ
Еще в 1934 году Роберт Фриш предложил строить и исследовать все возможные виды уравнений регрессии между различными сочетаниями переменных.
Анализируя разные варианты уравнений регрессии, Р. Фриш обнаружил эффект так называемой деградации параметров регрессии. Он заключался в том, что если в регрессию включить много переменных, имеющих линейные связи друг с другом, то коэффициенты регрессии возвращаются к тем же значениям, которые они имели в уравнении с наименьшим числом переменных. Поэтому включение дополнительных переменных в модель становится бессмысленным.
Для оценки качества построенных моделей Роберт Фриш в своих исследованиях использовал индекс детерминации R2
Он предложил разделить все независимые переменные на три типа:
Полезные;
Лишние;
Вредные.
Если после включения некоторой переменной xi в модель существенно увеличиваетcя индекс детерминации, причем коэффициент регрессии при других переменных при этом изменится, то такую переменную можно назвать полезной переменной.
Если переменную включают в модель, и при этом ни индекс детерминации, ни коэффициенты регрессии при других переменных существенно не меняются, то переменная называется лишней.
Если переменную включают в модель и при этом индекс детерминации существенно не меняется, но значительно изменяются коэффициенты регрессии при других переменных, то переменная называется вредной.
Такой анализ регрессионных моделей Р. Фриш назвал конфлюэнтным анализом и предложил его использовать для отбора факторных переменных, которые следует включать в модель.
Рассмотрим использование конфлюэнтного анализа на примере.
Пример.
Имеются следующие исходные данные (таблица 2.1):
Таблица 2.1
-
№№
x1
x2
x3
x4
x5
y
1
1
5
0
5
3
1
2
2
12
0
6
6
5
3
2
18
0
9
8
6
4
2
6
1
3
5
0,8
5
3
16
0
5,3
12
3
6
3
14
1
4,7
10
3
7
3
18
1
6
12
4
8
3
10
2
3,3
9
0,5
9
4
15
2
3,75
12
2,5
10
5
16
3
3,2
14
1,5
Σ
28
130
10
49,3
91
27,3
В таблице 2.1 приняты следующие обозначения:
x1- число членов семьи,
x2 - доход семьи,
x3 - число детей в семье,
x4 - среднедушевой доход,
x5 - затраты на питание,
y - расходы на
покупку товаров длительного пользования.
Y)Zq)r)) ¸)¹ǣ)ǤǨ)ǩǮ)ǯǰ'DZ
Построим два уравнения линейной регрессии:
Уравнение парной линейной регрессии y = a0 + a1 x4 (выражающее зависимость расходов на покупку товаров длительного пользования от среднедушевого дохода семьи);
Уравнение двухфакторной линейной регрессии y = a0 + a1 x2+ a2 x4 (выражающее зависимость расходов на покупку товаров длительного пользования от дохода семьи и среднедушевого дохода)
Для построения первого уравнения необходимо построить вспомогательную таблицу (см. таблицу 2.2.), чтобы на основе итоговых сумм в нижней строке этой таблицы рассчитать параметры уравнения линейной регрессии по формулам, известным из курса теории статистики (изученного в третьем семестре).
Таблица 2.2