- •Многомерные статистические методы (для специальности 06.18.00 «Математические методы в экономике»)
- •Содержание
- •9.Методы многомерного анализа 26
- •1.О статистических методах в экономике
- •2.Статистические методы
- •3. Многомерные статистические методы: свойства недетерминированных объектов
- •4.Методы многомерного анализа
- •Дисперсионный анализ;
- •Регрессионный анализ;
- •5.Система случайных величин
- •6.Многомерный нормальный закон распределения
- •7.Статистические выводы и оценивание
- •7.Критерии оценивания в больших выборках
- •8.Метод наименьших квадратов
- •9.Методы многомерного анализа
- •10.Дисперсионный анализ
- •11.Статистическая обработка результатов дисперсионного анализа
- •12.Основная схема дисперсионного анализа
- •13.Применение мнк для дисперсионного анализа
- •14.Планы дисперсионного анализа для изучения источников рассеивания
- •15.Дисперсионный анализ при многосторонней классификации
- •16.Планы многоступенчатой классификации
- •17. Регрессионный анализ
- •18.Задача идентификации в регрессионном анализе
- •19.Оценка результатов регрессионного анализа
- •20.Проверка воспроизводимости
- •21.Проверка значимости
- •22.Проверка адекватности
- •23.Метод гребневой регрессии в регрессионном анализе
- •24.Метод главных компонент
- •25.Факторный анализ
- •26.Корреляционный анализ
- •27.Планирование эксперимента в задачах идентификации
- •28.Общие критерии оптимальности планов эксперимента
- •29.Ортогональный план эксперимента
- •30.Построение матрицы планирования полного факторного эксперимента
- •31.Дробный факторный эксперимент
- •32.Анализ подбираемых моделей при ортогональном планировании
17. Регрессионный анализ
Методы регрессионного анализа (РА) относятся к многомерным статистическим методам и основаны на понятии регрессии. В РА решаются несколько задач, различных по постановке. Основные из них:
известна структура и аналитическое представление модели, выполняется оценка параметров модели – задача идентификации;
получены экспериментальные данные о недетерминированном объекте, которые используются для выбора лучших моделей – задача дискриминации;
отсутствует априорная информация о структуре модели, экспериментальные данные используются для поиска модели, пригодной для описания данных, ищутся ответы на вопросы:
сколько независимых переменных должно входить в модель (используется метод ранговой коррекции и экспертных оценок),
является ли модель линейной или нелинейной (выясняется тип нелинейности по каждой переменной),
анализируются данные на возможность представления модели гладкой непрерывной функцией.
18.Задача идентификации в регрессионном анализе
Задача идентификации может быть представлена следующим образом: в факторном пространстве переменных задана функция, в т.ч. как гладкая непрерывная.
Эту функцию можно разложить в ряд Тейлора в любой точке.
Обычно в качестве модели, которая идентифицируется, выбирается отрезок ряда Тейлора, имеющий следующий вид:
Построение модели в рамках её номинальной структуры (т.е. определение коэффициентов уравнения регрессии) может производиться двумя основными способами:
пассивный эксперимент – эксперимент, в ходе которого наблюдается нормальное поведение объекта;
активный эксперимент заключается в том, что исследователем задается некоторая схема варьирования факторов или, иначе, задается план эксперимента.
В экономике чаще всего возможен пассивный эксперимент и только в определенных задачах, где объект исследования допускает варьирование факторов по схеме, заданной исследователем, возможно проведение активного эксперимента.
Для линейной модели РА используется следующее выражение:
Нереализованная форма модели справедлива и для нелинейных шкал факторов, в которых , где функция может быть представлена , которые используются для введения нелинейности.
Каждая строка матрицы переменных (X) может быть интерпретирована как точка в факторном пространстве.
E – вектор ошибок наблюдения, В – вектор коэффициентов уравнения регрессии.
В данном уравнении матрица переменных и столбец результатов известны, неизвестны коэффициенты регрессии.
Т.е. ошибки не коррелированны, независимы между собой и имеют однородную дисперсию.
В РА для того, чтобы оценить точность полученной оценки параметра наблюдения, необходимо выдвинуть гипотезу о типе распределения ошибки наблюдения:
Это означает, что Е принадлежит множеству многомерного нормального распределения с математическим ожиданием 0, дисперсией и единичной матрицей, которая характеризует взаимозависимость ошибок.
Решая задачу МНК, получим:
Данная матрица симметрична относительно главной диагонали.
Рассмотрим свойство матрицы . Она называется квадратичной формой, если:
Выполним нормировку результатов наблюдения следующим образом:
С учетом нормировки может быть получено следующее отношение:
Информационная матрица Фишера представляет собой матрицу парных корреляций. Для независимых входящих переменных она равна единичной. Диагональная матрица может быть получена в случае ортогональности матрицы Х (т.е. произведение всех переменных равно нулю кроме произведения переменных само на себя).
Корреляционная матрица М позволяет вычислить коэффициент множественной корреляции, который указывает на то, какая доля факторов в рассеивании рассматриваемых переменных является общими со всеми остальными.
, где
- определитель минора матрицы.
Например, если , это значит, что 60% факторов в рассеивании У для первой переменной являются общими со всеми остальными.
Обратная к информационной матрице Фишера позволяет определить оценку ковариационной матрицы в уравнении регрессии:
Таким образом, дисперсия оценок любого параметра модели зависит от корреляции входящих переменных.