- •Многомерные статистические методы (для специальности 06.18.00 «Математические методы в экономике»)
- •Содержание
- •9.Методы многомерного анализа 26
- •1.О статистических методах в экономике
- •2.Статистические методы
- •3. Многомерные статистические методы: свойства недетерминированных объектов
- •4.Методы многомерного анализа
- •Дисперсионный анализ;
- •Регрессионный анализ;
- •5.Система случайных величин
- •6.Многомерный нормальный закон распределения
- •7.Статистические выводы и оценивание
- •7.Критерии оценивания в больших выборках
- •8.Метод наименьших квадратов
- •9.Методы многомерного анализа
- •10.Дисперсионный анализ
- •11.Статистическая обработка результатов дисперсионного анализа
- •12.Основная схема дисперсионного анализа
- •13.Применение мнк для дисперсионного анализа
- •14.Планы дисперсионного анализа для изучения источников рассеивания
- •15.Дисперсионный анализ при многосторонней классификации
- •16.Планы многоступенчатой классификации
- •17. Регрессионный анализ
- •18.Задача идентификации в регрессионном анализе
- •19.Оценка результатов регрессионного анализа
- •20.Проверка воспроизводимости
- •21.Проверка значимости
- •22.Проверка адекватности
- •23.Метод гребневой регрессии в регрессионном анализе
- •24.Метод главных компонент
- •25.Факторный анализ
- •26.Корреляционный анализ
- •27.Планирование эксперимента в задачах идентификации
- •28.Общие критерии оптимальности планов эксперимента
- •29.Ортогональный план эксперимента
- •30.Построение матрицы планирования полного факторного эксперимента
- •31.Дробный факторный эксперимент
- •32.Анализ подбираемых моделей при ортогональном планировании
25.Факторный анализ
Факторный анализ (ФА) по постановке задачи близок к методу главных компонент. Его цель – найти m общих факторов, число которых меньше, чем число исходных факторов k.
Математически требуется найти такую матрицу нагрузок или матрицу преобразований А, которая делает факторы независимыми. Особенность задачи в том, что при m<k решение задачи неоднозначно.
В ФА модель наблюдения имеет вид:
Число вновь вводимых факторов не совпадает с числом используемых в наблюдении. В ФА рассматриваются только m общих факторов, т.е. таких, которые в рассеивании k переменных являются общими и водятся специальные факторы , которые часто интерпретируются как ошибка измерения.
Ошибка измерения в матричной форме имеет вид:
Цель ФА – найти такую матрицу нагрузок А, которая делает факторы независимыми. В исходных наблюдениях были учтены факторы, которые могут быть зависимыми. В ФА делается попытка объяснить недетерминированный объект с помощью меньшего числа факторов, которые являются независимыми. Независимые факторы можно найти, но часто сложно их объяснить из-за недостатка знаний об объекте.
В этом случае используется процедура вращения факторов. Критерии оптимизации при этом могут быть разными, но направленными на получение оптимальных свойств описания объекта в новой системе координат (минимизация сумы квадратов отклонений). Применяют процедуры как ортогонального, так и косоугольного (координаты находятся под углом меньше ) вращения.
ФА проводится в виде последовательной процедуры, состоящей из ряда этапов:
получение первого приближенного значения; здесь может быть использован метод главных компонент (k=m);
отбрасывание значений с малым , упорядочивание по характеристическим числам;
выбор из множества факторов наиболее интерпретируемых.
В методе главных компонент используют редуцированную матрицу корреляции (на диагонали этой матрицы стоят коэффициенты множественной корреляции).
Вращение факторов осуществляется по различным критериям. Например, критерий verymax, который максимизирует дисперсию факторных нагрузок (параметров А).
ФА имеет целый ряд ограничений:
более критичен к предпосылке о нормальности закона распределения (сначала необходимо построить гистограмму наблюдений и сравнить, совпадает ли она с нормальным законом);
при работе с матрицей корреляции R не должно быть переменных с функциональной связью, если таковые переменные обнаруживаются, то обращение невозможно;
факторы , отвечающие в модели за погрешность, должны быть некоррелированными как с общими факторами, так и между собой;
аналитическое ограничение на возможное число факторов:
;
данные не должны быть неоднородными.
26.Корреляционный анализ
В корреляционном анализе (КА) решается вопрос изучения зависимости между факторами, при этом рассматривается следующая статистическая задача: является ли зависимость между факторами i и j статистически значимой. Эта зависимость может быть определена так, что если гипотеза о статистической значимости зависимости принимается с данной доверительной вероятностью, это значит, что факторы зависимы. Но если гипотеза отклоняется, то это не значит, что на самом деле факторы не связаны. Они могут быть связаны даже зависимостью, близкой к функциональной (КА этого не выявляет).
Переменные связаны сильно
Переменные связаны неявно
В КА используются следующие формулы:
- коэффициент корреляции.
Для оценки математического ожидания используется среднее арифметическое с числом степеней свободы (l-1).
,
где X – нормированная СВ.
Для удобства анализа взаимосвязи факторов используют метод корреляционных плеяд, который представляет собой граф, вершинами которого являются факторы, а. ребра указывают на то, что коэффициент парной регрессии для данной пары факторов превышает пороговое значение.