Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
9_факторный анализ.doc
Скачиваний:
202
Добавлен:
01.02.2015
Размер:
823.81 Кб
Скачать
    1. Сущность факторного анализа

Пусть для каждого конкретного объекта измерены четыре характеристики, которые обусловлены действием двух факторов и. Фактордействует на все четыре характеристики объекта, а фактордействует лишь на два признакаи.

Рисунок 9.2 Схема модели факторного анализа

Значит, значения признаков иопределяются только фактором, а признакииопределяются совокупным действием фактороми. Но вначале неизвестно ни количество действующих факторов, ни их взаимосвязь с измеренными признаками. Необходимо исследовать интенсивность влияния факторовина признакии выделить в значенияхте части, которые обусловлены действием каждого из факторовив отдельности.

Для решения этой задачи предполагают, что линейно зависят от. Для рассматриваемого случая имеем

где (1)

- коэффициенты, называемые факторными нагрузками.

Если рассмотреть метод на основании приведенного выше примера, когда имеется рассматриваемых объектов, для каждого из которых определено значение четырех признаков, то в четырехмерном графическом пространстве с осями координатэто может быть представлено как облако източек. Для Если это четырехмерное пространство рассечь плоскостью, в которой находятся координатные оси, отвечающие признаками, то в сечении мы увидим облако точек, которое в условиях взаимосвязи признаковидруг с другом представляет собой эллипс рассеяния.

Перед проведением факторного анализа исходные значения признаков выборочной совокупности необходимо стандартизировать (центрировать и нормировать) с помощью преобразования

где - исходное значение j-го признака t-того объекта;

-среднее значение j-ого признака;

–стандартное отклонение j-ого признака.

Центр эллипса рассеяния стандартизированных значений будет находиться в точке начала координат, как показано на рисунке 9.3.

Рисунок 9.3 Эллипсы рассеянья в пространстве двух стандартизированных переменных

Форма этого эллипса (сжатость – вытянутость) будет определяться величиной коэффициента корреляции с, т.е., Чем больше, тем более вытянут эллипс и прион превращается в прямую линию, а при- в круг. Если провести оси эллипсаи, то по мере увеличенияпроисходит уменьшение степени разброса точек наблюдений вдоль одной оси эллипса (на рисунке – ось) и увеличение разброса вдоль другой оси эллипса (на рисунке – ось).

Если перейти от исходной координатной системы ,к новой,, оси которой ориентированы вдоль осей эллипса рассеяния, то, очевидно, что в новой системе координат значения переменнойвдоль осибудут иметь меньшую дисперсию, чем в исходной системе вдоль оси, а значения этой переменной вдоль оси, наоборот, будут иметь большую дисперсию, чем в исходной системе вдоль оси.

Поэтому переменная несет в себе больше информации о выборке, чем. При этом, чем сильнее связаны между собой признакии, тем большим становится удельный вес той из новых переменных, которая ориентируется вдоль главной оси эллипса рассеяния.

Следовательно, в случае многомерного пространства появляется возможность ранжирования переменных (признаков) по их дисперсии в соответствии с их вкладом (значимостью) в общую характеристику изучаемого объекта, т.е. по уменьшению дисперсии значений признаков вдоль новых координатных осей .

Трудно представить, как выглядит в многомерном пространстве облако точек выборочной многомерной совокупности. По аналогии с рассмотренным выше двумерным случаем можно предполагать, что оно представляет собой эллипсоид с несколькими разновеликими ортогональными осями. Поэтому в условиях взаимозависимости признаков для более компактного представления информации переходят к новой ортогональной системе координат (ориентированной по главным осям этого эллипсоида). Переменные этой новой системы – главные компоненты (и) – концентрируют в себе основную информацию об исходной выборке и снижают размерность исходного признакового пространства (). Эта процедура перехода к новой системе координат ().

Указанный переход не затрагивает геометрической структуры взаимного расположения точек наблюдений. Характер их распределения сохраняется. Поэтому суммарная дисперсия остается прежней, т.е.

или в общем, виде

Факторные нагрузки в уравнении представляют собой коэффициенты корреляции между исходными и новымипеременными.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]