Факторный анализ: цели, этапы

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский политехнический университет Петра Великого (бывш. СПбГПУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Ответы статистика.docx

Скачиваний:

Добавлен:

16.09.2019

Размер:

432.6 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 108 9 10 > Следующая >>>

Факторный анализ: цели, этапы

Совокупность методов, которые на основе объективно существующих корреляционных взаимосвязей признаков (или объектов) позволяют выявлять скрытые обобщающие характеристики структуры изучаемых объектов и их свойств.

Цели Факторного анализа:

сокращение числа переменных

(data reduction)

2) определение структуры взаимосвязей между переменными (classify data)

Факторный анализ не требует априорного разделения признаков на зависимые и независимые, так как все признаки рассматриваются как равноправные.

Под фактором понимается гипотетическая, непосредственно не измеряемая, латентная (скрытая) переменная, которая имеет линейные корреляционные связи с исходными измеряемыми переменными.

ОГРАНИЧЕНИЕ: используемые в ФА признаки должны быть количественными.

1 Этап: Построение матрицы попарных корреляций

Вычисление коэффициентов корреляции Пирсона предполагает, что каждый из анализируемых количественных признаков, подчиняется нормальному закону.

Этап 2: Выделение факторов -Метод главных компонент (МГК)

осуществляет переход к новой системе координат F₁,..., F_p в исходном пространстве признаков X₁,..., X_k

От полной дисперсии

Идея МГК:

Линейные комбинации выбираются таким образом, что среди всех возможных линейных нормированных комбинаций исходных признаков первая ГК F₁(х) обладает наибольшей дисперсией.
Геометрически - это ориентация новой координатной оси F₁ вдоль направления наибольшей вытянутости эллипсоида рассеивания объектов исследуемой выборки в пространстве признаков X₁,…,X_k .
Вторая ГК имеет наибольшую дисперсию среди всех оставшихся линейных преобразований, некоррелированных с первой главной компонентой.

Этап 3: Вращение матрицы факторных нагрузок

Поиск такого положения системы координат, которое для каждой строки (столбца) увеличивало бы большие факторные нагрузки и уменьшало бы малые.
Суть: максимизация дисперсии (изменчивости) "новой" переменной (фактора) и минимизации разброса вокруг нее

Методы вращения матрицы факторных нагрузок:

Варимакс (Varimax) – для столбцов – минимизируется число переменных
Квартимакс (Quartimax) – для строк – минимизирует число факторов
Эквамакс (Equamax) – комбинация методов Варимакс и Квартимакс

Процедура ФА:

Расчет корреляционной матрицы;

2) Вычисление матрицы факторных нагрузок по соответствующим собственным векторам корреляционной матрицы;

3) Ортогональное вращение матрицы факторов;

4) Определение признаков, объединившихся в каждом факторе.

Всегда старайтесь дать наименование фактору!

Объекту с большим значением факторного веса присуща большая степень проявления свойств, определяемых данным фактором

Что дает ФА?

Объединяет связанные исходные признаки в подгруппы
Позволяет более наглядно представить взаимное расположение имеющихся подгрупп наблюдений

Кластерный анализ: цели, Евклидово расстояние.

Разделение выборки объектов на непересекающиеся подмножества (кластеры) так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.

Критерий для определения схожести и различия кластеров - расстояние между точками на диаграмме рассеивания.

Цели кластеризации:

Понимание данных (Каждому кластеру – свой метод анализа)
Сжатие данных (Один типичный представитель от каждого кластера)
Novelty Detection (Выделение нетипичных объектов)

Мера расстояния между кластерами – Евклидово расстояние

Расстояние между 2 точками в 2-мерном пространстве:

Расстояние между 2 точками в 3-мерном пространстве

<<< < Предыдущая 1 2 3 4 5 6 78 / 108 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.09.2019122.37 Кб2Ответы по УП.doc
#
21.09.2019397.02 Кб7Ответы по физике.docx
#
19.09.201990.11 Кб2Ответы по философии к летней ссееессиииии)).doc
#
12.09.201963.49 Кб1Ответы по экономике.doc
#
20.09.2019604.67 Кб25ответы Рудина.doc
#
16.09.2019432.6 Кб1Ответы статистика.docx
#
23.09.2019490.42 Кб4ответы философия.rtf
#
18.08.2019162.3 Кб2Ответы Человек-Общество.doc
#
16.04.2015576.12 Кб5ответы-исправленные.docx
#
31.08.2019478.21 Кб2Ответы. общая часть.doc
#
25.09.20195.1 Mб71ответы1.doc

Факторный анализ: цели, этапы

1 Этап: Построение матрицы попарных корреляций

Кластерный анализ: цели, Евклидово расстояние.