Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Программное обеспечение КАДС.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
204.65 Кб
Скачать

Классификация многомерных методов анализа данных

Классы:

1. Методы снижения размерности переменных: факторный анализ, семантический дифференциал, интегральные индексы.

2. Методы классификации: кластерный анализ, дискриминантный анализ, многомерное шкалирование.

3. Методы изучение причинно-следственных связей/прогностические: множественный регрессионный анализ, дискриминантный анализ; множественный дисперсионный анализ.

Факторный анализ – метод многомерной статистики, используемый для выявления относительно небольшого количества глубинных (явно не наблюдаемых или латентных конструктов, которые можно использовать для представления отношений между многочисленными наблюдаемыми переменными.

Если в анализе данных одновременно используется несколько переменных, то их можно представить как многомерное геометрическое пространство, в котором каждая переменная является осью – «пространство признаков» (количественные, порядковые и дихотомические переменные; но желательно, чтобы все оси пространства имели одинаковый уровень измерения). В качестве исходных переменных рассматриваются оценочные псевдоинтервальные шкалы.

Оси пространства признаков тем ближе расположены друг к другу, чем выше корреляция между соответствующими переменными.

В пространстве признаков решается задача снижения размерности, выражающаяся в том, что мы конструируем относительно небольшое число новых переменных, которые содержали бы в себе основную часть информации из имеющихся переменных.

Подходы:

1) метод главных компонент;

2) факторный анализ:

- первая задача: определение числа факторов. SPSS формирует столько факторов, сколько имеется исходных переменных. Задача исследователя определить оптимальное число факторов. Выбор числа факторов может быть осуществлён:

1) теоретический – принудительное назначение исследователем числа факторов;

2) выбираются только те факторы, для которых собственные значения превышают единицу; содежится в таблице Total Variance Explained.

Component

Total

% of Variance

Индивидуальная д.

Cummultive % of Variance

Объяснённая д.

(фактор)

числовые

числовые

Сумма

значения

значения

% of Variance

(собственные)

Собственное значение превышают единицу. Наибольшие – сверху.

3) выбираются только те факторы, для которых процент объяснённой дисперсии достаточно высок.

Факторную (корреляционную) матрицу легко интерпретировать, когда она является простой: каждая исходная переменная имеет значительную по величине нагрузку только на 1 фактор. Если матрица не является простой, её необходимо подвергнуть процедуре вращения. Различают ортогональное и неортогональное вращение факторов. Процедура (ортогональная): Varimax. Вращённую матрицу уже можно интерпретировать. Rotated Component Matries.

Исходные переменные

Component

1

2

2

x1

x2

x3

.

.

.

xk

,836

,750

,520

,930

,560

,841

Нужно назвать факторы (латентные конструкты), которые получили.

Качество факторной модели. Проверка. Способы:

1) качество модели оценивается % суммарной объяснённой дисперсии; если больше 50, то полученная модель качественная.

КМО = должно превышать 0,5.

Полученные факторы можно сохранять в виде новых переменных. От -4 до 4. Минус – характеристика слабо выражена. Плюс – сильно выражена в изучаемых объектах.