
- •Подготовка инструментария к компьютерной обработке
- •Получение и анализ таблиц очр
- •Команды преобразования данных
- •Проверка статистических гипотез в spss
- •Дисперсионный анализ
- •Двухфакторный дисперсионный анализ
- •Графическое представление данных
- •Построение и анализ таблиц сопряжённости
- •Корреляционный анализ
- •Регрессионный анализ
- •Множественная линейная регрессия
- •Двухфакторный дисперсионный анализ
- •Социологические индексы как инструмент анализа данных
- •Компьютерная обработка пилотажного исследования
- •Построение вс. Определение ошибки выборки и расчёт ди
- •Оформление аналитической записки по результатам статистической обработки данных
- •Классификация многомерных методов анализа данных
- •Семинары
Классификация многомерных методов анализа данных
Классы:
1. Методы снижения размерности переменных: факторный анализ, семантический дифференциал, интегральные индексы.
2. Методы классификации: кластерный анализ, дискриминантный анализ, многомерное шкалирование.
3. Методы изучение причинно-следственных связей/прогностические: множественный регрессионный анализ, дискриминантный анализ; множественный дисперсионный анализ.
Факторный анализ – метод многомерной статистики, используемый для выявления относительно небольшого количества глубинных (явно не наблюдаемых или латентных конструктов, которые можно использовать для представления отношений между многочисленными наблюдаемыми переменными.
Если в анализе данных одновременно используется несколько переменных, то их можно представить как многомерное геометрическое пространство, в котором каждая переменная является осью – «пространство признаков» (количественные, порядковые и дихотомические переменные; но желательно, чтобы все оси пространства имели одинаковый уровень измерения). В качестве исходных переменных рассматриваются оценочные псевдоинтервальные шкалы.
Оси пространства признаков тем ближе расположены друг к другу, чем выше корреляция между соответствующими переменными.
В пространстве признаков решается задача снижения размерности, выражающаяся в том, что мы конструируем относительно небольшое число новых переменных, которые содержали бы в себе основную часть информации из имеющихся переменных.
Подходы:
1) метод главных компонент;
2) факторный анализ:
- первая задача: определение числа факторов. SPSS формирует столько факторов, сколько имеется исходных переменных. Задача исследователя определить оптимальное число факторов. Выбор числа факторов может быть осуществлён:
1) теоретический – принудительное назначение исследователем числа факторов;
2) выбираются только те факторы, для которых собственные значения превышают единицу; содежится в таблице Total Variance Explained.
Component |
Total |
% of Variance Индивидуальная д. |
Cummultive % of Variance Объяснённая д. |
|
(фактор) |
числовые |
числовые |
Сумма |
|
|
значения |
значения |
% of Variance |
|
|
(собственные) |
|
|
|
Собственное значение превышают единицу. Наибольшие – сверху.
3) выбираются только те факторы, для которых процент объяснённой дисперсии достаточно высок.
Факторную (корреляционную) матрицу легко интерпретировать, когда она является простой: каждая исходная переменная имеет значительную по величине нагрузку только на 1 фактор. Если матрица не является простой, её необходимо подвергнуть процедуре вращения. Различают ортогональное и неортогональное вращение факторов. Процедура (ортогональная): Varimax. Вращённую матрицу уже можно интерпретировать. Rotated Component Matries.
Исходные переменные |
Component |
||
1 |
2 |
2 |
|
x1 x2 x3 . . . xk |
,836
,750
,520 |
,930 ,560 |
,841
|
Нужно назвать факторы (латентные конструкты), которые получили.
Качество факторной модели. Проверка. Способы:
1) качество модели оценивается % суммарной объяснённой дисперсии; если больше 50, то полученная модель качественная.
КМО = должно превышать 0,5.
Полученные факторы можно сохранять в виде новых переменных. От -4 до 4. Минус – характеристика слабо выражена. Плюс – сильно выражена в изучаемых объектах.