
- •Лекция 1
- •1.1. Принципы измерений и шкалирования
- •1.2. Сопоставаление методов шкалирования
- •1.3. Методы сравнительного шкалирования
- •Лекция 2
- •2.1. Понятие дисперсионного анализа
- •2.2. Однофакторный дисперсионный анализ
- •2.3. Определение зависимых и независимых переменных
- •2.4. Измерение эффекта.
- •2.5. Проверка значимости.
- •Лекция 3
- •3.1. Допущения в дисперсионном анализе.
- •3.2. Многофакторный дисперсионный анализ
- •3.3. Ковариационный анализ
- •3.4. Парная корреляция
- •3.5. Частная корреляция
- •Лекция 4
- •4.1. Условия, которые допускают использование регрессионного анализа
- •4.2. Парная регрессия
- •4.3. Стадии парного регрессионного анализа
- •4.4. Поле корреляции
- •4.5. Определение параметров уравнения регрессии.
- •4.6. Нормированный коэффициент регрессии и проверка значимости.
- •Лекция 5
- •5.1. Теснота и значимость связи
- •5.2. Точность предсказаний
- •5.3. Допущения модели регрессионного анализа
- •5.4. Факторный анализ
- •Лекция 6
- •6.1. Факторная модель при нормированных переменных
- •6.2. Статистики факторного анализа
- •6.3. Этапы выполнения факторного анализа
- •Лекция 7
- •7.1. Формулировка проблемы и построение корреляционной матрицы.
- •7.2. Определение метода факторного анализа и числа факторов
- •7.3. Вращение и интерпретация факторов.
- •7.4. Вычисление значений факторов, отбор переменных-имитаторов и определение подгонки модели.
- •Лекция 8
- •8.1. Сущность кластерного анализа.
- •8.2. Статистики кластерного анализа
- •8.3. Этапы выполнения кластерного анализа.
6.3. Этапы выполнения факторного анализа
Можно выделить девять этапов факторного анализа. Для наглядности представим эти этапы на схеме, а затем дадим им краткую характеристику.
Этапы выполнения факторного анализа приведены на рис.
Формулировка проблемы
Построение корреляционной матрицы
Определение метода факторного анализа
Определение числа факторов
Вращение факторов
Интерпретация факторов
Вычисление значений факторов
Отбор
переменных-имитаторов
Определение подгонки модели
Рис. Выполнение факторного анализа
Лекция 7
Вопросы лекции:
7.1. Формулировка проблемы и построение корреляционной матрицы.
7.2. Определение метода факторного анализа и числа факторов.
7.3. Вращение и интерпретация факторов.
7.4. Вычисление значений факторов, отбор переменных-имитаторов и определение подгонки модели.
Краткая характеристика этапов выполнения факторного анализа.
7.1. Формулировка проблемы и построение корреляционной матрицы.
Формулировка проблемы. Необходимо четко определить цели факторного анализа. Переменные, подвергаемые факторному анализу, задаются исходя из прошлых исследований, теоретических выкладок либо по усмотрению исследователя. Необходимо, чтобы переменные измерялись в интервальной или относительной шкале. Опыт показывает, что объем выборки должен быть больше в четыре – пять раз, чем число переменных.
Построение корреляционной матрицы. В основе анализа лежит матрица корреляции между переменными. Целесообразность выполнения факторного анализа определяется наличием корреляций между переменными. Если же корреляции между всеми переменными небольшие, то факторный анализ проводить бесполезно. Переменные, тесно взаимосвязанные между собой, как правило, тесно коррелируют с одним и тем же фактором или факторами.
Для проверки целесообразности использования факторной модели существует несколько статистик. С помощью критерия сферичности Бартлетта проверяется нулевая гипотеза об отсутствии корреляции между переменными в генеральной совокупности. Это значит, что рассматривается утверждение о том, что корреляционная матрица совокупности – это единичная матрица, в которой все диагональные элементы равны единице, а все остальные равны нулю. Проверка с помощью критерия сферичности основана на преобразовании детерминанта корреляционной матрицы в статистику хи-квадрат. При большом значении статистики нулевую гипотезу отклоняют. Если же нулевую гипотезу не отклоняют, то выполнение факторного анализа нецелесообразно. Другая полезная статистика – критерий адекватности выборки Кайзера-Мейера-Олкина (КМО). Данный коэффициент сравнивает значения наблюдаемых коэффициентов корреляции со значениями частных коэффициентов корреляции. Небольшие значения КМО – статистики указывают на то, что корреляции между парами переменных нельзя объяснить другими переменными, а это значит, что использование факторного анализа нецелесообразно.
7.2. Определение метода факторного анализа и числа факторов
Определение метода факторного анализа. Различные методы факторного анализа различаются в зависимости от подходов, которые используются для выделения коэффициентов значения факторов. Существует два метода – анализ главных компонент и анализ общих факторов. Метод факторного анализа, который учитывает всю дисперсию данных – это анализ главных компонент.
Диагональ корреляционной матрицы состоит из единиц, и вся дисперсия введена в матрицу факторных нагрузок. Если основная задача исследователя – это определение минимального числа факторов, которые вносят максимальный вклад в дисперсию данных, то выполняют анализ главных компонент.
В анализе общих факторов факторы определяют только на основании общей дисперсии. Общности располагаются на диагонали корреляционной матрицы. Этот метод подходит, если основной задачей является определение латентных переменных и общей дисперсии. Этот метод иногда называют разложение матрицы.
Существуют и другие методы оценки общих факторов: метод невзвешенных наименьших квадратов, обобщенный метод наименьших квадратов, метод максимального правдоподобия, метод распознавания образов.
Определение числа факторов. Для решения этой задачи предлагается несколько процедур:
определение, основанное на предварительной информации. Иногда известно, сколько факторов можно ожидать и таким образом заранее определить число выделяемых факторов. После извлечения желаемого числа факторов их выделение прекращают;
определение, основанное на собственных значениях факторов. В этом методе учитывают только факторы, собственные значения которых выше 1,0; остальные факторы в модель не включают. Собственное значение представляет собой значение дисперсии, обусловленной действием этого фактора. Поэтому рассматривают только факторы с дисперсией выше 1,0. Если число переменных меньше 20, то этот метод завышает число факторов;
определение, основанное на критерии «каменистой осыпи». Графическое изображение этого критерия представляет собой график зависимости собственных значений факторов от их номеров в порядке выделения.
3,0
2,5
Собственные 2,0
значения 1,5
1,0
0,5
0,0
1 2 3 4 5 6
Число факторов
Рис. График «каменистой осыпи»
Обычно график имеет четкий разрыв между крутой частью кривой (здесь факторам свойственны большие собственные значения) и плавной хвостовой частью (медленное убывание собственных значений). Вот это плавное убывание собственных значений и называется осыпью. Опыт показывает, что точка, с которой начинается особь, указывает на действительное число факторов;
определение на основе процента объясненной дисперсии. В этом методе число выделяемых факторов определяют так, чтобы кумулятивный процент дисперсии, выделяемый факторами, достиг бы удовлетворительного уровня. Что считать удовлетворительным зависит от задачи. Однако рекомендуется выделять такое число факторов, которое объясняет, по крайней мере, 60% дисперсии;
определение, основанное на оценке надежности, выполняемой расщеплением. В этом методе выборку расщепляют напополам, и факторный анализ выполняют для каждой половины. При этом оставляют только факторы с высокой степенью соответствия факторных нагрузок в двух подвыборках;
определение, основанное на критериях значимости. Можно определить статистическую значимость отдельных собственных значений и оставить только статистически значимые факторы. Недостаток этого метода состоит в том, что при больших размерах выборок (больше 200) многие факторы статистически значимые, хотя с практической точки зрения, многие из них объясняют небольшую долю полной дисперсии.