
- •Регрессионный анализ
- •Статистические методы оценки и анализа качества Диаграммы рассеивания
- •Построение диаграммы рассеивания
- •Оценка характера связи между величинами на диаграмме рассеивания
- •Прямая регрессии
- •Выборочное с.К.О.
- •Корреляционный анализ
- •Ковариация
- •Выборочная дисперсия
- •Метод медиан для определения корреляционной зависимости
- •Факторный анализ
- •Факторная матрица
- •Факторная матрица
Факторный анализ
Факторный анализ — статистический метод, используемый при обработке больших массивов экспериментальных данных.
Цель факторного анализа — сократить число переменных (редукция данных и определить структуру взаимосвязей между ними. Можно также сказать, что в задачи факторного анализа входит структурная классификация переменных.
Важным отличием факторного анализа от других статистический методов является то, что его нельзя применять для обработки первичных, или, как говорят, «сырых», экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемого объекта
Материалами для факторного анализа служат корреляционные связи, а точнее, коэффициенты корреляции Пирсона, которые вычисляются между переменными показателями (параметрами), включенными в обследование. Таким образом, факторному анализу подвергаются корреляционные матрицы, или матрицы интеркорреляции
Наименования столбцов и строк в этих матрицах одинаковы, так как они представляют собой перечень переменных, включенных в анализ. Матрицы интеркорреляций всегда квадратные, т.е. число строк в них равно числу столбцов, и симметричные, т.е. на главной диагонали матрицы стоят одни и те же коэффициенты корреляции. В таблице приведен пример такой матрицы.
IТаблица 2. 1Матрица интеркорреляции
|
А |
Б |
В |
Г |
Д |
А |
1,0 |
0,2 |
0,7 |
0 |
0,9 |
Б |
0,2 |
1,0 |
0,1 |
0,9 |
0 |
В |
0,7 |
0,1 |
1,0 |
0,6 |
0,4 |
Г |
0 |
0,9 |
0,6 |
1,0 |
0,8 |
Д |
0,9 |
0 |
0,4 |
0,8 |
1,0 |
Очевидно, что если коэффициент корреляции (rt) между какими-то показателями равен нулю, то эти показатели независимы друг от друга, при коэффициентах корреляции от 0,3 до 0,4 — слабая корреляция (зависимость), при rk = 0,5—0,75 — хорошая корреляция, при 10,8—0,95 — очень хорошая корреляция, при rt, = 1 — зависимость детерминированная.
Следует отметить, что исходная таблица данных может состоять из любого числа строк и столбцов, но матрица интеркорреляций должна быть квадратной, так как и в столбцах, и в строках записываются одни и те же показатели.
Главное понятие факторного анализа — фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляций. Процедура извлечения факторов из матрицы интеркорреляций называется факторизацией матрицы. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов, но не превышающее числа показателей (строк или столбцов) матрицы. Однако факторы, выявляемые в результате факторизации, как правило, неравноценны по своему значению. Элементы факторной мат матрицы — коэффициенты корреляции — часто называются «факторными нагрузками», или «факторными весами».
Сущность факторного анализа
Для того чтобы лучше усвоить сущность факторного анализа, разберем более подробно следующий пример.
Пример. При разработке нового автомобиля необходимо выработать потребительские требования к конструкции его дверей. Допустим, что при коллективной выработке потребительских требований к конструкции двери предполагаемого к выпуску автомобиля покупателями высказаны следующие требования:
дверь должна легко открываться (Т1);
дверь не должна пропускать пыли (Т2);
дверь должна быть четко зафиксирована при ее полном открытии (Т3);
дверь не должна пропускать дорожного шума (Т4);
дверь должна легко закрываться, без сильного хлопка (Т5)
дверь должна быть четко пригнана к кузову (Т6);
•дверь не должна ржаветь (Т7).
В реальной ситуации было высказано значительно большее число требований, но для примера приведенного количества потребительских требований достаточно. Нарисуем таблицу попарных корреляций rt (матрицу интеркорреляций) между потребительскими требованиями к дверям автомобиля
Таблица Попарные корреляции rk между потребительскими требованиями к дверям автомобиля
-
Т1
Т2
Т3
Т4
Т5
Т6
Т7
Т1
1,0
0,2
0,8
0,3
0,7
0,4
0
Т2
0,2
1,0
0
0,9
0,4
0,8
0,1
Т3
0,8
0
1,0
0
0,7
0,3
0
Т4
0,3
0,9
0
1,0
0,3
0,8
0
Т5
0,7
0,4
0,7
0,3
1,0
0,4
0,1
Т6
0,4
0,8
0,3
0,8
0,4
1,0
0.1
Т7
0
0,1
0
0,1
0,1
0,1
1,0
Коэффициенты корреляции отражают сходство между собой потребительских требований .При анализе величин коэффициентов корреляции rk легко выделить группы требований, хорошо взаимоувязанных, т.е. имеющих общее предназначение, кроме самого понятия «двери». Назовем эти группы:
А — дверь должна быть удобна в эксплуатации (требованшвTt.Ts.Ts);
Б — дверь должна быть герметична (требования Т2, Т4, Т6).
Очевидно, что требование Т7 (нержавеющий материал обшивки двери) — очень важное, но оно относится к материалу двери и имеет слабое отношение к конструкции двери. Скорее всего, оно попадет в общие требования к автомобилю в следующем виде: металлическая обшивка автомобиля должна быть выполнена из нержавеющих материалов.
Таким образом, содержательный анализ всех требований показал, что шесть из них характеризуют два обобщенных требования: удобство в эксплуатации и герметичность. Назовем эти обобщенные требования факторами и применим к ним факторный анализ.
Представим в табл. 2.3 эти два фактора А и Б в виде столбцов, а переменные (потребительские требования) — в виде строк. При этом каждому фактору в строке будет соответствовать среднее значение коэффициента корреляции соответствующих переменных по этому фактору. Как было отмечено выше, коэффициенты корреляции в факторной матрице (табл. 2.3) называются факторными нагрузками (весами).