Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
маркетинг / МИ_Книга2006.doc
Скачиваний:
43
Добавлен:
23.05.2015
Размер:
4.47 Mб
Скачать

Факторный анализ

Факторный анализ имеет множество разновидностей. Описание исследуемой ситуации делается на основе ряда показателей или признаков. Для удобства изучения их делят на результативные, которые изменяются под действием других признаков, называемых факторными.

В самой общей постановке факторный анализ – комплексное изучение и измерение воздействия факторов на величину результативных показателей.

Обычно для применения методов факторного анализа измеренные параметры должны быть представлены в интервальной или относительной шкалах.

В данной книге будет рассмотрена группа методов факторного анализа, которые позволяют на основе реально существующих связей признаков или объектов выявить латентные175 обобщающие характеристики изучаемых явлений или процессов. Они основываются на гипотезе о том, что явление или процесс имеет набор скрытых, но существенных характеристик, которые и определяют поведение наблюдаемых параметров. Таким образом, успех применения факторного анализа определяется тем, соответствует ли данная гипотеза действительности для исследуемого феномена и мало ли число важных факторов.

Число этих методов многообразно, ниже будут рассмотрены лишь некоторые, наиболее распространенные из них.

Метод главных компонент

Главная цель метода – снизить размерность задачи, получить наглядное представление об изучаемых элементах исследования.

Пусть есть данные опросов торговых представителей по двум вопросам: количеству звонков по мобильному телефону и количеству заключенных сделок. Результаты опросов показаны на рис.Рис. 27. Видно, что точки, соответствующие торговым представителям, расположились почти на одной прямой. В этом случае почти всю информацию об элементах исследования можно получить из проекций этих точек на новую ось F

Fi=a1X1i+a2X2i,

где Fi – проекции точек на новую ось, а1, а2– постоянные коэффициенты,X1i, X2i – координаты точек в старой системе координат.

Рис. 27. Характеристики торговых представителей

Иногда используют формулу

где – средние значенияX1i, X2i , то есть переносят начало координат в центр области полученных точек.

Новая ось может быть названа деловая активность. Расположение на этой оси почти полностью описывает и каждого агента по отдельности, и различия между ними даже более полно, чем каждая из переменныхХ. И при этом размерность задачи снижается от2до1!

Критерий построения новой оси – максимум дисперсии значений F.

Проекции точек на вторую ось, перпендикулярную первой, покажут остаточный, «не объясненный» разброс данных (отрезок жирной линии на рис.Рис. 27). Если он значительно меньше разброса проекций на первую ось, то факотрный анализ дал полезный результат. Нетрудно убедиться в том, что такое происходит в случае, если имеется заметная корреляция между переменными. Из рис.Рис. 27 видно, что чем больше тот или иной представитель делал звонков, тем больше сделок он заключил, то есть между этими переменными имеется положительная корреляция. Корреляция может быть и отрицательной, так как многочисленные звонки могут отвлекать от результативной работы по заключению сделок. Если же оказывается, что одному значению числа сделок соответствуют различные значения количества звонков, то один фактор не сможет объяснить поведение торговых представителей. Это могут сделать два фактора, но работа с двумя факторами в двумерной задаче нецелесообразна, так как размерность задачи от этого не снижается.

Если при исследовании задаются три вопроса, то точки, отображающие элементы исследования, образуют в трехмерном пространстве облако в виде эллипсоида общего вида. Первая новая ось будет строиться по вышеприведенному критерию. Вторая ось перпендикулярна первой и «забирает» максимум оставшегося разброса. Третья ось перпендикулярна двум предыдущим.

В худшем случае разброс значений по всем факторам будет одинаковым. Тогда их введение нецелесообразно. Но если первый фактор «берет на себя» почти весь разброс значений, то проделанная работа оказалась полезной.

По критерию Кайзера, если дисперсия фактора меньше дисперсии исходной переменной, то этот фактор отбрасывается.

Метод главных компонент удобен при высокой размерности полученных данных.

Пример176. Пусть исследуются различные модели легковых автомобилей. Они характеризуются весом, количеством цилиндров, временем разгона до 100 км/ч, мощностью двигателя, объемом двигателя. Данные можно представить в виде таблицы, в столбцах которой располагаются характеристики, а в строках – модели автомобилей.

Такую таблицу можно ввести в программу статистического анализа и запустить факторный анализ.

Программа построит 5компонентов, так как число переменных, характеризующих каждый элемент исследования, равно5. Для каждого компонента определяется процент дисперсии (сумма по всем компонентам равна100%, величина процента по каждому компоненту пропорциональна дисперсии значений по соответствующей оси):

Компонент (фактор)

Процент дисперсии

1

72

2

20

3

5

4

2

5

1

Из этих данных видно, стоит ли использовать метод главных компонент и сколько их взять. Если взять 3компонента, то это «объяснит»97%разброса точек – вполне приемлемый результат, так как обычно удовлетворяются пятью процентами. Разбросы по выбранным трем факторам будут относиться друг к другу как7:2:0,5.

Теперь, когда переменных стало три, можно наглядно графически представить полученные данные. Для пятимерного случая это было довольно затруднительно. Это – первый важный результат применения метода главных компонент.

Вторым результатом являются веса переменных в компонентах. Они определяют, какие переменные влияют на различия между элементами исследования.

Но полученные веса будут зависеть от размерности измерения исходных переменных. Число звонков может измеряться в штуках и тысячах штук, денежные величины – в рублях, тысячах рублей или в условных денежных единицах, расстояния – в метрах или километрах и т.п. Для правильного использования полученных весов данные в исходной таблице следует нормировать: перенести начало координат в центр области расположения точек, соответствующих элементам исследования и разделить отклонения на величину среднеквадратического отклонения. Прием аналогичен используемому в кластерном анализе.

В первой компоненте, которая дает самые большие различия между элементами исследования, значения весов обычно оказываются схожими. Но может оказаться и так, что вес какого-либо параметра мал. Тогда он слабо влияет на различия между элементами. Второй компонент может содержать какой-либо один параметр. Это означает, что этот параметр независим от других.

Третьим результатом является возможность именовать компоненты. Это до некоторой степени творческий процесс. Например, для автомобилей компонент, который включает с различными весами все упомянутые выше характеристики автомобиля, может быть назван динамичность. По другим параметрам, но аналогичным образом строятся факторыкомфортность, безопасность.

Далее в пространстве пониженной размерности можно попробовать поискать группы элементов исследования. Например, среди автомобилей можно обнаружить довольно тесные группы микролитражных и малолитражных моделей.