
- •Тема: параметрические критерии различий
- •Случай несвязных выборок
- •Случай связных выборок
- •Тема: исследование взаимосвязи признаков Корреляция
- •Коэффициент линейной корреляции Пирсона
- •Ранговая корреляция
- •Методы многомерного статистического анализа
- •Тема 9 Дисперсионный анализ
- •Тема 10 Кластерный анализ
- •Тема 11 Факторный анализ
- •Критерий Колмогорова-Смирнова. Проверка гипотезы об однородности выборок
- •Критические значения критерия λ при вероятности р(λ).
Тема 10 Кластерный анализ
Кластерный (таксономический) анализ используется для упорядочивания объектов и объединения их в однородные разряды на основе попарного сравнения этих объектов по предварительно определенным и измеренным критериям. В результате исходная выборка разделяется на группы схожих между собой объектов, называемых кластерами. Кластер — это группа объектов, характеризующихся повышенной плотностью (сгущенность внутри разряда) и дисперсией.
Однородность объектов определяется по расстоянию p(x1, x2). Объекты считаются однородными, если p(x1, x2) < pпредельного. Расстояние р вычисляется по формуле:
Результаты процедуры представляют в виде дендрограммы — древовидного графика.
Пример. На рисунке представлена дендограмма.
А.Д.Наследов1 выделяет ряд задач, при решении которых кластерный анализ является более эффективным, чем другие многомерные методы.
Разбиение совокупности испытуемых на группы по измеренным признакам с целью дальнейшей проверки причин межгрупповых различий по внешним критериям, например, проверка гипотез о том, проявляются ли типологические различия между испытуемыми по измеренным признакам.
Применение кластерного анализа как значительно более простого и наглядного аналога факторного анализа, когда ставится только задача группировки признаков на основе их корреляции.
Классификация объектов на основе непосредственных оценок различий между ними (например, исследование социальной структуры коллектива по данным социометрии – по выполненным межличностным предпочтениям).
Несмотря на различие целей проведения кластерного анализа, А.Д.Наследов выделяет общую последовательность в применении кластерного анализа, как ряд относительно самостоятельных шагов, играющих существенную роль в прикладном исследовании.
Отбор объектов для кластеризации. Объектами могут быть, в зависимости от цели исследования: а) испытуемые; б) объекты, которые оцениваются испытуемыми; в) признаки, измеренные на выборке испытуемых.
Определение множества переменных, по которым будут различаться объекты кластеризации. Для испытуемых – это набор измеренных признаков, для оцениваемых объектов – субъекты оценки, для признаков – испытуемые. Если в качестве исходных данных предполагается использовать результаты попарного сравнения объектов, необходимо четко определить критерии этого сравнения испытуемыми (экспертами).
Определение меры различия между объектами кластеризации. Это первая проблема, которая является специфичной для методов анализа различий: многомерного шкалирования и кластерного анализа.
Выбор и применение метода классификации для создания групп сходных объектов. Это вторая и центральная проблема кластерного анализа. Ее весомость связана с тем, что разные методы кластеризации порождают разные группировки для одних и тех же данных.
Проверка достоверности разбиения на классы.
Последний этап не всегда необходим.
Пример. В данном примере описано изучение мотивационной сферы респондентов методом семантического дифференциала. Для анализа полученных результатов использован кластерный анализ. Исследование проведено во ВГИПУ, в нем приняли участие студенты психологи 3-4-5 курсов очной формы обучения.
Метод семантического дифференциала, разработанный Ч.Осгудом, предназначен для измерения количественных характеристик эмоционального отношения испытуемого к объектам, выраженным в форме понятий.
Для изучения особенностей мотивационной сферы респондентов и исходя из задач психологического исследования было обозначено двадцать пять понятий: мое будущее, мое увлечение, достижение успеха, мое прошлое, неприятности, неудача, мое настоящее, Я, моя работа, моя учеба, угроза, признание окружающих, общение с людьми, мое свободное время, материальное благополучие, моя профессия, выполнение обязанностей, моя карьера, моя зарплата, творчество, рефлексия (самоанализ), практический психолог, профессиональное становление, мои друзья, болезнь.
При подготовке стимульного материала в состав объектов были включены понятия, смысл которых отражает в сознании респондентов, их отношение к получаемой профессии «психолог» (понятия-маркеры). Это понятия: моя профессия, моя работа и практический психолог. Кроме того, выделены понятия, характеризующие временную перспективу: мое прошлое, мое настоящее и мое будущее. Все эти понятия выступают в роли ориентиров в семантическом пространстве, по отношению к которым респонденты определяли позиции остальных понятий.
Результаты, полученные в процессе изучения особенностей мотивационной сферы респондентов, позволили охарактеризовать семантическое пространство, измерить семантические расстояния между обозначенными понятиями стимульного материала, выделить и проанализировать объединения понятий (кластеры).
На рисунках 1-2 представлены варианты дендрограмм, анализируя которые можно сделать следующие выводы:
Рисунок 1. Понятие- маркер «практический психолог» входит в кластер «моя профессия – профессиональное становление».
Рисунок 2. Понятие- маркер «практический психолог» входит в кластер «моя карьера».
Анализ дендрограмм показал, какие понятия попали в один кластер с понятиями-маркерами, т.е. какие понятия испытуемые идентифицируют с ними. В таблице представлены сводные результаты кластерного анализа семантического пространства студентов-психологов. Обращает на себя внимание тот факт, что понятие «практический психолог» не идентифицируется в сознании респондентов с понятиями «мое будущее» и «Я». Только у 13,9% респондентов понятие «практический психолог» идентифицируется с понятиями «моя работа» и «моя профессия», а у 37,2% респондентов рассматриваемые понятия-маркеры не имеют никаких идентификационных связей.
Рисунок 1
Рисунок 2
Таблица
Сводные результаты кластерного анализа семантического пространства
студентов-психологов (в %)
(понятия-маркеры: моя работа, моя профессия, практический психолог)
№ п/п |
Понятия |
Моя работа |
Моя профессия |
Практический психолог |
1 |
Мое будущее |
2,3 |
4,6 |
|
2 |
Мое увлечение |
2,3 |
|
6,98 |
3 |
Достижение успеха |
6,98 |
4,6 |
4,6 |
4 |
Мое прошлое |
11,6 |
|
2,3 |
5 |
Неприятности |
|
|
|
6 |
Неудача |
2,3 |
2,3 |
|
7 |
Мое настоящее |
4,6 |
4,6 |
6,98 |
8 |
Я |
|
2,3 |
|
9 |
Моя работа |
|
6,98 |
6,98 |
10 |
Моя учеба |
9,3 |
4,6 |
2,3 |
11 |
Угроза |
|
|
|
12 |
Признание окружающих |
4,6 |
9,3 |
|
13 |
Общение с людьми |
|
4,6 |
6,98 |
14 |
Мое свободное время |
|
6,98 |
2,3 |
15 |
Материальное благополучие |
6,98 |
4,6 |
6,98 |
16 |
Моя профессия |
11,6 |
|
9,3 |
17 |
Выполнение обязанностей |
9,3 |
6,98 |
4,6 |
18 |
Моя карьера |
4,6 |
4,6 |
2,3 |
19 |
Моя зарплата |
4,6 |
|
11,6 |
20 |
Творчество |
9,3 |
4,6 |
11,6 |
21 |
Рефлексия |
2,3 |
4,6 |
4,6 |
22 |
Практический психолог |
4,6 |
9,3 |
|
23 |
Профессиональное становление |
6,98 |
9,3 |
18,6 |
24 |
Мои друзья |
4,6 |
4,6 |
|
25 |
Болезнь |
|
|
|
|
Связь не обнаружена |
11,6 |
9,3 |
16,3 |
Понятие «практический психолог» идентифицируется с видом деятельности (моя работа, моя учеба, общение с людьми, мое свободное время, моя профессия, рефлексия) у 32,5% респондентов, с потребностями и ценностями (мое увлечение, достижение успеха, материальное благополучие, выполнение обязанностей, моя карьера, моя зарплата, творчество) у 48,7% респондентов и с этапами жизненного пути (мое прошлое, мое настоящее, профессиональное становление) у 27,8% респондентов.
Таким образом, изучение особенностей мотивационной сферы студентов-психологов методом семантического дифференциала (модификация И.Л.Соломина), а именно изучение скрытой мотивации, позволило нам установить тот факт, что у большинства студентов (86,1%), обучающихся по направлению «психология», понятие-маркер «практический психолог» не идентифицируется с понятиями «моя работа» или «моя профессия», 95,7% респондентов не соотносят данное понятие с прошлым или настоящим, и никто – с будущим.