Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
51
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

Центры кластеров (Final Cluster Centers)

Cluster

1

2

3

4

Zscore (LINCOME)

1,26

0,52

–1,08

–0,40

Zscore (LNS)

1,35

–0,56

–0,86

0,58

Таблица 7.6

Дисперсионный анализ в методе k-средних (anova, имееет только описательное значение)

Cluster

Error

F

Sig.

Mean Square

Df

Mean Square

df

ZLINCOME Zscore (LINCOME)

513,006

3

.370

2440

1384,7

0,000

ZLNS Zscore (LNS)

530,153

3

.363

2491

1461,6

0,000

Дисперсионный анализ (табл. 7.6) показал, что по обеим переменным различие кластеров существенно. Но о статистической значимости переменных говорить бессмысленно, поскольку гипотеза дисперсионного анализа,по сути,независимость групп и «зависимой» переменной, а в данном случае группы сформированы на основе значений «независимых» переменных.

Зато уж если бы различие средних по какой-либо переменной оказалось формально незначимым, переменную почти наверняка можно было бы исключить из анализа.

Полезно рассмотреть график рассеяния данных по кластерам (рис. 7.5). В нашем случае, пожалуй, не стоит говорить о выделении «сгущений» точек в признаковом пространстве, скорее, программа нашла разумные границы для описания типов, выделив их в непрерывном двумерном распределении.

Имеется масса возможностей изучить и сравнить полученные классы, используя сохраненную в виде переменной классификацию, например, посмотреть какая доля семей в классах имеет автомобили, средние размеры личного подсобного хозяйства и т. п.

7.3. Многомерное шкалирование

Задача многомерного шкалирования состоит в построении переменных на основе имеющихся расстояний между объектами. В частности, если нам даны расстояния между городами, программа многомерного шкалирования должна восстановить систему координат (с точностью до поворота и единицы длины) и приписать координаты каждому городу, так чтобы зрительно карта и изображение городов в этой системе координат совпали. Близость может определяться не только расстоянием в километрах, но и другими показателями, такими как размеры миграционных потоков между городами, интенсивность телефонных звонков, а также расстояниями в многомерном признаковом пространстве. В последнем случае задача построения такой системы координат близка к задаче, решаемой факторным анализом – сжатию данных, описанию их небольшим числом переменных. Нередко требуется также наглядное представление свойств объектов. В этом случае полезно придать координаты переменным, расположить переменные в геометрическом пространстве. С технической точки зрения это всего лишь транспонирование матрицы данных. Для определенности мы будем говорить о создании геометрического пространства для объектов, специально оговаривая случаи анализа множества свойств. В социальных исследованиях методом многомерного шкалирования создают зрительный образ «социального пространства» объектов наблюдения или свойств. Для такого образа наиболее приемлемо создание двумерного пространства.

Основная идея метода состоит в приписывании каждому объекту значений координат, так, чтобы матрица евклидовых расстояний между объектами в этих координатах, умноженная на константу, оказалась близка к матрице расстояний между объектами, определенной из каких-либо соображений ранее.

Метод весьма трудоемкий и рассчитан на анализ данных, имеющих небольшое число объектов.