Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
51
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

7.3.1. Евклидово пространство

Пусть мы определили rшкалX1, …, Xr. Расстояние между парой объектовiиjопределяется формулойdij = .

Для однозначности задания шкал предполагается, что = 0 и. Кроме того, по аналогии с методом главных компонент, первая шкала выбирается с наибольшей дисперсией, вторая имеет вторую наибольшую дисперсию и т. д.

7.3.2. Идея многомерного шкалирования

Первая в этом направлении работа Торгерсона (Torgerson, 1952, [11]) была посвящена метрическому многомерному шкалированию. Модель этого метода имеет видL{S} = D+E, гдеL{S} – линейное преобразование исходной матрицы расстояний, D2– матрица расстояний, полученная на основе созданных шкал,E– матрица отклонений модели от исходных данных. Линейное преобразование дает матрицу преобразованных расстоянийT = L{S}.Целью многомерного метрического шкалирования является поиск оптимальных шкал и линейного преобразования матрицы исходных расстояний, минимизирующих ошибкуE.

Шепард и Краскэл (Shepard, 1962,Kruscal, 1964, см. ссылку в [11]) совершили существенный прорыв, разработав метод неметрического шкалирования. Суть этого метода состоит в нелинейном преобразовании расстояний. Модель неметрического шкалирования имеет видM{S} = D+E, гдеM{S} – монотонное преобразование исходной матрицы расстояний. Этот метод имеет больше шансов получить действительно геометрическое пространство, метрическое шкалирование. Монотонное преобразование дает матрицу преобразованных расстоянийT = L{S}.

7.3.3. Качество подгонки модели

Для измерения качества подгонки модели Такейном (Takane, 1977) был предложен показатель S-stress = , где норма матрицыозначает сумму квадратов элементов матрицы. Словоstressв английском языке имеет множество значений, одно из этих значений – нагрузка. Этот показатель изменяется от 0 до 1. Равенство его нулю означает точную подгонку модели, единице – полную ее бессмысленность.

Кроме того, оценить качество модели можно с помощью показателя stress indexКраскэла, который согласно документации SPSS [11] получается с использованием матрицы не квадратов расстояний, а расстояний. Заметим, что алгоритм оптимизируетS-stress,неstress index.

Еще один показатель качества модели, RSQ,представляет собой квадрат коэффициента корреляции между матрицами T и E. Таким образом, так же как в регрессионном анализе,RSQможет быть интерпретирован как доля дисперсии преобразованных расстояний T, объясненная матрицей расстояний D.

7.3.4. Вызов процедуры многомерного шкалирования

Вызов процедуры в диалоговом режиме осуществляется командой меню Statistics\Scale\Multidimentional scaling. В результате «приклеивания» ко­манды из меню в окно синтаксиса многомерного шкалирования обычно получается целая серия команд, связанных с вычислением расстояний, сохраняемых во временных файлах, работой с несколькими матрицами одновременно и уничтожением матриц данных. Команда меню устроена достаточно удобно, но, к сожалению, в ней предусмотрена возможность сохранения полученных шкал в виде переменных исходного файла данных. Это можно сделать только в синтаксисе, дополнив сгенерированную командуALSCALE подкомандой/OUTFILEс указанием имени файла (например,/OUTFILE = "scale.save"). С помощью командыMerge filesполученные переменные можно подключить к исходному файлу данных.

По умолчанию в процедуре проводится неметрическое шкалирование, кнопкой Modelможно переключиться на метрическое шкалирование.