- •Метод МногомерноГо шкалирования и его применение в социологических исследованиях
- •1 Введение 3
- •2 Теория данных 5
- •3 Модели многомерного шкалирования 14
- •4 Использования многомерного шкалирования в социологических исследованиях 31
- •5 Заключение 34
- •Введение
- •Теория данных
- •Классическая теория данных Кумбса
- •Альтернативная теория данных
- •Форма данных
- •Характеристики измерения
- •Модели многомерного шкалирования
- •Классическое многомерное шкалирование
- •Метрическое многомерное шкалирования
- •Неметрическое многомерное шкалирования
- •Многомерное шкалирование и индивидуальные различия
- •Повторное многомерное шкалирование
- •Индивидуальное многомерное шкалирование
- •Обобщенная модель индивидуального шкалирование
- •Анализ предпочтений
- •Векторная модель
- •Модель «идеальной точки»
- •Индивидуальное многомерное развертывание
- •Обобщенная модель индивидуального многомерного развертывания
- •Обобщенная евклидова модель
- •Другие направления развития методов многомерного шкалироваия
- •Вероятностные модели многомерного шкалирования
- •Модели многомерное шкалирования с внешними ограничениями
- •Асимметричное многомерное шкалирование
- •Использования многомерного шкалирования в социологических исследованиях
- •Маркетинговые исследования
- •Социально‑политические исследования
- •Стратификационные исследования
- •Социология науки
- •Социально‑психологические исследования
- •Заключение
- •Литература
Модели многомерного шкалирования
История развития метода включает в себя четыре основных этапа [132]:
Разработка метрического многомерное шкалирования
Первая процедура метрического многомерного шкалирования была разработана Ричардсоном [100]. Его идеи были развиты в работе Торгерсона [159].
Разработка неметрическое многомерного шкалирования
Следующим значительным шагом стала разработка алгоритма многомерного шкалирования, позволяющего обрабатывать неметрические данные. Первую процедуру неметрического многомерного Шепард [110-111], идеи которого развил Краскал [73-74]. Подход Краскала лег в основу современных методов неметрического многомерного шкалирования.
Разработка модели индивидуального многомерного шкалирования
Очередной «прорыв» в развитии методов многомерного шкалирования был осуществлен благодаря разработке метода индивидуального многомерного шкалирования, который позволял получать не только обобщенный результат, но и анализировать индивидуальные различия. Первая метрическая модель индивидуального многомерного шкалирования была предложена Хораном [56] и Блоксомом [11] и реализована Кэрроллом и Чангом [21-22].
Интеграция различных подходов и дальнейшее развитие метода МШ.
Дальнейшее развитие методов МШ. Разработка моделей вероятностного МШ, модели МШ в внешними ограничениями, модели МШ для анализа асимметричных матриц близости.
Классическое многомерное шкалирование
Классическое
многомерное шкалирование в качестве
исходных данных использует квадратные
симметричные двумерные матрицы близости
с одним набором данных. В результаты
анализа каждый объект представляется
как точка в
мерном пространстве.
Метрическое многомерное шкалирования
Идея МШ и первый
алгоритм был предложен Ричардсоном
[100]. Однако, он недостаточно четко
сформулировал свои идеи. Основателем
современного направления методов МШ
считается Торгерсон, который предложил
алгоритм МШ на основе работы Т. Юнга
и А. Хаусхолдера [133]. Торгерсон
предположил, что оценки различий равны
расстояниям в евклидовом пространстве
небольшой размерности
:
,
где
.
Далее на основе
исходной матрицы близостей
рассчитывается матрица с двойным
центрированием
,
каждый элемент которой равен
,
где
,
,
.
Затем Торгерсон
доказал, что каждый элемент полученной
матрицы
будет равен
.
Предположение о том, что оценки различия равны расстояниям является очень жестким. Менее жесткой является следующая модель, в которой различия соответствуют расстояниям с точности до некоторой аддитивной константы:
,
Проблема первоначальной оценки аддитивной константы в литературе по многомерному шкалированию называется «проблемой аддитивной константы» [141].
Метрический алгоритм Торгерсона сейчас используется в неметрических алгоритмах многомерного шкалирования, основанных на итеративных процедурах, для оценки стартовых значений параметров модели.
Неметрическое многомерное шкалирования
Настоящим прорывом в области методов шкалирования стало появление модели неметрического многомерного шкалирования. Первое решение этой проблемы была дано Р. Шепардом [110-111]. Его алгоритм был основан на предположении, что меры различия являются монотонной функцией от расстояний в евклидовом пространстве небольшой размерности:
,
где
- монотонная функция, такая, что
для всех
.
Вскоре Дж. Краскал [73-74] предложил более общий алгоритм НМШ, где
.
Наиболее часто в литературе упоминаются евклидова метрика, метрика доминирования и метрика города.
Таблица 2. Наиболее часто используемые метрики
|
Метрика |
Значение
|
Формула |
|
Евклидова метрика |
|
|
|
Метрика доминирования (sup‑метрика) |
|
|
|
Метрика города (block‑city) |
|
|
Евклидова метрика используется наиболее широко, поскольку обладает рядом преимуществ:
простота интерпретации,
простота графического представления,
простые математические свойства [124, 252].
В алгоритме Краскала решается задача минимизации функции соответствия модели исходным данным STRESS (STandardize REsidual Sum of Squares), которая также называется STRESS-1:
,
где
- отклонения или ранговые образы данных,
которые являются оптимально шкалированными
близостями, т.е. чтобы максимально
соответствовать расстояниям при условии
монотонности:
для всех
,
,
где
.
Кроме формулы STRESS-1, Краскал предложил формулу STRESS-2 отличается от первой только числителем:
,
где
.
Формула STRESS-2 лучше работает в задачах многомерного развертывания, о которых речь пойдет ниже, поскольку реже приводит к вырожденным решениям.
НМШ Краскала позволило в качестве исходных данных использовать ранговые данные, поэтому данный метод быстро стал популярен в социальных науках, в которых большая часть данных измерены в ранговых шкалах. Именно с появления алгоритма Краскала началось активное использование метода МШ в исследовательской практике.
Существует также ряд моделей НМШ, в которых оптимизируется функция соответствия другого вида. Юнг [120] предложил функцию, названную SSTRESS (Squared STRESS), отличающуюся от функции STRESS Краскала тем, что основан на квадратах расстояний и оптимально шкалированных близостях

,
где
.
Среди них анализ пространств наименьшей размерности (Smallest Space Analysis) Гуттмана [50], в котором используется коэффициент отчуждения
,
где

Джонсон предложил функцию соответствия, которая не требует вычисления ранговых образов данных [58]

Исследование приведенные мер соответствия см. обзор Каменсокго [143].
