Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ермолаев А. Метод многомерного шкалирования и его применение в социологии.doc
Скачиваний:
193
Добавлен:
21.01.2014
Размер:
1.09 Mб
Скачать
  1. Теория данных

Существует большое количество моделей многомерного шкалирования. Теория данных позволяет систематизировать многообразие вариантов эмпирических наблюдений, полученных в различных экспериментальных ситуациях. Систематизация заключается в выделении относительно небольшого набора ключевых характеристик, которые позволили бы наиболее полно описать различные типы данных и связать изс соответствующими методами анализа. Общие положения теории данных изложены в работах Кумбса [26] и Якоби [57].

Далее будут рассматриваться главным образом данные о близостях и модели многомерного шкалирования, связанные с ними. Рассмотрение других типов данных и соответствующимим многомернымметодаманализа можно найти в работах Шепарда [108] и Косолапова [145].

    1. Классическая теория данных Кумбса

Классическая теория данных была разработана Клайдом Кумбсом [28]. Он первым систематизировал и обобщил работы в этой области. Согласно Кумбсу, эмпирическое наблюдение всегда заключается в установлении соотношения между двумя эмпирическими элементами. Можно выделить следующие ситуации, возникающие при эмпирическом наблюдении:

  1. Два элемента могут быть взяты из разных наборов (объект и его характеристика), два объекта взяты из одного набора (сравнение двух объектов)

  2. Сравнение между элементами в паре могут быть отношением преобладания или близости

Совместив эти основания мы получим широко известную «четырехпольную» классификацию данных Кумбса (см. рис. 1).

Элементы в паре

Из разных наборов

Из одного набора

Отношения между элементами

Преобладание

Один стимул

Сравнение стимулов

Близость

Предпочтения

Сходства

Рисунок 1. Классификация данных в теории Кумбса

В геометрических моделях эти элементы представляются как точки в некотором пространстве, а расположение точек отражает отношения между объектами в наблюдении. Каждому типу данных соответствует определенная геометрическая модель.

Первый случай наиболее часто встречается в исследовательской практике. Некоторому объекту необходимо приписать значение характеристики. Для этого необходимо сравнить этот объект с некоторым эталоном, для которого это значение известно. Самым простым примером здесь является взвешивание.Чтобы установить вес предмета, необходимо провести ряд эмпирических наблюдений с парой объектов: предметом и эталоном с известным весом. При этом мы можем устанавливать различные эмпирические отношения между ними. Так, например, « A легче 3 кг» и «A тяжелее 2 кг». Эту операцию можно продолжать, чтобы измерить вес с необходимой точностью.

Второй тип данных и соответствующая ему геометрическая модель не предполагает наличия эталона. Этот момент чрезвычайно важен, т.к. часто при измерении различных социально‑психологических характеристик егоневозможно определить. В этом случае известен только порядок объектов, например,, который отражает выраженность некоторого свойства. Тогда необходимо разместить точки,и, соответствующие этим объектам, на некотором числовом континууме так, чтобы.

В рассмотренных выше данных о преобладании речь о сравнении значений характеристик объектов. Когда речь идет о данных о близости, то сравниваются не сами объекты, а их пары по степени сходства или различия. В зависимости от того, сравниваются ли объекты из одного набора или из разных наборов, Кумбс выделил два типа данных о близости: данные о предпочтениях и данные о сходстве.

Наиболее простым типом данных о близости являются данныхо сходстве. В этом типе данных сравниваются пары объектов по степени сходства или различия. Предположив, что суждения о сходстве или различии объектов основаны на сходстве или различии значений их характеристик, можно представить эти объекты как точки в некотором пространстве таким образом, чтобы расстояния между ними соответствовали отношениям сходства или различия. Рассмотрим множество из трех объектов,и. Пусть для пар объектов заданы отношения сходстваи, т.е. объектыиболее схожи, чем объектыи, а объектыиболее схожи, чем объектыи. Тогда соответствующие им точки должны быть размещены в пространстве таким образом, чтобы расстояния между ними удовлетворяли следующим условиями.

В основе данных о предпочтениях лежит предположение о том, что субъект оценивает объекты по степени предпочтения, сравнивая их с некоторым «идеальным объектом». Следуя этому предположению, данные о предпочтениях можно рассматривать как данные о сходстве между реальными и «идеальными» объектами. Тогда геометрически эти данные можно представить как совместное расположение двух наборов точек в одном пространстве, где расстояния между точками, соответствующим реальным объектам, и точками, соответствующим«идеальным» объектам, отражают отношения предпочтения. Чем ближе точка, соответствующая реальному объекту, к «идеальной точек», тем больше они схожи, следовательно, тем более предпочтительным является данный объект для соответствующего субъекта. Пусть заданы следующие отношения предпочтения для двух субъектовии пары объектови:и, т.е. объектболее предпочтителен для субъекта, чем, а объектболее предпочтителен для субъекта, чем объект. Тогда точки, соответствующие «идеальным» объектам для субъектовии точки, соответствующие объектами, необходимо расположить в пространстве так, чтобы расстояния между ними удовлетворяли условиями.