Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
otvety_tizms.docx
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
397.04 Кб
Скачать

Измерение и шкалирование.

Измерение – процедура, при помощи которой объекты исследования, рассматриваемые как носители определенных отношений между ними и как таковые составляющие эмпирическую систему, отображаются в некоторую математическую систему с соответствующими отношениями между её элементами. Измерение (measurement) означает присвоение чисел характеристикам изучаемых объектов, явлений согласно некоторому правилу. Измерение – метод, включающий две компоненты:

эмпирико-операциональную;? Кто объяснит что это?

концептуально-математическую. ;? Кто объяснит что это?

Шкала (scale) есть правило или алгоритм, в соответствии с которым изучаемым объектам, явлениям присваиваются числа. Основная цель измерения - возможность сравнения разных объектов по определенному свойству, которое измеряет шкала. С помощью заранее разработанных шкал могут быть измерены все, даже самые сложные, социальные явления. Шкала представляет собой систему характеристик изучаемого свойства, выполняющую роль эталона. Это совокупность значений, задающих критерии классификации объектов. Это правило, в соответствии с которым изучаемым объектам, явлениям присваиваются числа.

Шкалирование включает в себя процесс создания определенного континуума (последовательного ряда), на котором располагаются измеряемые объекты. Шкалирование это создание пространства, в котором размещены измеряемые объекты

Основные этапы шкалирования:

1)построение теоретической классификации (интерпретация)

2)поиск эмпирических индикаторов для разработанной теоретической схемы концепта (операционализация)

3)тестирование получившейся шкалы

Переменная – некоторая общая для всех изучаемых объектов характеристика или свойство, конкретные проявления которого могут меняться от объекта к объекту. Переменная, признак (variable) – это некоторая общая для всех изучаемых объектов характеристика или свойство, конкретные проявления которого могут меняться от объекта к объекту. Проявления признака называют значениями, альтернативами, градациями. Распределение переменной (distribution of the variable) – совокупность различных значений, которые переменная принимает для различных изучаемых объектов. Явная переменная - наблюдаемые признаки (пол, возраст, рост) и латентная переменная (состояние сознания, склонности, черты личности).

Данные (data) представляют собой результаты наблюдений, испытаний, накапливаемые с целью последующего изучения и анализа.

Типы данных:

  • Дискретные данные (discrete data) представляют собой отдельные значения признака, общее число которых конечно либо если бесконечно, то является счетным, т.е. может быть подсчитано натуральными числами от одного до бесконечности.

  • Непрерывные данные (continuous data) могут принимать любое значение в некотором интервале.

Четыре критерия измерений: 1. Критерий надежности требует, чтобы при повторном проведении измерения в тех же самых условиях мы получили те же самые результаты. 2. Критерий достоверности. Достоверность измерения (validity) означает соответствие между результатами измерения и его целями, между выбранной шкалой и исследуемыми переменными. 3. Критерий завершенности означает, что для любого измеряемого объекта после проведения измерения мы сможем получить результат. Завершенность измерения (exhaustive) означает, что в результате измерения мы должны получить какой-либо результат. 4. Критерий единственности означает, что для любого исследуемого объекта в результате измерения мы получим единственное значение.

Пять типов шкал: Качественные шкалы: Номинальная шкала (nominal scale) состоит из названий, имен или категорий для сортировки или классификации объектов, явлений по некоторому признаку. Результаты измерений, полученные при помощи номинальной шкалы, не могут быть упорядочены и с ними не могут производиться арифметические операции. Единственной допустимой операцией с числами в номинальной шкале является счет. Допустимо только ограниченное количество статистических расчетов базирующихся на подсчете частот: Процентные соотношения, Мода, Хи-квадрат, Биноминальные критерии. Дихотомическая шкала (dichotomous scale) - номинальная шкала, которая состоит из двух категорий. Здесь не дано третьего, если не рассматривать исключения. Дихотомической шкалой, как правило, измеряется пол человека. Вопрос с двумя вариантами ответов («да» или «нет») также представляет собой пример дихотомической шкалы. Порядковая шкала (ordinal scale) означает, что числа присваиваются объектам, чтобы обозначить относительные позиции объектов, но не величину различий между ними. Таким образом, можно определить, в какой степени данная характеристика присуща объекту. Порядковая шкала позволяет узнать, в какой мере выражена конкретная характеристика данного объекта, но не дает представления о степени ее выраженности. Кроме использования операций подсчета, допустимых для данных номинальной шкалы, для порядковых шкал можно использовать статистические методы, базирующиеся на процентилях: Расчеты процентилей, Квадратилей, Медианы, Ранговой корреляции и др. Количественные (метрические) шкалы. Интервальная шкала (interval scale) позволяет находить разницу между двумя величинами. Обладает всеми свойствами номинальной и порядковой, но она позволяет указать количественное значение измеряемого признака. Недостатком служит отсутствие абсолютного нуля в качестве точки отсчета. числовая шкала, количественно равные промежутки которой отображают равные промежутки между значениями измеряемых характеристик количественно равные промежутки шкалы отображают равные значения измеряемых характеристик существует возможность сравнивать различия между объектами между значениями интервальной шкалы существует постоянный или равный интервал расположение точки начала отсчета не фиксируется (выбирается произвольно). Например, отношение студентов А, Б, В и Г к учебе соответствует 1, 2, 3 и 8. Можно определить, что различие по отношению к учебе между респондентами А и Б меньше, чем различие между респондентами В и Г. Пример – шкала температуры.

Статистические методы:

- все методы, используемые для номинальных и порядковых шкал;

- среднее арифметическое;

- коэффициент корреляции

Главная трудность - обоснование равенства или разности дистанций между пунктами

  • Относительная шкала (ratio scale) обладает абсолютным нулем в качестве точки отсчета, что позволяет ей иметь все свойства интервальной шкалы. Для данных этой шкалы осмысленными являются все операции, включая вычитание и деление. Наиболее информативная шкала. Позволяет исследователю идентифицировать и классифицировать объекты, ранжировать их, а также сравнивать интервалы и разницы. Имеет смысл расчет коэффициентов различных значений шкалы. Обладает всеми свойствами номинальной, порядковой и интервальной шкал.Имеет точку начала отсчета. Примеры: рост, вес, возраст, деньги и др. В маркетинге измеряются объемы продаж, затраты, доля рынка и число покупателей. Статистические методы: применимы абсолютно все операции с числами. В социологии шкалы такого рода имеют весьма ограниченное применение. Ими пользуются для измерения протяженностей во времени и пространстве, для отсчета натуральных единиц (денежных единиц, продуктов деятельности, поступков).

Шкала

Особенности

Пример

Номинальная

Содержит только категории, данные не могут упорядочиваться

Хобби студента. Только название.

Порядковая

Категории могут упорядочиваться, но

разности не имеют смысла

Место на соревнованиях.

Лучше результат – выше

место.

Интервальная

Разности между значениями имеют смысл. Отсутствует точка отсчета.

Температура студента.

У больного выше на 1-2°С

Относительная

Имеется точка отсчета, возможны арифметические действия.

Рост студента. Один в 1,2 раза выше другого

Дихотомическая

Содержит две категории

Пол студента.

Третьего не дано, если не

рассматривать исключения.

И так, номинальные шкалы позволяют описывать наблюдения в терминах качественных признаков. Порядковые шкалы идут на один шаг дальше и позволяют упорядочивать наблюдаемые объекты от меньшего к большему по изучаемой характеристике. Номинальные и порядковые шкалы являются дискретными. Интервальные шкалы и шкалы отношений более сложны, состоят из интервалов равного размера, которые делают возможным определить количественное значение наблюдаемого признака. Дихотомические шкалы — уникальные номинальные шкалы, с которыми можно поступать так же, как с интервальными.

Классификация шкал по назначению:

Установочные - шкалы, с помощью которых числа приписываются самим респондентам.

Оценочные - шкалы, итогом "действия" которых является приписывание чисел не респондентам, а некоторым объектам.

Меры центральной тенденции:

Уровень измерений (шкалы)

Меры центральной тенденции

Мода

Медиана

Среднее арифметическое

Среднее геометрическое

Номинальная

+

Порядковая

+

+

Интервальная

+

+

+

Относительная

+

+

+

+

Дихотомическая

+

Мода – наиболее часто встречающееся значение в выборке, наборе данных. В случае, если данные сгруппированы и построено распределение частот, модой является значение, имеющее наибольшую частоту. Медиана определяется как серединное значение выборки, или значение, выше и ниже которого располагается одинаковое число наблюдений. Для нахождения медианы обязательно упорядочить данные. Измерение вариации (measure of variation) состоит в нахождении чисел, которые характеризуют степень разброса данных относительно центра распределения.

Меры разброса:

Уровень измерений (шкалы)

Меры разброса

Размах

Междуквар-тильный размах

Дисперсия

Стандартное отклонение

Коэффици-ент вариации

Номинальная

+

Порядковая

+

+

Интервальная

+

+

+

+

+

Относительная

+

+

+

+

+

Дихотомическая

+

Меры разброса:

Размах -(range) – разница между наибольшим и наименьшим значениями. R = xmax – xmin. описывает диапазон изменчивости значений, равен разности между максимальным и минимальным наблюдаемым значением. Междуквартильный размах - удобный показатель разброса значений для порядковой переменной. Q1 отсекает 25% наблюдений, а ниже Q3 лежат уже 75% случаев. Квартили (quartile) – значения, которые делят вариационный ряд на четыре равные по объему части. Квартильный размах (Inter Quartile Range - IRQ) – разница между третьим и первым квартилями. Квартильный размах находится по формуле: IQR = Q3 − Q1 Если при вычислении размаха используются только наибольшее инаименьшее значения признака, а распределение данных между ними полностью игнорируется, то при вычислении квартильного размаха игнорируются «крайние» данные, расположенные за пределами первого и третьего квартилей. Между Q1 и Q3 расположено 50% всех данных. Дисперсия характеризует степень рассеивания (разброса) значений случайной величины относительно ее математического ожидания. Для набора данных или выборки – среднее арифметическое квадратов отклонений значений от их среднего. Стандартное отклонение - квадратный корень из дисперсии выборки. Тем меньше, чем лучше среднее «представляет» данную совокупность наблюдений. Коэффициент вариации - процент (доля) наблюдений, не совпадающих с модальным значением. Если от модального отличаются 60% значений, то V = 60%. Вычисляется как отношение стандартного отклонения к среднему значению выборки. Вариационный рядупорядоченная по величине последовательность выборочных значений наблюдаемой случайной величины равные между собой элементы выборки нумеруются в произвольном порядке; элементы вариационного ряда называются порядковыми (ранговыми) статистиками; число   называется рангом порядковой статистики  Частота (frequency) – количество наблюдений, в которых признак принимает определенное значение или находится в определенном интервале. Распределение частот (frequency distribution) показывает частоты во взаимосвязи с результатами наблюдении. Как мы обсудили в предыдущей главе, будем различать два случая: первый, когда признак измеряется номинальной или порядковой шкалой, принимает дискретные значения (будем называть их категории), и второй, когда значения признака измеряются с помощью числовой шкалы и непрерывны. В первом случае будем называть распределение частот категориальным, во втором будем строить интервальное распределение. Как позже будет объяснено, интервальное распределение можно строить также и для дискретного признака, если его значения являются редкими и могут быть объединены в несколько интервалов. Категориальное распределение частот состоит из категорий, являющихся значениями исследуемого признака, и соответствующих этим категориям частот. Категориальное распределение строится для данных, измеряемых номинальной или порядковой шкалой. Неупорядоченные данные состоят из результатов, которые записаны в произвольном порядке, например в том, в котором были получены. Упорядоченные данные содержат результаты наблюдений, записанные в порядке возрастания (либо в порядке убывания). Интервальное распределение частот состоит из некоторого количества интервалов равной длины, на которые делится весь диапазон изменения признака, и соответствующих этим интервалам частот. Таблица сопряженности (двумерная частотная таблица). Различают способы построения таблиц для одной, двух или нескольких переменных. Таблицы для двух переменных содержат одну переменную в строках, а другую в столбцах. Таблицы для двух переменных называются таблицами сопряженности, они показывают связи или отношения между ними.

Корреляционный анализ

Экспертные оценки, ранговая корреляция и конкордация

Пусть в процессе системного анализа нам пришлось учитывать некоторую величину U, измерение которой возможно лишь по порядковой шкале (Ord). Например, нам приходится учитывать 10 целей функционирования системы и требуется выяснить их относительную значимость, удельные веса.

Если имеется группа лиц, компетентность которых в данной области не вызывает сомнений, то можно опросить каждого из Экспертов, Предложив им расположить цели по важности или “проранжировать” их. В простейшем случае можно не разрешать повторять ранги, хотя это не обязательно — повторение рангов всегда можно учесть.

Результаты экспертной оценки в нашем примере представим таблицей рангов целей:

Таблица 3.2

Эксперты

1

2

3

4

5

6

7

8

9

10

Сумма

A

3

5

1

8

7

10

9

2

4

6

55

B

5

1

2

6

8

9

10

3

4

7

55

Сумма рангов

8

6

3

14

15

19

19

5

8

13

Суммарный ранг

4.5

3

1

7

8

9.5

9.5

2

4.5

6

55

Итак, для каждой из целей Ti мы можем найти сумму рангов, определенных экспертами, и затем суммарный или Результирующий ранг цели Ri. Если суммы рангов совпадают — назначается среднее значение.

Метод ранговой корреляции позволяет ответить на вопрос — насколько коррелированны, неслучайны ранжировки каждого из двух экспертов, а значит — насколько можно доверять результирующим рангам? Как обычно, выдвигается основная гипотеза — об Отсутствии связи между ранжировками и устанавливается вероятность справедливости этой гипотезы. Для этого можно использовать два подхода: определение коэффициентов ранговой корреляции Спирмэна или Кендэлла.

Более простым в реализации является первый — вычисляется значение коэффициента Спирмэна

Rs = 1 - ; {3 - 9}

Где Di определяются разностями рангов первой и второй ранжировок по N объектов в каждой.

В нашем примере сумма квадратов разностей рангов составляет 30, а коэффициент корреляции Спирмэна около 0.8, что дает значение вероятности гипотезы о полной независимости двух ранжировок всего лишь 0.004.

Коэффициент конкордации (0;1). При необходимости можно воспользоваться услугами группы из M Экспертов, установить результирующие ранги целей, но тогда возникнет вопрос о согласованности мнений этих экспертов или Конкордации. Диапазон (0;1). 0-несогласованность;1-согласованность. Если коэффициент >0,5, то качество оценки удовлетворительное, если <0,5 то нет. Пусть у нас имеются ранжировки 4 экспертов по отношению к 6 факторам, которые определяют эффективность некоторой системы.

Факторы --> Эксперты

1

2

3

4

5

6

Сумма

A

5

4

1

6

3

2

21

B

2

3

1

5

6

4

21

C

4

1

6

3

2

5

21

D

4

3

2

3

2

5

21

Сумма рангов Сум. Ранг

15

4

11

2

10

1

19

6

12

3

17

5

84

Отклонение суммы от среднего

+1

1

-3

9

-4

16

+5

25

-2

4

+3

9

0

64

Заметим, что полная сумма рангов составляет 84, что дает в среднем по 14 на фактор.

Для общего случая N факторов и M экспертов среднее значение суммы рангов для любого фактора определится выражением

D {3 - 10}

Теперь можно оценить степень согласованности мнений экспертов по отношению к шести факторам. Для каждого из факторов наблюдается отклонение суммы рангов, указанных экспертами, от среднего значения такой суммы. Поскольку сумма этих отклонений всегда равна нулю, для их усреднения разумно использовать квадраты значений.

В нашем случае сумма таких квадратов составит S= 64, а в общем случае эта сумма будет наибольшей только при полном совпадении мнений всех экспертов по отношению ко всем факторам:

SMax {3 - 11}

М. Кэндэллом предложен показатель согласованности или Коэффициент конкордации, Определяемый как

{3 - 12}

В нашем примере значение коэффициента конкордации составляет около 0.229, что при четырех экспертах и шести факторах достаточно, чтобы с вероятностью не более 0.05 считать мнения экспертов несогласованными. Дело в том, что как раз Случайность ранжировок, их некоррелированность просчитывается достаточно просто. Так для нашего примера указанная вероятность соответствует сумме квадратов отклонений S= 143.3 , что намного больше 64.

Сравнительное шкалирование.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]