
- •Лекция 9
- •Сопоставления в критерии λ: стрелками отмечены расхождения между эмпирическими и теоретическими накопленными относительными частотами по каждому разряду
- •Эмпирические частоты попадания желтого цвета на каждую из 8 позиций ( )
- •Расчет критерия при сопоставлении распределения выборов желтого цвета с равномерным распределением ( )
- •Эмпирические частоты попадания желтого цвета на каждую из 8 позиций в исследовании X. Клара
- •Расчет критерия при сопоставлении эмпирических распределений желтого цвета в отечественной выборке ( ) и выборке Клара ( )
Лекция 9
«Выявление различий в распределении исследуемого признака»
λ – критерий Колмогорова-Смирнова
Назначение критерия
Критерий λ предназначен для сопоставления двух распределений:
эмпирического с теоретическим, например, равномерным или нормальным;
одного эмпирического распределения с другими эмпирическим распределением.
Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.
Описание критерия
Если
в методе
мы
сопоставляли частоты двух распределений
отдельно по каждому разряду, то здесь
мы сопоставляем сначала частоты по
первому разряду, потом по сумме первого
и второго разрядов, потом по сумме
первого, второго и третьего разрядов и
т. д. Таким образом, мы сопоставляем
всякий раз накопленные к данному разряду
частоты.
Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигает критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия λ включается эта разность. Чем больше эмпирическое значение λ, тем более существенны различия.
Гипотезы
H0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).
H1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).
Графическое представление критерия
Рассмотрим для иллюстрации распределение желтого (№4) цвета в 8-цветном тесте М. Люшера. Если бы испытуемые случайным образом выбирали цвета, то желтый цвет, так же, как и все остальные, равновероятно мог бы занимать любую из 8-и позиций выбора. На практике, однако, большинство испытуемых помещают этот цвет, «цвет ожидания и надежды» на одну из первых позиций ряда.
На рисунке столбиками представлены относительные частоты попадания желтого цвета сначала на 1-ю позицию (первый левый столбик), затем на 1-ю и 2-ю позицию (второй столбик), затем на 1-ю, 2-ю и 3-ю позиции и т. д.
Мы видим, что высота столбиков постоянно возрастает, так как они отражают относительные частоты, накопленные к данной позиции. Например, столбик на 3-й позиции имеет высоту 0,510. Это означает, что на первые три позиции желтый цвет помещают 51% испытуемых.
Прерывистой линией на рисунке соединены точки, отражающие накопленные частоты, которые наблюдались бы, если бы желтый цвет с равной вероятностью попадал на каждую из 8-и позиций. Сплошными линиями обозначены расхождения между эмпирическими и теоретическими относительными частотами. Эти расхождения обозначаются как d.
Сопоставления в критерии λ: стрелками отмечены расхождения между эмпирическими и теоретическими накопленными относительными частотами по каждому разряду
Максимальное расхождение обозначено как dmax. Именно эта, третья позиция цвета, и является переломной точкой, определяющей, достоверно ли отличается данное эмпирическое распределение от равномерного. Мы проверим это при рассмотрении примера.
Ограничения критерия λ
Критерий требует, чтобы выборка была достаточно большой. При сопоставлении двух эмпирических распределений необходимо, чтобы
. Сопоставление эмпирического распределения с теоретическим иногда допускается при
.
Разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, мы можем за разряды принять дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса терапии, повышение температуры тела, усиление чувства недостаточности и т. д. В то же время, если мы возьмем разряды, которые случайно оказались выстроенными в данную последовательность, то и накопление частот будет отражать лишь этот элемент случайного соседства разрядов. Например, если шесть стимульных картин в методике Хекхаузена разным испытуемым предъявляются в разном порядке, мы не вправе говорить о накоплении реакций при переходе от картины №1 стандартного набора к картине №2 и т. д. Мы не можем говорить об однонаправленном изменении признака при сопоставлении категорий «очередность рождения», «национальность» ,»специфика полученного образования» и т.п. Эти данные представляют собой номинативные шкалы: в них нет никакого однозначного однонаправленного изменения признака.
Итак, мы не можем накапливать частоты по разрядам, которые отличаются лишь качественно и не представляют собой шкалы порядка. Во всех тех случаях, когда разряды представляют собой не упорядоченные по возрастанию или убыванию какого-либо признака категории, нам следует применять метод .
Алгоритм расчета абсолютной величины разности d между эмпирическим и равномерным распределением
Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).
Подсчитать относительные эмпирические частоты (частости) для каждого разряда по формуле:
где fj - частота попадания желтого цвета на данную позицию;
п – общее количество наблюдений;
j – номер позиции по порядку.
Занести результаты во второй столбец.
Подсчитать накопленное эмпирические частости
.по формуле:
,
где
–
частость, накопленная на предыдущих
разрядах;
;–
эмпирическая частость данного j-го
разряда. Занести результаты в третий
столбец таблицы.
Подсчитать накопленные теоретические частости для каждого разряда по формуле:
где
– теоретическая частость, накопленная
на предыдущих
разрядах;
– теоретическая
частость данного разряда.
Занести результаты в третий столбец таблицы.
Вычислить разности между эмпирическими и теоретическими накопленными частостями по каждому разряду (между значениями 3-го и 4-го столбцов).
Записать в пятый столбец абсолютные величины полученных разностей. Обозначить их как d.
Определить по пятому столбцу наибольшую абсолютную величину разности – dmax.
По таблице приложения определить или рассчитать критические значения dmax для данного количества наблюдений n. Если dmax равно критическому значению d или превышает его, различия между распределениями достоверны.
Пример 1.
Сопоставление эмпирического распределения с теоретическим
В выборке здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний возраст 20 лет, проводился тест Люшера в 8-цветном варианте. Установлено, что желтый цвет предпочитается испытуемыми чаще, чем отвергается. Можно ли утверждать, что распределение желтого цвета по 8-и позициям у здоровых испытуемых отличается от равномерного распределения?