Сидоренко Е.В. Методы математической обработки в психологии
.pdf142
4.3. Л - критерий Колмоrорова-Смврнова
Назначение критерия
Критерий Л предназначен для сопост8ВJ\ения двух распределений:
а) эмпирическоzо с теоретическим, например, равномерным или
нормальным;
б) одного эмпирическоzо распределения с другими эмпирическим
распределением.
Критерий позволяет найти точку, в которой сумма накопленных
расхождений между двумя распределениями является наибольшей, и
оценить достоверность этого расхождения.
Описание критерия
Если в методе х2 мы сопоставляли частоть1 двух распределений
отдельно по каждому разряду, то эдесь мы сопоставляем сначала часто
ты по первому разряду, потом по сумме первого и второго разрядов,
потом по сумме первого, второго и третьего разрядов и т. д. Таким
образом, мы сопоставляем всякий раз накопленные к данному разряду
частоты.
Если различия между двумя распределениями существенны, то в
какой-то момент разность накопленных частот достигнет критического
значения, и мы сможем признать различия статистически достоверны
ми. В форМулу критерия Л включается эта разность. Чем больше змпи·
рическое значение Л, тем более существенны различия.
Гипотезы Но: Различия между двумя распределениями недостоверны (судя по
точке максимального накопленного расхождения между ними).
Н1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).
rрафвческое преяставлеине крнтервн
Рассмотрим для иллюстрации распределение желтого ( №4) цвета в В-цветном тесте М. Люшера. Если бы испытуемые случайным обра
зом выбирали цвета, то желтый цвет, так же, как и все остальные,
равновероятно мог бы занимать любую из 8-и позиций выбора. На практике, однако, боАьwинство испытуемых помещают этот цвет, "цвет
ожидания и надежды" на одну из первых позиций ряда.
Крвтервв согАасвя расоре11еАеввй |
14J |
На Рис. 4.9 столбиками представлены относительные частоты8
попадания желтого цвета сначала на 1-ю позицию {первый .левый стол
бик), затем на 1-ю и 2-ю позицию (второй столбик), затем на 1-ю, 2-ю и 3-ю позиции и т. д. Мы видим, что высота столбиков постоянно воз
растает, так как они отражают относительные частоты, накопленные к
данной позиции. Например, столбик на 3-й позиции имеет высоту 0,51.
Это означает, что на первые три позиции желтый цвет помещают 51%
испьпуемых.
Прерывистой линией на Рис. 4.9 соединены точки, отражающие
накопленные частоты, которые наблюдались бы, если бы желтый цвет с
равной вероятностью попадал на каждую из 8-и позиций. Сплошными
АИниями обозначены расхождения между эмпирическими и теоретически
ми О111осите.льными частотами. Эти расхожд~ния обозначаются как d.
f
Рис. 4.9. Conoc:raaмllНll • критерии А: c:rpoAIWIH оnсечсн111 pacxmllACllНll llClll.Q'-..И·
"СКНМ11 И 1еОрС111ЧССUИИ иакоnАСННlllМИ OIКCICИl'Uldllll>lll частотаюt ПО КIЖАОМ)' pupuy
Максимальное расхождение на Рис. 4.9 обозначено как dmax·
Именно эта, третья позиция цвета, и .является переломной точкой, опре
деляющей, достоверно .ли отличается данное эмпирическое распределе
ние от равномерного. Мы проверим зто при рассмотрении Примера 1.
Оrравнчеивя критерия Л
1. Критерий требует, чrобы выборка была достаточно большой. При
сопоставлении двух эмпирических распределений необходимо, что
бы n1.22:50. Сопоставление эмпирического распределения с теоре тическим иногда допускается при n2:5 (Ван дер Варден Б.Л.,
1960; Гублер Е.В., 1978).
8 Оrносителz.ная частота, или частость, - зто частота, отнесенная к общему коли
честву набАЮдений; в данном случае вто частота попадания желтого цвета ка дан
ную позицию, отнесенная к количеству испьnуемых. Например, частота попадания желтоrо цвета ка 1-ю позицию /=24; количество испьпуемых n=t02; отиосителъная
частота /*=f/n=0,235.
144 |
Г.11ава 4 |
2.Разряды должны быть упорядочены по нарастанию ил1:1 убыванию
какого-либо признака. Они обязательно должны отражать какое-то
однонаправленное его изменение. Например, мы можем за разряды
принять дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса
терапии, повышение температуры тела, усиление чувства недостаточ
ности и т. д. В то же время, если мы возьмем разряды, которые случайно оказались выстроенными в данную последовательность, то
и накопление частот будет отражать лишь этот элемент случайного
соседства разрядов. Например, если шесть стимульных картин в ме тодике Хекхаузена разным испытуемым предъявляются в разном
порядке, мы не вправе говорить о нако~;tлении реакций при переходе
от картины No1 стандартного набора к картине №2 и т. д. Мы не
можем говорить об однонаправленном изменении признака при со
поставлении категорий "очередность рождения", "национальность",
"специфика полученного образования" и т.п. Эти данные представ
ляют собой номинативные шкалы: в них нет никакого однозначного
однонаправленного изменения признака.
Итак, мы не можем накапливать частоты по разрядам, которые
отличаются лишь качественно и не представляют собой шкалы порядка.
Во всех тех случаях, когда разряды представляют собой не упо
рядоченные по возрастанию или убыванию какого-либо признака кате
гории, нам следует применять метод х2.
Пример 1: Сопоставление ампнрнческоrо распре4елення с
теоретическим
В выборке здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний воз раст 20 лет, проводился тест Люшера в 8-цветном варианте. Установ
лено, что желтый цвет предпочитается испытуемыми чаще, чем отверга
ется (Табл. 4.16). Можно ли утверждать, что распределение желтого цвета по 8-и позициям у здоровых испытуемых отличается от равно мерного распределения?
Таблщ~а 4.16
Эмпирические частоты попадания желтого цвета на каждую из 8 позиций (n=102)
Разряды |
Пози |
вета |
|
Сумма |
|
|
7 |
8 |
102 |
Эмпи ические частоты |
24 25 13 8 15 |
9 |
8 |
Сформулируем гипотезы.
Крвтернн corAaCНR рас11редtмевнi1 |
145 |
Но: Эмпирическое распределение желтого цвета по восьми позициям не
отличается от равномерного распределения.
Н1: Эмпирическое распределение желтого цвета по восьми позициям
отличается от равномерного распределения.
Теперь приступим к расчетам, постепенно заполняя результатами
таблицу расчета критерия Л. Все операции лучше прослеживать по
Табл. 4.17, тогда они будут более понятны~.
Занесем в таблицу наименования (номера) разрядов и соответст вующие им эмпирические частоть1 {первый столбец Табл. 4.17).
Затем рассчитаем эмпирические частости /* по формуле:
fFl/n
где fi • частота попадания желтого цвета на данную позицию;
1'1 - общее количество наблюдений; j • номер позиции по порядку.
Запишем результаты во второй столбец (см. Табл. 4.17). Теперь нам нужно подсчитать накопленные эмпирические часто
сти "i./*. Для этого будем суммировать эмпирические частости /*. На пример, для 1-го разряда накопленная эмпирическая частость будет
равняться эмпирической частости 1-го разряда, "i./*1=0,2359.
Для 2-го разряда накопленная эмпирическая частость будет пред· ставлять собой сумму эмпирических частостей 1-го и 2-го разрядов:
1:/*н.z=О,235+0,147=0,382
Для 3-го разряда накопленная эмпирическая частость будет пред ставлять собой сумму эмпирических частостей 1-го, 2-го и 3-го разрядов:
1:/*н2+з=О.235+0,147+0,128=0,510
Мы видим, что можно упростить задачу, суммируя накопленную
эмпирическую частость предыдущего разряда с эмпирической частостью
данного разряда, например, для 4-го разряда:
1:/*1+2+3+4=0,510+0,078=0,588
Запишем результаты этой работы в третий столбец.
Теперь нам необходимо сопоставить накопленные эмпирические
частости с накопленными теоретическими частостями. Для 1-го разряда
теоретическая частость определяется по формуле:
f'*тeop=1/k
9 Все фОрмулы приведены /1.М1 дискретных признаков, которые могут быть выра·
жены целыми числами, например: порядковый номер, коАИЧество испытуемых, ко J1Ичественный состав rp)'ППlll и т.п.
146 |
IАава 4 |
rде k • |
количество разрядов (в данном случае • позиций цвета). |
Для рассматриваемого примера:
/*теор=1/8=0,125
Эта теоретическая частость относится ко всем 8-и разрядам. Действительно, вероятность попадания желтого (или любого другого) цвета на каждую из 8-и позиций при случайном выборе составляет
1/8, т.е. 0,125.
Накопленные теоретические частости для каждого разряда опре деляем суммированием. Для 1-го разряда накопленная теоретическая
частость равна теоретической частости попадания в разряд:
f*т 1=0,125
Для 2-ro разряда накопленная теоретическая частость представ ляет собой сумму теоретических частостей 1-ro и 2-ro разрядов:
f*т t+r=0.125+0,125=0,250
Для 3-ro разряда накопленная теоретическая частость представ
ляет собой сумму накопленной к предыдущему разряду теоретической частости с теоретической частостью данного разряда:
l*т t+z+э=0.250+0,125=0,375
Можно определить теоретические накопленные частости и путем
умножения:
S/*т Ff*тeop·j
rде /*теор • теоретическая частость; j • порJ!дковый номер разряда.
Занесем рассчитанные накопленные теоретические частости в четверть1й столбец таблицы (Табл. 4.17).
Теперь нам осталось вычислить разности между эмпирическими и теоретическими накопленными частостями (столбцы 3-й и 4-й). В пя
тый столбец записываются абсолютные величины этих разностей, обо
значаемые как d.
Определим по столбцу 5, какая из абсолютных величин разности ввляется наибольшей. Она будет называться dmax· В данном случае
dmax=0,135.
Теперь нам нужно обратиться к Табл. Х Приложения 1 для оп ределения критических значений dmax при n=102.
|
|
Крнтернн соrАасня распредеАеннiJ |
147 |
|||||
|
|
|
|
|
|
|
|
Таблщ~а 4.17 |
Расчет критерия при сопоставлении распределения выборов желтого |
||||||||
|
|
цвета с равномерным распределением (п=102) |
||||||
|
|
|
|
|
|
Накопленная |
Накоменная |
|
Позиция JКeAтort |
Эмпирическая Эмпирическая |
эмпирическая |
теоре11tческая |
Разносn. |
||||
"....... |
|
частота |
|
частость |
частость |
час.-rость |
0,110 |
|
1 |
|
24 |
|
0,235 |
|
0.235 |
0,125 |
|
2 |
|
15 |
|
0,147 |
|
0,382 |
0,250 |
0,132 |
3 |
|
13 |
|
0.128 |
|
0,510 |
0,375 |
i> 0i1U'T~.·\ |
4 |
|
8 |
|
0,078 |
0,588 |
0,500 |
0,088 |
|
5 |
|
15 |
|
0,147 |
|
0,735 |
0,625 |
0,110 |
6 |
|
10 |
|
0,098 |
0,833 |
0,750 |
0,083 |
|
7 |
|
9 |
|
0,088 |
0,921 |
0,875 |
0,046 |
|
8 |
|
8 |
|
0,079 |
1,000 |
1.000 |
О.ООО |
|
Сvммы |
|
102 |
|
1,000 |
|
|
|
|
|
|
|
(р $ |
0,05) |
|
|
|
|
|
|
|
(р $ |
0,01) |
|
|
|
|
Для данного случая, следовательно, |
|
|
||||||
|
|
1.36/ |
=о135 |
(р :с:; 0,05) |
|
|
||
d - |
{ |
/ .J102 |
' |
|
|
|
|
|
кр- |
1,бЗ/ |
= О161 |
(р :S 0,01) |
|
|
|||
|
|
/JWz |
' |
|
|
|
|
|
Очевидно, что чем больше различаются распределения, тем больше и различия в накопленных частостях. Позтому нам не составит
труда распределить зоны значимости и незначимости по соответствую
щей оси:
Зона неэначимостн |
Зона значимости |
О,161
dзмп=О,135 dзмп=dкр.
Ответ: Но отвергается при р=О,05. Распределение желтого цве
та по восьми позициям отличается от равномерного распределения.
Представим все выполненные действия в виде алгоритма
148
АЛГОРИТМ 14
Расчет абсолютной веАнчии1о1 разности J ме:акяу
ампнрнческнм н равиомерн1о1м распреяеленнями
1. Занести в таблицу наименования разрядов и соответствующие им
эмпирические частоты (первый столбец}.
2. Подсчитать относительные эмпирические частоты (частости) для
каждого разряда по формуле:
f*амп=fвмп/n,
где fамп • эмпирическая частота по данному разряду;
п • общее количество наблюдений.
Занести результаты во второй столбец.
3. Подсчитать накопленн1>1е эмпирические частости If*j по формуле:
U*ril*;-t +!*;
где If*;-t • частость, накопленная на предыдущих разрядах; j • порядковый номер разряда;
f*;· эмпирическая частость данного j-го разряда.
Занести результаты в третий столбец таблицы.
4. Подсчитать накопленные теоретические частости для каждого раз
ряда по Формуле:
I/*т ;=I/*т ;-1+/*т ;
где I/*т ;-t • теоретическая частость, накопленная на nредыдуЩи1
разрядах;
j • порядковый номер разряда;
/*т ; • теоретическая частость данного разряда. Занести результаты в третий столбец таблицы.
5. Вычислить разности между эмпирическими и теоретическими нако
пленными частостями по каждому разряду (между значениями 3-го
и4-го столбцов).
6.Записать в пятый столбец абсолютные величины полученных раз
ностей, без их знака. Обозначить их как d.
7.Определить по пятому столбцу наибольшую абсолютную величину
разности • dmax·
8. По Табл. Х Приложения 1 определить или рассчитать критические значения dmax для данного количества наблюдений п.
Если dmax равно критическому значению d или превышает его,
различия между распределениями достоверны.
Кр11Тервв соrАасвн распрцеАенвй |
149 |
Пример 2: сопоставление двух вмпирнческнх распределений Интересно сопоставить данные, полученные в предыдущем при
.,.ере, с данными обследования Х. Кларом 800 испытуемых (Юаr Н.,
1974, р. 67). Х. Кларом было показано, что желтый цвет является единственным цветом, распределение которого по 8 позициям не отли-
чается от равномерного. |
Для |
о |
2 |
|
сопоставлении |
им использовался метод Х. |
Полученные им эмпирические частоты представлены в Табл. 4.18.
Таблщ"а 4.18
Эмпирические частоты попадания желтого цвета на каждую из 8 пози ций в исследовании Х. Клара (по: Юаr Н., 1974) (n=800)
Разряды-позиции |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Сумма |
||
желтого |
а |
||||||||||
|
|
|
|
|
|
|
86 |
800 |
|||
Эмпи ические частоты 98 |
|
|
|
91 |
112 |
97 |
Сформулируем гипотезы.
Но: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке Х. Клара не различаются.
Н1: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке Х. Клара отличаются друг от друга.
Поскольку в данном случае мы будем сопоставлять накопленные
эмпирические частости по каждому разряду, теоретические частости нас
·не интересуют.
Все расчеты будем проводить в таблице по алгоритму 15.
1;0 |
Г.иu4 |
АЛГОРИТМ tS
Расчет крвтерu Л nрв сопостаuеввв АВ)'Ж аипврвческв:к распреАелеввii
1. Занести в таблицу наименования разрцов и соответствующие им вмпирические
чаСТОТЬJ, полученные в распределении 1 (первый столбец) и в распределении 2
{второй столбец).
2. Подсчитать эмпирические частости по каждому раэрщ А.ЛЯ распределения 1
по формуле:
r.=f./n1
rде /, • эмпирическая частота в данном разряде; n1 • коАИЧество набJUОдений в выборке.
Занести эмпирические частости .распределения 1 в третий столбец.
3. Подсчитать эмпирические частости по каждому разрщ А.ЛЯ распределенIОI 2
по формуле:
r.=f./nz
rде f8 • эмпирическая частота в Ai\HHOM разряде; nz • коАИЧество набJUОдений во 2-й выборке.
Занести эмпирические частости распределения 2 в четверть1й столбец таблицы. 4. Подсчитать накопленные эмпирические частости А.ЛЯ распределения 1 по форму
ле:
r.ri=r.rj-1+ri
rде 'f.f"j-1• частость, накопленная на преАЫАУЩИХ разрядах; j • порядко111>1Й номер разряда;
rj-1" частость данноrо разрца.
Полученные результаты записать в пятый столбец.
5.Подсч!П'ать накопленные эмпирические частости А.ЛЯ распределения 2 по той
же формуле и записать результат в шестой столбец.
6.Подсчитать разности между накопленными частост.ями по каждому разрщ.
Записать в седьмой столбец абсОJ1ЮТНые веАИЧИны разностей, без их знака. Обозначить их как d.
7.Определить по седьмому столбцу наибольшую абсоJIЮТН)'IО &еАИЧИН)' разности dmu•
8.Подсчитать значение критерия Л по формуле:
A.=d ·J n1 '"2
max n1 +n2
rде n1 • количество набJUОдений в первой выборке; nz • количество наблюдений во второй выборке.
9.По Табл. XI Приложения 1 определить, какому уровню статистической зна чимости соответствует полученное значение Л.
Если Л....,<!:1,36, раэАИЧИЯ между распределениями достоверны.
Kpll'l't!pвв соr.11асвя распреди.еввii
Последовательность выборок может быть выбрана произвольно,
так как расхождения между ними оцениваются по абсолютной величине
разностей. В нашем случае первой будем считать отечественную выбор ку, второй • выборку Клара.
Таблщ.~а 4.19
Расчет критерия при сопоставлении эмпирических распределений
желтого цвета в отечественной выборке (n1=102) и выборке Клара (n2=800)
3 |
13 |
116 |
|
|
|
|
... |
Позиция |
|
|
|
|
НакоплеЮIЫе аМ:пириче- |
|
|
желтоrо |
Эмпирические часТОТ11 |
Эмпирические частостн |
сR.ие частостн |
Разность |
|||
"........ |
/, |
j, |
f*, |
/*, |
Т.f*, |
ТJ*, |
I/*1-If*, |
1 |
24 |
98 |
0,235 |
0,123 |
0,235 |
0,123 |
0,112 |
2 |
15 |
113 |
0,147 |
0,141 |
0.382 |
0,264 . |
~)'' |
|
|
|
0,128 |
0,145 |
0,510 |
0,409 |
0,101 |
4 |
8 |
87 |
0,078 |
0,109 |
0,588 |
0,518 |
0,070 |
5 |
15 |
91 |
0,147 |
0,114 |
0,735 |
0,632 |
0,103 |
6 |
10 |
112 |
0,098 |
0,140 |
0,833 |
0,772 |
0,061 |
7 |
9 |
97 |
0,088 |
0,121 |
0,921 |
0,893 |
. 0,028 |
8 |
8 |
86 |
0,079 |
0,107 |
1,000 |
1,000 |
о |
Сvммы |
102 |
800 |
1,000 |
1,000 |
|
|
|
Максимальная разность между накопленными эмпирическими частостями составляет О,118 и падает на второй ·разряд.
В соответствии с пунктом 8 алгоритма 15 подсчитаем значение А.:
Лэмп=О118· lOZ· 300 =112
•102+800 •
По Табл. XI Приложения 1 определяем уровень статистической значимости полученного значения: р=О,16
Построим для наглядности_ось значимости.
Зона ЗН&ЧИМDС111
1,12
На оси указаны критические значения Л.,соответствующие приня
тым уровням значимости: A.o.os=1,36, Ло.01=1,63.
Зона значимости простирается вправо, от 1,63 и далее, а зона незначимости ·влево, от 1,36 к меньшим значениям.
Л..мп<Ахр.