Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекції.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.61 Mб
Скачать

4. Критерій Колмогорова – Смірнова (l)

Критерій Колмогорова-Смірнова заснований на тому ж принципі, що і критерій χ2 Пірсона, але передбачає зіставлення накопичених частот експериментального і теоретичного розподілів. Обчислюється як відношення максимальної різниці (без урахування знака) між теоретичною та експериментальною накопиченою частотою до кореню квадратному з чисельності вибірки.

Призначення критерію

Критерій l призначений для співставлення двох розподілів:

а) емпіричного з теоретичним, наприклад, рівномірним або нормальним;

б) одного емпіричного розподілу з іншим емпіричним розподілом.

Критерій дозволяє найти точку, в якій сума накопичених відмінностей між двома розподілами є найбільшою, і оцінити достовірність цих відмінностей.

Опис критерію

Якщо в методі χ2 ми зіставляли частоти двох розподілів окремо по кожному розряду, то тут співставляються спочатку частоти за першим розрядом, потім за сумою першого та другого розрядів, потім за сумою першого, другого та третього розрядів і т.п. таким чином, ми зіставляємо кожного разу накопичені до даного розряду частоти. Якщо відмінності між двома розподілами суттєві, то в якийсь момент різниця накопичених частот досягне критичного значення, і ми зможемо визнати відмінності статистично достовірними. Формула критерію l містить цю різницю. Чим більше емпіричне значення l, тим більш суттєві відмінності.

Обмеження критерію l

  1. Критерій вимагає, щоб вибірка була достатньо великою. При зіставленні двох емпіричних розподілів необхідно, щоб n1,2≥50. Зіставлення емпіричного розподілу з теоретичним іноді допускається при n≥5.

  2. Розряди повинні бути упорядковані за зростанням або убуванням якоїсь ознаки. Вони обов’язково повинні відображати якусь одно направлену її зміну. (наприклад дні тижня, 1-й, 2-й, 3-й місяці після проходження курсу терапії, підвищення температури тіла).

Отже, ми не можемо накопичувати частоти за розрядами, які відрізняються лише якісно і не є шкалами порядку.

У всіх випадках коли розряди мають неупорядкований за зростанням або убуванням якоїсь ознаки категорії, нам слід використовувати метод χ2.

Зіставлення емпіричного розподілу з теоретичним

У вибірці здорових осіб чоловічої статі, студентів технічних і воєнно-технічних вузів у віці від 19-ти до 22 років, середній вік 20 років, проводився тест Люшера в 8-колірному варіанті. Установлено, що жовтому кольору надають перевагу досліджувані частіше, ніж відхиляють. Чи можна стверджувати, що розподіл жовтого кольору за 8-ма позиціями у здорових досліджуваних відрізняється від рівномірного розподілу?

Розряди

Позиції жовтого кольору

сума

1

2

3

4

5

6

7

8

Емпіричні частоти

24

25

13

8

15

10

9

8

102

Н0: емпіричний розподіл жовтого кольору за восьма позиціями не відрізняється від рівномірного розподілу.

Н1: емпіричний розподіл жовтого кольору за восьма позиціями відрізняється від рівномірного розподілу.

Розрахунок критерію при співставленні розподілу виборів жовтого кольору з рівномірним розподілом (n=102)

Позиція жовтого кольору

Емпірична частота

Емпірична частість

Накопичена емпірична частість

Накопичена теоретична частість

різниця

1

24

0,235

0,235

0,125

0,110

2

15

0,147

0,382

0,250

0,132

3

13

0,128

0,510

0,375

0,135

4

8

0,078

0,588

0,500

0,088

5

15

0,147

0,735

0,625

0,110

6

10

0,098

0,833

0,750

0,083

7

9

0,088

0,921

0,875

0,046

8

8

0,079

1,000

1,000

0,000

Суми

102

1,000

Заносимо в таблицю найменування (номери) розрядів та відповідні емпіричні частоти.

Розраховуємо емпіричні частості f за формулою:

f⃰=fi/n

де fi – частота попадання жовтого кольору на дану позицію;

n – загальна кількість спостережень;

i – номер позиції по порядку.

f1=24/102=0,235

f2=15/102=0,147

f3=13/102=0,128

f4=8/102=0,078

f5=15/102=0,147

f6=10/102=0,098

f7=9/102=0,088

f8=8/102=0,079

Підраховуємо накопичені емпіричні частості Ʃf⃰.

Ʃf1=0,235

Ʃf1+2=0,235+0,147=0,382

Ʃf1+2+3=0,235+0,147+0,128=0,510

Ʃf1+2+3+4=0,235……………=0,588

Ʃf1+2+3+4+5=0,235………….=0,735

Ʃf1+2+3+4+5+6=0,235………..=0,833

Ʃf1+2+3+4+5+6+7=0,235………=0,921

Ʃf1+2+3+4+5+6+7+8=0,235…….=1,000

Необхідно визначити теоретичні частості fтеор=1/k=1/8=0,125

kкількість розрядів

Ця теоретична частість відноситься до всіх 8-ми розрядів. Вірогідність попадання жовтого кольору на з 8-ми позицій при випадковому виборі становить 1/8, тобто 0,125.

fт1=0,125

fт1+2=0,125+0,125=0,250

fт1+2+3=0,125+0,125+0,125=0,375

Можна визначити теоретичні накопичені частості шляхом множення:

Sfтi= fт ·i

fт теоретична частість;

i – порядковий номер розряду.

Тепер залишилось вирахувати різницю між емпіричними та теоретичними накопиченими частостями (стовпчик 4-й та 5-й). в 6-й стовпчик записуються абсолютні величини цих різниць, які позначаються як d.

Визначити яка з абсолютних величин різниці є найбільшою. Вона буде називатися dmax.

В нашому прикладі dmax.=0,135.

Знаходимо критичні значення dmax. при n=102 (Табл. Х)

dкр

p=0,05

p=0,01

1,36/√n

1,63/√n

1,36/10,09

1,63/10,09

0,135

0,161

dемп.=0,135

dемп.= dкр.

Висновок: Н0 відхиляється при р=0,05. Розподіл жовтого кольору за 8-ми позиціями відрізняється від рівномірного розподілу.

Зіставлення двох емпіричних розподілів

Співставимо дані отримані в попередньому прикладі та дані обстеження Кларом 800 досліджуваних. Він показав, що жовтий колір єдиний розподіл якого за 8-ма позиціями не відрізняється від рівномірного.

Розряди-позиції

1

2

3

4

5

6

7

8

сума

Емпіричні частоти

98

113

116

87

91

112

97

86

800

Н0: Емпіричний розподіл жовтого кольору за 8-ма позиціями у вітчизняній вибірці та вибірці Клара не відрізняються.

Н1: Емпіричні розподіли жовтого кольору за 8-ма позиціями у вітчизняній вибірці та вибірці Клара відрізняються один від одного.

Розрахунки проводяться за алгоритмом

Позиція жовтого кольору

Емпіричні частоти

Емпіричні частості

Накопичені емпіричні частості

різниця

f1

f2

f⃰1

f⃰2

Ʃf⃰1

Ʃf⃰2

1

24

98

0,235

0,123

0,235

0,123

0,112

2

15

113

0,147

0,141

0,382

0,264

0,118

3

13

116

0,128

0,145

0,510

0,409

0,101

4

8

87

0,078

0,109

0,588

0,518

0,070

5

15

91

0,147

0,114

0,735

0,632

0,103

6

10

112

0,098

0,140

0,833

0,772

0,061

7

9

97

0,088

0,121

0,921

0,893

0,028

8

8

86

0,079

0,107

1,000

1,000

0

Суми

102

800

1,000

1,000

Максимальна різниця між накопиченими емпіричними частостями складає 0,118 і припадає на 2 розряд.

У відповідності з пунктом 8 алгоритму підраховуємо значення λ:

За Табл. ХІ визначаємо рівень статистичної значимості отриманого значення: р=0,16

На осі вказані критичні значення λ, які відповідають прийнятим рівням значимості: λ0,05=1,36, λ0,01=1,63.

λемп ˂ λкр

Висновок: Н0 приймається. Емпіричний розподіл жовтого кольору по 8-ми позиціям співпадають. Таким чином розподіли в двох вибірках не відрізняються.

Лекція 7-8