- •Нечипоренко о. В. Математичні методи в психології
- •Розробники:
- •Рецензенти:
- •Лекція 1 проблема вимірювання в психології
- •Виміри та шкали
- •Лекція 2 основні статистичні поняття
- •Лекція 3 підготовка даних до математичної обробки
- •Графічне представлення результатів
- •Визначення квантилів
- •Лекція 4 міри центральної тенденції
- •Середнє арифметичне значення
- •Міри мінливості
- •Дисперсія
- •Середньоквадратичне (стандартне) відхилення
- •Коефіцієнт варіації
- •Перевірка статистичних гіпотез
- •Розподіл змінних величин
- •2. Характеристики форми розподілу
- •5.4. Типи ексцесу
- •3. Критерій хі-квадрат (χ2) Пірсона
- •Формулюються статичні гіпотези:
- •Підраховується загальна кількість виборів.
- •Складення таблиці для вирахування емпіричного значення χ2.
- •1. Формулюються статистичні гіпотези.
- •2. У таблиці підраховуються суми частот по рядках і по стовпцях.
- •4. Критерій Колмогорова – Смірнова (l)
- •Дослідження взаємозв’язку ознак Кореляція
- •Класифікації коефіцієнтів кореляції
- •Класифікація коефіцієнтів кореляції за силою
- •Класифікація коефіцієнтів кореляції за значимістю
- •Визначення значимості кореляції
- •Лінійна кореляція
- •Дихотомічний коефіцієнт кореляції (φ)
- •Коефіцієнт рангової кореляції Кендалла (тау Кендалла, t )
- •Точковий бісеріальний коефіцієнт кореляції (rpb)
- •Оцінка достовірності відмінностей Класифікація критеріїв
- •Непараметричний критерій q Розенбаума
- •Критерій φ⃰ - кутового перетворення Фішера
- •Біноміальний критерій m
- •Міри впливу Сутність проблеми
- •Оцінка достовірності зсуву в значеннях досліджуваної ознаки
- •Класифікація зсувів та критеріїв оцінки їх статистичної достовірності
- •Непараметричні міри впливу
- •Критерій χr2 Фрідмана
4. Критерій Колмогорова – Смірнова (l)
Критерій Колмогорова-Смірнова заснований на тому ж принципі, що і критерій χ2 Пірсона, але передбачає зіставлення накопичених частот експериментального і теоретичного розподілів. Обчислюється як відношення максимальної різниці (без урахування знака) між теоретичною та експериментальною накопиченою частотою до кореню квадратному з чисельності вибірки.
Призначення критерію
Критерій l призначений для співставлення двох розподілів:
а) емпіричного з теоретичним, наприклад, рівномірним або нормальним;
б) одного емпіричного розподілу з іншим емпіричним розподілом.
Критерій дозволяє найти точку, в якій сума накопичених відмінностей між двома розподілами є найбільшою, і оцінити достовірність цих відмінностей.
Опис критерію
Якщо в методі χ2 ми зіставляли частоти двох розподілів окремо по кожному розряду, то тут співставляються спочатку частоти за першим розрядом, потім за сумою першого та другого розрядів, потім за сумою першого, другого та третього розрядів і т.п. таким чином, ми зіставляємо кожного разу накопичені до даного розряду частоти. Якщо відмінності між двома розподілами суттєві, то в якийсь момент різниця накопичених частот досягне критичного значення, і ми зможемо визнати відмінності статистично достовірними. Формула критерію l містить цю різницю. Чим більше емпіричне значення l, тим більш суттєві відмінності.
Обмеження критерію l
Критерій вимагає, щоб вибірка була достатньо великою. При зіставленні двох емпіричних розподілів необхідно, щоб n1,2≥50. Зіставлення емпіричного розподілу з теоретичним іноді допускається при n≥5.
Розряди повинні бути упорядковані за зростанням або убуванням якоїсь ознаки. Вони обов’язково повинні відображати якусь одно направлену її зміну. (наприклад дні тижня, 1-й, 2-й, 3-й місяці після проходження курсу терапії, підвищення температури тіла).
Отже, ми не можемо накопичувати частоти за розрядами, які відрізняються лише якісно і не є шкалами порядку.
У всіх випадках коли розряди мають неупорядкований за зростанням або убуванням якоїсь ознаки категорії, нам слід використовувати метод χ2.
Зіставлення емпіричного розподілу з теоретичним
У вибірці здорових осіб чоловічої статі, студентів технічних і воєнно-технічних вузів у віці від 19-ти до 22 років, середній вік 20 років, проводився тест Люшера в 8-колірному варіанті. Установлено, що жовтому кольору надають перевагу досліджувані частіше, ніж відхиляють. Чи можна стверджувати, що розподіл жовтого кольору за 8-ма позиціями у здорових досліджуваних відрізняється від рівномірного розподілу?
Розряди |
Позиції жовтого кольору |
сума |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
||
Емпіричні частоти |
24 |
25 |
13 |
8 |
15 |
10 |
9 |
8 |
102 |
|
Н0: емпіричний розподіл жовтого кольору за восьма позиціями не відрізняється від рівномірного розподілу.
Н1: емпіричний розподіл жовтого кольору за восьма позиціями відрізняється від рівномірного розподілу.
Розрахунок критерію при співставленні розподілу виборів жовтого кольору з рівномірним розподілом (n=102)
Позиція жовтого кольору |
Емпірична частота |
Емпірична частість |
Накопичена емпірична частість |
Накопичена теоретична частість |
різниця |
1 |
24 |
0,235 |
0,235 |
0,125 |
0,110 |
2 |
15 |
0,147 |
0,382 |
0,250 |
0,132 |
3 |
13 |
0,128 |
0,510 |
0,375 |
0,135 |
4 |
8 |
0,078 |
0,588 |
0,500 |
0,088 |
5 |
15 |
0,147 |
0,735 |
0,625 |
0,110 |
6 |
10 |
0,098 |
0,833 |
0,750 |
0,083 |
7 |
9 |
0,088 |
0,921 |
0,875 |
0,046 |
8 |
8 |
0,079 |
1,000 |
1,000 |
0,000 |
Суми |
102 |
1,000 |
|
|
|
Заносимо в таблицю найменування (номери) розрядів та відповідні емпіричні частоти.
Розраховуємо емпіричні частості f ⃰ за формулою:
f⃰=fi/n
де fi – частота попадання жовтого кольору на дану позицію;
n – загальна кількість спостережень;
i – номер позиції по порядку.
f⃰1=24/102=0,235
f⃰2=15/102=0,147
f⃰3=13/102=0,128
f⃰4=8/102=0,078
f⃰5=15/102=0,147
f⃰6=10/102=0,098
f⃰7=9/102=0,088
f⃰8=8/102=0,079
Підраховуємо накопичені емпіричні частості Ʃf⃰.
Ʃf⃰1=0,235
Ʃf⃰1+2=0,235+0,147=0,382
Ʃf⃰1+2+3=0,235+0,147+0,128=0,510
Ʃf⃰1+2+3+4=0,235……………=0,588
Ʃf⃰1+2+3+4+5=0,235………….=0,735
Ʃf⃰1+2+3+4+5+6=0,235………..=0,833
Ʃf⃰1+2+3+4+5+6+7=0,235………=0,921
Ʃf⃰1+2+3+4+5+6+7+8=0,235…….=1,000
Необхідно визначити теоретичні частості f⃰теор=1/k=1/8=0,125
k – кількість розрядів
Ця теоретична частість відноситься до всіх 8-ми розрядів. Вірогідність попадання жовтого кольору на з 8-ми позицій при випадковому виборі становить 1/8, тобто 0,125.
f⃰т1=0,125
f⃰т1+2=0,125+0,125=0,250
f⃰т1+2+3=0,125+0,125+0,125=0,375
Можна визначити теоретичні накопичені частості шляхом множення:
Sf⃰тi= f⃰т ·i
f⃰т – теоретична частість;
i – порядковий номер розряду.
Тепер залишилось вирахувати різницю між емпіричними та теоретичними накопиченими частостями (стовпчик 4-й та 5-й). в 6-й стовпчик записуються абсолютні величини цих різниць, які позначаються як d.
Визначити яка з абсолютних величин різниці є найбільшою. Вона буде називатися dmax.
В нашому прикладі dmax.=0,135.
Знаходимо критичні значення dmax. при n=102 (Табл. Х)
dкр |
p=0,05 |
p=0,01 |
1,36/√n |
1,63/√n |
|
1,36/10,09 |
1,63/10,09 |
|
|
0,135 |
0,161 |
dемп.=0,135
dемп.= dкр.
Висновок: Н0 відхиляється при р=0,05. Розподіл жовтого кольору за 8-ми позиціями відрізняється від рівномірного розподілу.
Зіставлення двох емпіричних розподілів
Співставимо дані отримані в попередньому прикладі та дані обстеження Кларом 800 досліджуваних. Він показав, що жовтий колір єдиний розподіл якого за 8-ма позиціями не відрізняється від рівномірного.
Розряди-позиції |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
сума |
Емпіричні частоти |
98 |
113 |
116 |
87 |
91 |
112 |
97 |
86 |
800 |
Н0: Емпіричний розподіл жовтого кольору за 8-ма позиціями у вітчизняній вибірці та вибірці Клара не відрізняються.
Н1: Емпіричні розподіли жовтого кольору за 8-ма позиціями у вітчизняній вибірці та вибірці Клара відрізняються один від одного.
Розрахунки проводяться за алгоритмом
Позиція жовтого кольору |
Емпіричні частоти |
Емпіричні частості |
Накопичені емпіричні частості |
різниця |
|||
f1 |
f2 |
f⃰1 |
f⃰2 |
Ʃf⃰1 |
Ʃf⃰2 |
||
1 |
24 |
98 |
0,235 |
0,123 |
0,235 |
0,123 |
0,112 |
2 |
15 |
113 |
0,147 |
0,141 |
0,382 |
0,264 |
0,118 |
3 |
13 |
116 |
0,128 |
0,145 |
0,510 |
0,409 |
0,101 |
4 |
8 |
87 |
0,078 |
0,109 |
0,588 |
0,518 |
0,070 |
5 |
15 |
91 |
0,147 |
0,114 |
0,735 |
0,632 |
0,103 |
6 |
10 |
112 |
0,098 |
0,140 |
0,833 |
0,772 |
0,061 |
7 |
9 |
97 |
0,088 |
0,121 |
0,921 |
0,893 |
0,028 |
8 |
8 |
86 |
0,079 |
0,107 |
1,000 |
1,000 |
0 |
Суми |
102 |
800 |
1,000 |
1,000 |
|
|
|
Максимальна різниця між накопиченими емпіричними частостями складає 0,118 і припадає на 2 розряд.
У відповідності з пунктом 8 алгоритму підраховуємо значення λ:
За Табл. ХІ визначаємо рівень статистичної значимості отриманого значення: р=0,16
На осі вказані критичні значення λ, які відповідають прийнятим рівням значимості: λ0,05=1,36, λ0,01=1,63.
λемп ˂ λкр
Висновок: Н0 приймається. Емпіричний розподіл жовтого кольору по 8-ми позиціям співпадають. Таким чином розподіли в двох вибірках не відрізняються.
Лекція 7-8
