- •Нечипоренко о. В. Математичні методи в психології
- •Розробники:
- •Рецензенти:
- •Лекція 1 проблема вимірювання в психології
- •Виміри та шкали
- •Лекція 2 основні статистичні поняття
- •Лекція 3 підготовка даних до математичної обробки
- •Графічне представлення результатів
- •Визначення квантилів
- •Лекція 4 міри центральної тенденції
- •Середнє арифметичне значення
- •Міри мінливості
- •Дисперсія
- •Середньоквадратичне (стандартне) відхилення
- •Коефіцієнт варіації
- •Перевірка статистичних гіпотез
- •Розподіл змінних величин
- •2. Характеристики форми розподілу
- •5.4. Типи ексцесу
- •3. Критерій хі-квадрат (χ2) Пірсона
- •Формулюються статичні гіпотези:
- •Підраховується загальна кількість виборів.
- •Складення таблиці для вирахування емпіричного значення χ2.
- •1. Формулюються статистичні гіпотези.
- •2. У таблиці підраховуються суми частот по рядках і по стовпцях.
- •4. Критерій Колмогорова – Смірнова (l)
- •Дослідження взаємозв’язку ознак Кореляція
- •Класифікації коефіцієнтів кореляції
- •Класифікація коефіцієнтів кореляції за силою
- •Класифікація коефіцієнтів кореляції за значимістю
- •Визначення значимості кореляції
- •Лінійна кореляція
- •Дихотомічний коефіцієнт кореляції (φ)
- •Коефіцієнт рангової кореляції Кендалла (тау Кендалла, t )
- •Точковий бісеріальний коефіцієнт кореляції (rpb)
- •Оцінка достовірності відмінностей Класифікація критеріїв
- •Непараметричний критерій q Розенбаума
- •Критерій φ⃰ - кутового перетворення Фішера
- •Біноміальний критерій m
- •Міри впливу Сутність проблеми
- •Оцінка достовірності зсуву в значеннях досліджуваної ознаки
- •Класифікація зсувів та критеріїв оцінки їх статистичної достовірності
- •Непараметричні міри впливу
- •Критерій χr2 Фрідмана
1. Формулюються статистичні гіпотези.
Н0: розподіли переваг напрямів навчання в юнаків і у дівчат значно не відрізняються від випадкових.
Н1: розподіли переваг напрямів навчання в юнаків і у дівчат значно відрізняються від випадкових.
2. У таблиці підраховуються суми частот по рядках і по стовпцях.
|
Математика |
Природничі науки |
Гуманітарні науки |
Сума частот по рядках |
Юнаки |
18 |
10 |
3 |
31 |
Дівчата |
10 |
9 |
15 |
34 |
Сума частот по стовпцях |
28 |
19 |
18 |
Загальна сума частот=65 |
3. Складається таблиця вирахування емпіричного значення χ.2 У нульовому стовпці представлені дані по статі та вибору профілю навчання. У перший стовпець (fе) заносяться значення емпіричних частот з попередньої таблиці. У другому стовпці (fT) – похідні суми рядків на суму стовпців для відповідної клітинки, поділені на загальну суму частот (у нашому випадку–65). Це так звані теоретичні частоти, тобто значення, які могли вийти, якщо б не було значимих переваг у виборі (якщо б розподіли частот були незалежними). На цьому етапі ми відзначаємо, що таблиця відповідає вимогам щодо використання даного критерію (n > 30 і fT >5). Третій стовпець містить результати обчислення виразів попереднього стовпця. Четвертий – різниця емпіричної та теоретичної частот. Потім отримані різниці зводяться в квадрат, діляться на теоретичні частоти і додаються.
|
fе |
fT |
fT |
fе – fT |
(fе – fT)2 |
(fе – fT)2/ fT |
Юнаки-математики |
18 |
31·28/65 |
13,35 |
4,65 |
21,59 |
1,62 |
Юнаки-природничі науки |
10 |
31·19/65 |
9,06 |
0,94 |
0,88 |
0,10 |
Юнаки-гуманітарні науки |
3 |
31·18/65 |
8,58 |
-5,58 |
31,19 |
3,64 |
Дівчата-математики |
10 |
34·28/65 |
14,65 |
-4,65 |
21,59 |
1,47 |
Дівчата-природничі науки |
9 |
34·19/65 |
9,94 |
-0,94 |
0,88 |
0,09 |
Дівчата-гуманітарні науки |
15 |
34·18/65 |
9,42 |
5,58 |
31,19 |
3,31 |
|
|
|
|
|
|
10,23 |
Як і в попередньому випадку, емпіричний показник розраховується за формулою:
Визначаємо ступінь свободи. Для таблиці крос-табуляції з числом рядків, від двох і більше, формула виглядає дещо іншою ніж в попередніх випадках:
df=(k–1)(c–1)
df=(2–1)(3–1)=2
де k – кількість розрядів ознаки (рядків в таблиці емпіричних частот)
с – кількість розподілів для порівняння (стовпчиків в таблиці емпіричних частот)
За допомогою таблиці критичних значень порівнюємо отримане емпіричне значення з критичним (Табл. 4.6).
df |
p=0,05 |
p=0,01 |
2 |
5,991 |
9,210 |
Будуємо «вісь значимості»
Емпіричне значення (χ2емп=10,22) в необхідному рядку знаходиться правіше значення 9,210, відповідного р=0,01. Тобто р-рівень менше 0,01. Таким чином, емпіричне значення перевищує необхідне критичне для рівня р <0,01 (висока статистична значимість): χ2емп ˃ χ2кр. (р≤0,01) приймаємо Н1. Ми довели залежність переваги у виборі профілю подальшого навчання від статі респондента на рівні високої статистичної значущості. Таким чином, представники різних статей значно частіше бажають різні напрями навчання.
Особливі випадки використання критерію (поправка на неперервність).
Іноді потрібно перетворення «великих» таблиць кростабуляціі в чотирьох клітинні (тобто з 4 полями). Ця процедура потрібна при роботі з спрямованими гіпотезами (приклад наведено нижче) або для обчислення коефіцієнтів кореляції (приклади наведено в наступному розділі). Отже, ми встановили, що представники різних статей частіше надають перевагу різним напрямам навчання. А чи можна припустити, що для юнаків більш типовим є вибір математичного профілю навчання або для дівчат - гуманітарного? Для цього буде потрібно «здавити» вихідну таблицю і перетворити її в 4-клітинну. І сформулювати спрямовані статистичні гіпотези. Виникає питання: якими з двох стовпчиків слід пожертвувати для їх об'єднання? Очевидно, тими, де різниця між «чоловічими» і «жіночими» частотами менша.
|
математика |
Природні науки |
Гуманітарні науки |
Юнаки |
18 |
10 |
3 |
Дівчата |
10 |
9 |
15 |
Різниця частот |
8 |
9 |
12 |
Перетворена таблиця після підрахунку сум частот набуває наступного вигляду:
|
Математика+природничі науки |
Гуманітарні науки |
Ʃ |
Юнаки |
28 |
3 |
31 |
Дівчата |
19 |
15 |
34 |
Ʃ |
47 |
18 |
65 |
Тепер ми можемо сформулювати спрямовані гіпотези .
Н0: частота вибору дівчатами гуманітарного профілю навчання значуще не перевершує частоту вибору юнаками математичного і природничо-наукового профілю.
Н1: частота вибору дівчатами гуманітарного профілю навчання значимо перевершує частоту вибору юнаками математичного і природничо-наукового профілю.
Для чотирьох клітинних таблиць крос-табуляції при підрахунку χ2 потрібно вводити поправку Йєтса на безперервність. Поправка полягає у зменшенні взятої за модулем різниці між емпіричною та теоретичною частотами на 0,5 для кожної клітини таблиці:
В цьому випадку таблиця буде мати наступний вигляд.
fе |
fT |
fT |
fе – fT |
ǀfе – fTǀ-0,5 |
(ǀfе – fTǀ-0,5)2 |
(ǀfе – fTǀ-0,5)2/ fT |
28 |
31·47/65 |
22,42 |
5,58 |
5,08 |
25,85 |
1,15 |
3 |
31·18/65 |
8,68 |
-5,58 |
5,08 |
25,81 |
3,01 |
19 |
34·47/65 |
24,58 |
-5,58 |
5,08 |
25,81 |
1,05 |
15 |
34·18/65 |
9,42 |
5,58 |
5,08 |
25,85 |
2,75 |
|
|
|
|
|
|
7,96 |
Тепер слід порівняти емпіричне значення критерію з критичним, df – 1 (у таблиці 2 х 2 він завжди буде дорівнювати = 1). Відповідні критичні значення наведені в Табл. ІХ.
χ2кр(р≤0,01) = 6,635 χ2емп = 7,96
χ2емп ˃ χ2кр
Альтернативна гіпотеза доведена, дівчата дійсно частіше надають перевагу гуманітарному профілю подальшого навчання. А чи можна зробити припущення про перевагу юнаками математичного профілю? Для цього нам необхідно буде знову переробити початкову таблицю і об'єднати стовпці «Природні науки» та «Гуманітарні науки». Дану задачу студентам пропонується вирішити самостійно.
