Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекції.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.61 Mб
Скачать

Оцінка достовірності відмінностей Класифікація критеріїв

Параметричні критерії

Непараметричні критерії

Визначення ступеню узгодженості змін (кореляція)

r (коефіцієнт кореляції Пірсона)

rs (коефіцієнт кореляції Спірмена)

φ (коефіцієнт фі-кореляції Пірсона)

Порівняння розподілів

Χ2-(критерій відповідності)

Оцінка достовірності відмінностей

t-критерій Стьюдента для незалежних вибірок

U критерій Манна-Уїтні

H-критерій Крускала-уоліса

m біноміальний критерій

χ2-(критерій однорідності)

Оцінка достовірності відмінностей при повторних вимірах

t-критерій Стьюдента для залежних вибірок

T-критерій Вілкоксона

Аналіз змін ознаки. Порівняння дисперсій

F-критерій Фішера

Завдання

Умови

Методи

1. Вияв відмінностей на рівні досліджуваної ознаки

а) 2 вибірки досліджуваних

б) 3 і більше вибірок досліджуваних

Q – критерій Розенбаума;

U – критерій Манна-Уїтні;

φ⃰ – критерій (кутове перетворення Фішера);

S – критерій тенденцій Джонкіра;

H – критерій Крускала-Уоліса.

2. Оцінка зсуву значень досліджуваної ознаки

а) 2 виміри на одній і тій же вибірці досліджуваних

б) 3 та більше вимірів на одній і тій же вибірці досліджуваних

Т – критерій Вілкоксона;

G – критерій знаків;

φ⃰ – критерій (кутове перетворення Фішера);

χr2 – критерій Фрідмана;

L – критерій тенденцій Пейджа.

3. Вияв відмінностей в розподілі ознаки

а) при співставленні емпіричного розподілу з теоретичним

χ2 – критерій Пірсона;

λ – критерій Колмогорова-Смірнова;

m – біноміальний критерій.

4. Вияв ступеню узгодженості змін

(кореляція)

а) двох ознак

б) двох ієрархій або профілей

rsкоефіцієнт рангової кореляції Спірмена.

rsкоефіцієнт рангової кореляції Спірмена.

5. Аналіз змін ознаки під впливом контрольованих умов

а) під впливом одного фактора

б) під впливом двох факторів одночасно

S – критерій тенденцій Джонкіра;

L – критерій тенденцій Пейджа;

однофакторний дисперсійний аналіз Фішера.

двофакторний дисперсійний аналіз Фішера

Непараметричний критерій q Розенбаума

Q-критерій Розенбаума заснований на порівнянні «накладених» один на одного ранжируваних рядів значень двох незалежних змінних. При цьому не аналізується характер розподілу ознаки всередині кожного ряду – в даному випадку має значення лише ширина ділянок, які не перекриваються двох ранжируваних рядів. При порівнянні між собою двох ранжируваних рядів змінних можливі 3 варіанти:

1. Ранжирувані ряди x і y не мають області перекриття, тобто всі значення першого рангового ряду (x) більші всіх значень другого рангового ряду (y):

У даному випадку відмінності між вибірками, що визначаються по будь-якому статистичному критерію, безумовно достовірні, і використання критерію Розенбаума не потрібно. Проте на практиці такий варіант зустрічається виключно рідко.

2. Ранжирувані ряди повністю накладаються один на одного (як правило, один з рядів знаходиться всередині іншого), зони, які не перекриваються, відсутні. У даному випадку критерій Розенбаума непридатний.

3. Мається зона перекриття рядів, а також дві області, які не перекриваються (N1 і N2), що відносяться до різних ранжируваних рядів (позначимо х – ряд, зсунутий у бік великих, y – у бік менших значень):

Даний випадок є типовим для використання критерію Розенбаума, при використанні якого слід дотримуватися таких умов:

1. Обсяг кожної вибірки повинен бути не менше 11.

2. Обсяги вибірок не повинні істотно відрізнятися один від одного. Критерій Q Розенбаума відповідає числу значень, які не перекриваються: Q = N1 + N2. Висновок про достовірність відмінностей між вибірками робиться у випадку, якщо Q > Qкр. При цьому значення Qкр знаходяться в спеціальних таблицях.

Повернемося до нашого завдання. Введемо позначення: х – вибірка дівчат, y – вибірка юнаків. Для кожної вибірки будуємо ранжований ряд:

х: 28 30 34 34 35 36 37 39 40 41 42 42 43 44 45 46

y: 26 28 32 32 33 34 35 38 39 40 41 42 43 44

Підраховуємо число значень в областях ранжируваних рядів, які не перекриваються. В ряду х значення, які не перекриваються є 45 і 46, тобто N1 = 2; в ряду y тільки 1 значення, яке не перекривається 26, тобто N2 = 1. Звідси, Q = N1 + N2 = 1 + 2 = 3. У таблиці знаходимо, що Qкр. = 7 (для рівня значущості р≤0,05) і Qкр = 9 (для рівня значущості р≤0,01).

Висновок: оскільки Q < Qкр, то за критерієм Розенбаума відмінності між вибірками не є статистично достовірними.

Примітка:

Критерій Розенбаума може використовуватися незалежно від характеру розподілу змінних, тобто в даному випадку відпадає необхідність використання критеріїв χ2 Пірсона і λ Колмогорова для визначення типу розподілів в обох вибірках.

U-критерій Манна-Уїтні

Непараметричний U-критерій Манна-Уїтні дозволяє оцінити достовірність відмінностей у незалежних вибірках, якщо дані в них представлені в ранговій шкалі. Цей критерій слід застосовувати і в тому випадку, якщо дані представлені в метричних шкалах, але не вкладаються в криву нормального розподілу. При цьому слід звернути на обмеження у використанні критерію: у кожній вибірці має бути не менше трьох і не більше 60 спостережень.

Обидві вибірки об'єднуються, здійснюється ранжування за принципом «меншому значенню – менший ранг», потім об'єднана вибірка знову розщеплюється, але зі збереженням значень рангів, присвоєних при об'єднаному ранжируванні.

Як приклад пропонується проаналізувати 20 значень з таблиці з метою з'ясувати, чи існують для хлопчиків і дівчаток достовірні відмінності між результатами субтестів на обізнаність.

Формулюються статистичні гіпотези.

Н0: різниця між показниками субтеста обізнаності у хлопчиків і дівчаток статистично не достовірна.

Н1: різниця між показниками субтеста обізнаності у хлопчиків і дівчаток статистично достовірна.

12

10

11

14

12

10

9

14

14

15

13

9

16

14

11

7

13

8

12

14

ж

ж

ч

ж

ж

ж

ч

ж

ж

ж

ж

ч

ж

ж

ч

ж

ч

ж

ч

ч

7

8

9

9

10

10

11

11

12

12

12

13

13

14

14

14

14

14

15

16

ж

ж

ч

ч

ж

ж

ч

ч

ж

ж

ч

ж

ч

ж

ж

ж

ж

ч

ж

ж

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

1

2

3,5

3,5

5,5

5,5

7,5

7,5

10

10

10

12,5

12,5

16

16

16

16

16

19

20

Порахувати рангові суми

Обізнаність ч

Ранг

Обізнаність ж

Ранг

7

1

8

2

9

3,5

9

3,5

10

5,5

10

5,5

11

7,5

11

7,5

12

10

12

10

12

10

13

12,5

13

12,5

14

16

14

16

14

16

14

16

14

16

15

19

16

20

Ʃr=60,5

Ʃr=149,5

Загальна сума рангів: 60,5+149,5=210. Розрахункова сума:

Визначається емпіричне значення критерію за формулою:

де n1 – об’єм першої вибірки;

n2 – об’єм другої вибірки;

Тх – більша з рангових сум;

nх – об’єм групи з більшою сумою рангів.

Згідно з таблицями критичних значень, при n1=13 і n2=7,

Uкp (для р <0,05) = 20 і

Uкр (для р <0,01) = 13.

Критерій Манна-Уїтні відрізняється від більшості інших критеріїв тим, що для спростування нульової гіпотези емпіричне значення повинно бути менше або дорівнює критичного (подібна закономірність типова також для Т-критерію Вілкоксона і критерію знаків G). Тобто використовується наступний принцип: UемпUкp = ˃ Н1!

У нашому випадку Uемп = 32,5. Тобто Uемп > Uкp (р<0,05)=>Н0! Таким чином, наявність достовірних відмінностей між показниками обізнаності у хлопчиків і у дівчаток не встановлено. Якщо необхідно порівняти не два, а більшу кількість розподілів, то в цьому випадку використовується Н-критерій Краскела-Уоллеса.

Н-критерій Краскела-Уоллеса (Kruskal-Wallis)

Н-критерій Краскела-Уоллеса призначається для оцінки відмінностей за будь-яким показником між трьома і більше вибірками. Обмеження у використанні критерію наступне: у кожній з вибірок має бути не менше трьох спостережень (якщо всього два спостереження, то слід застосувати U-критерій).

Як і у випадку з U-критерієм, вибірки об'єднуються, ранжуються за принципом «меншому значенню – менший ранг», потім об'єднана вибірка знову розщеплюється, але значення рангів присвоєних при об'єднаному ранжируванні зберігаються.

Формула критерію виглядає наступним чином:

де R – це суми рангів по групах; k – кількість груп; nk – об’єм груп; n – об’єм об'єднаної вибірки.

де Т – це суми рангів по кожній групі; N – загальна кількість досліджуваних в об’єднаній вибірці; n – кількість досліджуваних в кожній групі.

У разі, коли у нас k ≥ 4, для визначення критичного показника використовується таблиця критичних значень «хі-квадрат», так як при кількості груп більше трьох розподіл H-критерію наближається до розподілу χ2. Якщо k = 3, то слід або взагалі застосувати U-критерій для попарного порівняння, або використовувати таблицю представлену в підручнику Е. В. Сидоренко. Автор публікує таблицю критичних значень H-критерію стосовно до k = 3, містить для кожної комбінації об’ємів груп до 6 градацій рівня значущості.

Ступінь свободи Н-критерію має формулу: df = k – 1.

Постановка завдання: необхідно з'ясувати, чи є достовірні відмінності в ступені стресостійкості у представників чотирьох груп студентів. У педагогічному вузі протестували студентів чотирьох різних факультетів старших курсів навчання за допомогою «Методики визначення стресостійкості та соціальної адаптації» Холмса-Раге. Дані зведені в таблицю.

Факультет

Тестові бали

1

Психолого-педагогічний

228

2

Психолого-педагогічний

211

3

Психолого-педагогічний

239

4

Фізики

194

5

Фізики

220

6

Фізичної культури

150

7

Фізичної культури

155

8

Фізичної культури

192

9

Фізичної культури

181

10

Фізичної культури

166

11

Музики

280

12

Музики

211

13

Музики

235

Наступний етап – ранжування цієї об'єднаної вибірки і її розщеплення на чотири групи.

Фізичної культури

Фізики

Психолого-педагогічний

музики

Бал

Ранг

Бал

Ранг

Бал

Ранг

Бал

Ранг

150

1

155

2

166

3

181

4

192

5

194

6

211

7,5

211

7,5

220

9

228

10

235

11

239

12

280

13

Ʃr1=15

Ʃr2=15

Ʃr3=29,5

Ʃr4=31,5

Загальна сума рангів = 15+15+29,5+31,5 = 91. Розрахункова сума рангів

Обчислюються також об’єми груп:

n1 = 5,

n2 = 2,

n3 = 3,

n4 = 3.

Їх сума говорить про загальну кількість обстежених n = 13.

Потім обчислюється емпіричне значення критерію і ступеню свободи:

df = k–1 = 4–1 =3

Оскільки k=4, для визначення критичного значення критерію використовуємо таблицю розподілу статистики χ2.

χ2кр (р≤0,05) = 7,815

(р≤0,01) = 11,345

Немп = 9,4;

Нкр (для р <0,05) = 7,815;

Немп > Нкр (р <0,05)=˃Н1! Таким чином, на рівні статистичної значущості встановлено наявність достовірних відмінностей між показниками стресостійкості у студентів різних факультетів.

Sкритерій тенденцій Джонкіра

Критерій S призначений для виявлення тенденцій змін ознаки при переході від вибірки до вибірки при співставленні трьох та більше вибірок. Критерій S дозволяє упорядкувати досліджені вибірки за якоюсь ознакою, наприклад, за креативністю, фрустраційною толерантністю, гнучкістю.

Можливі два принципово відмінних варіанти.

  1. Якщо досліджені вибірки, які відрізняються за якісними ознаками (професії, національності, місце роботи), то за допомогою критерію S ми зможемо упорядкувати вибірки за кількісно виміряною ознакою (креативності, фрустраційної толерантності, гнучкості).

  2. Якщо досліджені вибірки, які відрізняються або спеціально згруповані за кількісними ознаками (віком, стажем роботи, соціометричним статусом), то, упорядковуючи їх тепер вже за іншою кількісною ознакою, ми фактично встановлюємо міру зв’язку між двома кількісними ознаками.

Міру зв’язку між кількісно виміряними змінними можна встановити за допомогою вирахування коефіцієнту рангової кореляції або лінійної кореляції. Однак критерій тенденцій S має наступні переваги перед коефіцієнтами кореляції:

а) критерій тенденцій S більш простий в підрахунку;

б) він може застосовуватись в тих випадках, коли одна з ознак варіює у вузькому діапазоні, наприклад, приймаючи всього 3 або 4 значення, в той час як при підрахунку рангової кореляції в цьому випадку ми отримуємо огрублений результат, має потребу в поправці на одинакові ранги.

При упорядкуванні вибірок ми можемо опиратися на середні значення в кожній вибірці або навіть на суми всіх значень в кожній вибірці, тому що в кожній вибірці повинна бути однакова кількість значень. В іншому випадку критерій S не використовується.

Для кожного індивідуального значення підраховується кількість значень праворуч, які перевершують його. Якщо тенденція зростання ознаки зліва на право суттєва, то більша частина значень праворуч повинна бути вищою. Критерій S дозволяє визначити, чи переважають праворуч більш високі значення чи ні. Чим вище емпіричне значення S, тим тенденція зростання ознаки є більш суттєвою.

Звідси, якщо Sемп дорівнює критичному значенню або переважають його, нульова гіпотеза може бути відхилена.

Н0: тенденція збільшення значень ознаки при переході від вибірки до вибірки є випадковою.

Н1: тенденція збільшення значень ознаки при переході від вибірки до вибірки не є випадковою.

Обмеження критерію S

  1. В кожній з вибірок які зіставляються повинна бути однакова кількість спостережень. Якщо не однакова, то потрібно штучно вирівняти вибірки, втративши при цьому частину отриманих спостережень.

Якщо дослідник хоче цього уникнути, то слід скористатися критерієм Н, який дозволяє виявити відмінності між трьома та більше вибірками не вказуючи на напрямок цих відмінностей.

  1. Нижній поріг: не менше 3 вибірок і не менше 2 спостережень в кожній вибірці.

Верхній поріг в існуючих таблицях: не більше6 вибірок і не більше 10 спостережень в кожній вибірці. При більшій кількості вибірок або спостережень в них прийдеться користуватися критерієм Н Крускала-Уоліса.

Приклад. Для з'ясування впливу грошового стимулювання на продуктивність праці чотирьом однорідними групами з п'яти чоловік кожна були запропоновані завдання однакової складності. Завдання пропонувалися кожному досліджуваному незалежно від інших. Групи відрізнялися між собою величиною грошової винагороди за задачу, яка вирішувалась.

Число вирішених задач учасниками кожної групи

Номери досліджуваних

Група 1

Група 2

Група 3

Група 4

1

10

8

12

12

2

11

10

17

15

3

9

16

14

16

4

13

13

9

16

5

7

12

16

19

суми

50

59

68

78

Групи впорядковані за величиною винагороди: від меншої до більшої. Для спрощення розрахунків впорядкуємо значення в кожній групі по їх зростанню і складемо таблицю; графа Si кількість переважаючих значень по групах, розташованим справа.

Номери досліджуваних

Група 1

Група 2

Група 3

Група 4

Інд.знач

Si

Інд.знач

Si

Інд.знач

Si

Інд.знач

Si

1

7

(15)

8

(10)

9

(5)

12

0

2

9

(13)

10

(9)

12

(4)

15

0

3

10

(12)

12

(7)

14

(4)

16

0

4

11

(12)

13

(7)

16

(1)

16

0

5

13

(8)

16

(2)

17

(1)

19

0

суми

60

35

15

0

H0: тенденція зростання кількості вирішених завдань при переході від вибірки до вибірки (зліва направо) є випадковою;

H1: тенденція зростання кількості вирішених завдань при переході від вибірки до вибірки (зліва направо) є невипадковою.

Підрахуємо загальну суму перевищень Si і позначимо її буквою А:

А = 60 +35 +15 = 110.

Для контролю визначимо максимально можливе значення перевищень, яке отримали у разі, якби всі значення праворуч були більше значень зліва, позначимо цю величину В:

де c – кількість стовпчиків (груп);

n – кількість досліджуваних в кожному стовбці (групі).

В даному випадку:

Емпіричне значення критерію S вираховується за формулою:

Sемп = 2А – В,

де А – сума всіх «перевищень» за всіма значеннями;

В – максимально можлива кількість всіх «перебільшень»

В даному випадку:

S = 2(60+35+15) – 150 = 220 – 150 =70

Визначимо критичні значення критерію Sкрит для c = 4, n = 5:

Sкрит = 51 (р≤0,05)

72 (р≤0,01)

Емпіричне значення критерію, рівне 58, потрапило в зону невизначеності, отже, ми вже можемо відкинути гіпотезу H0, але ще не можемо прийняти гіпотезу H1. У подібних випадках остаточний висновок формулює дослідник, ґрунтуючись на особистому досвіді або додаткових даних. У розглянутому прикладі можна сказати, що величина грошової винагороди має випадковий вплив на кількість вирішених завдань.

Слід також враховувати, що даний критерій не встановлює причинно-наслідкові зв'язки, а вивчає пов’язану зміну двох ознак. Можливо вони обидва змінюються під впливом інших загальних факторів, наприклад звички до лідерства або вроджених здібностей.