
- •Завдання для самоконтролю
- •Питання до колоквіуму
- •Тематика рефератів.
- •Тема 1. Основні типи вимірювань і статистичні гіпотези в педагогічних дослідженнях.
- •Тема 2. Порівняння результатів двох залежних вибірок
- •Тема 3. Порівняння результатів двох незалежних вибірок
- •Питання до колоквіуму
- •Тематика рефератів.
- •Критичні значення статистик, які мають розподіл 2 з числом ступенів вільності , для рівня значимості
- •Критичні значення статистики критерію Вілкоксона – Манна - Уітні
Тема 3. Порівняння результатів двох незалежних вибірок
Література
Воловик П.М. Теорія ймовірностей і математична статистика в педагогіці. – К.: Рад. школа, 1969. – 223 с.
Гласс Дж. Статистические методы в педагогике и психологии. – М.: Прогресс, 1976. – 495 с.
Гнеденко Б.В. Хингин А. Я. Элементарное введение в теорию вероятностей. – М.: Наука, 1970. – 168 с.
Грабарь М.И. Исследование факторов, влияющих на результаты педагогических экспериментов. // Советская педагогика. №2. – 1987. – С. 34 – 40.
Грабарь М.И., Краснянская К.А. Применение математической статистики в педагогических исследованиях. Непараметрические методы. – М.: Педагогика, 1977. – 135 с.
Жалдак М.І., Кузьміна Н.М., Берлінська С.Ю. Теорія ймовірностей і математична статистика з елементами інформаційної технології. Навчальний посібник. – К.: Вища школа, 1995. – 351 с.
Кыверялг А.А. Методы исследования в профессиональной педагогике. – Таллин: Валгус, 1980. – 333 с.
Підласий І.П. Діагностика та експертиза педагогічних проектів. Навчальний посібник для студентів вищих навчальних закладів. – К.: Україна, 1998. – 344 с.
Розенберг Н.М. Проблемы измерений в дидактике. – К.: Вища школа, 1979. – 175 с.
Цехмістрова Г.С. Основи наукових досліджень. – К.: «Слово», 2003. – 240 с.
Понятійний апарат
Дані критерію, припущення, гіпотези, статистика критерію, правила прийняття рішень, двосторонній критерій, односторонній критерій, медіанний критерій, критерій Вілкоксона-Манна-Уітні, критерій хі-квадрат, критерій Колмогорова-Смірнова.
Конспект основних питань
Медіанний критерій.
Критерій призначений для виявлення відмінностей в центральних тенденціях стану деякої властивості в двох сукупностях на основі вивчення членів двох незалежних вибірок із цих сукупностей. В даному випадку показником центральної тенденції служить медіана вимірювань розглядуваних властивостей в кожній з вибірок.
Дані критерію. Будемо рахувати, що випадкова змінна Х характеризує стан досліджуваної властивості в одній із розглядуваних сукупностей, а випадкова змінна Y - стан тієї ж властивості в другій сукупності. Нехай існує дві серії спостережень над випадковими величинами Х і Y:
x1
, x2
, . . . , xi
, . . . ,
;
y1
, y2
, . . . , yj
, . . . ,
;
отримані при розгляді двох незалежних вибірок об`єму n1 i n2; xi (і = 1, 2, …, n1) – результати вимірювання деякої властивості у об`єктів першої вибірки, складеної із членів одної сукупності; yj (j = 1, 2, …, n2) – результати вимірювання тієї ж властивості у об`єктів другої вибірки, складеної із членів другої сукупності.
В педагогічних дослідженнях об`єктами вивчення можуть бути вчителі або учні різних, незалежних один від одного груп, класів, шкіл. При цьому xi можна отримати, наприклад, у вигляді балових оцінок за виконання деякої діяльності учнями шкіл одного міста, а yj - у вигляді балових оцінок за виконання тієї ж діяльності учнями шкіл іншого міста. Обидві серії спостережень об`єднують в одну вибірку, об`єм якої рівний n1 + n2 і позначається N. Визначається медіана цієї вибірки m, після чого члени кожної вибірки об`ємів n1 і n2 розподіляються на дві категорії: більше загальної медіани ( m) і менше або рівні загальній медіані ( m). На основі отриманих результатів складається таблиця 22.
|
Вибірка №1 |
Вибірка №2 |
m |
A Число xi , більших m
|
B Число yj , більших m |
m |
C Число xi, менших або рівних m |
D Число yj, менших або рівних m |
Розглянемо
способи визначення медіани при різни
значеннях N.
Медіаною N
вимірювань є таке значення, більше за
яке 50% або
даних вимірювань і менше якого також
50% або
даних вимірювань. Для знаходження
медіани, вимірювання записують в ряд
по зростанню значень. Якщо число
вимірювань N
непарне, то медіана чисельно рівна
значенню утвореного ряду, яке стоїть
точно посередині, або на
місці. Наприклад, медіана п`яти (N=5)
вимірювань: 10,17, 21, 24, 25 – рівна 21 –
значенню, яке стоїть на третьому місці
.
Якщо число вимірювань непарне, то медіана
чисельно дорівнює середньому арифметичному
значень ряду, які стоять посередині,
або на
і
місцях.
Наприклад, медіана восьми вимірювань:
5, 5, 6, 7, 8, 8, 9, 9 – рівна 7,5
- середньому арифметичному значенню
ряду, які стоять на четвертому і п`ятому
місцях.
Припущення. Для використання медіанного критерію необхідне виконання наступних вимог: 1) обидві вибірки є випадковими вибірками із деяких сукупностей; 2) вибірки незалежні, і члени кожної вибірки незалежні між собою; 3) шкали вимірювань не нижче порядкової; 4) число членів в обох вибірках повинне бути в сумі більше 20.
Гіпотези. Припустимо, що закони розподілу випадкових змінних Х і Y однакові. Тоді виконується і наступна рівність: медіана значень xi рівна медіані значень yj . Справедливість цієї рівності і перевіряється з допомогою медіанного критерію. Таким чином, нульова гіпотеза має вид: Н0 : обидві сукупності, з яких взяті вибірки мають одну і ту ж медіану. В якості альтернативної гіпотези вибирається гіпотеза Н1 : сукупності мають різні медіани Якщо гіпотеза Н1 справедлива, то звідси слідує, що закони розподілу розглядуваної властивості різні в сукупностях, із яких взято вибірки, тобто стан досліджуваної властивості в розглядуваних сукупностях суттєво відмінні.
Статистика критерію. Для перевірки гіпотез з допомогою медіанного критерію на основі спостережень, записаних у формі таблиці 22 підраховується статистика критерію Т за формулою:
3.3
Правило прийняття рішень. Замість точного розподілу статистики Т використовується наближений, а саме для достатньо великих значень n1 і n2 розподіл величини Т апроксимується достатньо точно розподілом 2 з однією ступінню вільності. Критичні значення Т для різних рівнів значимості даються в таблиці Г. Гіпотеза Н0 відхиляється на даному рівні значимості , якщо спостережуване значення Т х, де х - квантиль розподілу 2, який визначається за таблицею Г для вибраного .
Не рекомендується використовувати медіанний критерій для перевірки гіпотез, якщо 20 n1 + n2 20 і хоча б одне із значень A, B, C, D, записаних у таблиці 22, менше 5. Не рекомендується також використовувати медіанний критерій, якщо біля середини ряду, складеного із впорядкованих по зростанню значень обох вибірок, буде розміщено значне число однакових значень, які належать обом вибіркам.
Приклади використання критерію. Проводилась перевірка засвоєння деякого фізичного закону учнями випускних класів. При цьому використовувалась нова методика перевірки знань по фізиці, згідно якій, об`єктивна оцінка знань учнів по деякому розділу програми може бути отримана, якщо засвоєння програми перевірялось на різних рівнях. Таких рівнів виділено чотири: фактичний (знання фактів), операційний (здійснення дій або логічних операцій за зразком), аналітико-синтетичний (визначення зв`язків, знаходження аналогій між окремим поняттям, розділами тем, виділення окремих ідей) і творчий (переніс знань в нові ситуації, створення оригінальних алгоритмів пізнавальної і практичної діяльності). Для перевірки фізичного закону автор пропонував чотири питання, з яких кожне спрямоване на перевірку знання на одному з цих рівнів. Порядкову шкалу оцінки правильної відповіді автор будує з врахуванням відсотків вірних відповідей на дані питання учнів сукупності. Оцінка відсотків вірних відповідей на питання кожного з рівнів проводилась на основі результатів перевірки знань 11000 учнів.
З`ясувалось, що відсоток вірних відповідей серед випускників різних по географічному розміщенні шкіл країни на питання, які перевіряють засвоєння основних понять і розділів курсу фізики на фактичному рівні стійко коливається на рівні 70, на операційному рівні – біля 50, на аналітико-синтетичному рівні – біля 40, на творчому рівні – біля 33. У відповідності до отриманих результатів було вирішено правильну відповідь на питання першого рівня оцінювати 1 балом, другого рівня – 2 балами, третього рівня – 3 балами, правильна відповідь на питання четвертого рівня – чотирма балами.
Контрольну роботу, яка складалась із чотирьох питань, які перевіряють засвоєння деякого фізичного закону на чотирьох рівнях писали 42 учня із чотирьох сільських шкіл і 40 учнів чотирьох міських шкіл. Роботи декількох учнів за різними причинами (стан здоров`я, незрозумілі записи відповідей і ін.) не враховувались при отриманні кінцевих результатів. Тому об`єм вибірки для сільських шкіл виявився рівним 41, а об`єм вибірки для міських шкіл – 36 учнів. При правильних відповідях на всі чотири питання учень отримував 10 балів (4+3+2+1=10), при всіх неправильних – 0. Таким чином результати виконання роботи учнями, виражені в числі балів, розподілились від 0 до 10. Ряди розподілу учнів кожної вибірки по кількості балів, отриманих за виконання роботи, використовувались в якості показників засвоєння учнями сільських і міських шкіл.
Таблиця 3.14
Число балів |
Абсолютна частота в першій вибірці f1 |
Абсолютна частота в другій вибірці f2 |
f =f1 + f2 |
Накопичена частота, f |
10 |
1 |
- |
1 |
77 |
9 |
- |
2 |
2 |
76 |
8 |
5 |
- |
5 |
74 |
7 |
3 |
2 |
5 |
69 |
6 |
7 |
4 |
11 |
64 |
5 |
3 |
7 |
10 |
53 |
4 |
2 |
3 |
5 |
43 |
3 |
8 |
10 |
18 |
38 |
2 |
3 |
4 |
7 |
20 |
1 |
4 |
6 |
10 |
13 |
0 |
- |
3 |
3 |
3 |
n1 = 36 n2 = 41 N = 77 |
Запишемо результати учнів обох вибірок у формі таблиці, зручної для підрахунку медіани.
Число
учнів в обох вибірках N
рівне
77 – число непарне. Значить, медіана
чисельно дорівнює значенню, яке стоїть
на
місці. У впорядкованому ряду вимірювань,
складеному за результатами обох вибірок,
це значення рівне 4. Використовуючи дані
1-го і 2-го стовпців таблиці 3.14, розподілимо
значення обох вибірок на дві категорії:
більше медіани (4)
і менше або рівне медіані (4).
Отримані результати запишемо у формі
таблиці 22.
-
Вибірка №1
Вибірка №2
4
19
15
34
4
17
26
43
36
41
41
Перевіряється гіпотеза Н0 : медіани розподілу учнів за числом балів, отриманих за виконання роботи, однакові в сукупностях учнів міських і сільських шкіл, тобто m1=m2. Альтернативна гіпотеза Н1 : m1m2. Значення статистики медіанного критерію знаходимо за формулою 3.3, використовуючи дані таблиці 22:
Для рівня значимості =0,05 і однієї ступені вільності по таблиці Г знаходимо Ткритич=3,84. Значить справедлива нерівність Ткритич Тспостер (3,841,43). Тому, згідно правилу прийняття рішень медіанного критерію у нас нема достатніх підстав для відхилення нульової гіпотези Н0, тобто нема достатніх підстав рахувати різними медіани розподілу учнів обох сукупностей за числом балів за виконання роботи, яка перевіряє рівень засвоєння фізичного закону, а значить, рахувати різними рівні засвоєння даного закону учнями сільських і міських шкіл.
Критерій Вілкоксона – Манна - Уітні.
Критерій призначений для вияву відмінностей в розподілі розглядуваної величини у об`єктів двох сукупностей на основі порівняння результатів вивчення даної властивості у членів незалежних вибірок, зроблених із цих сукупностей. Використання критерію дозволяє перевірити припущення про відмінність центральних тенденцій стану досліджуваних властивостей в сукупностях. В якості показників центральних тенденцій розглядаються медіана і середнє значення. Таким чином з допомогою даного критерію перевіряється одночасно припущення про відмінність медіан, а також середніх значень в розглядуваних сукупностях. Слід мати на увазі, що відмінність медіан або середніх значень свідчить про наявність тенденції членів першої сукупності переважати (бути меншими) по стану досліджуваної величини членів другої сукупності. Використання критерію засновано на використанні рангів, приписаних впорядкованим об`єктам обох вибірок. Впорядкування об`єктів можливе лише в тому випадку, коли шкала вимірювань досліджуваної властивості не нижче порядкової.
Дані критерію. Будемо рахувати, що випадкова зміна Х характеризує стан досліджуваної властивості в одній із розглядуваних сукупностей, а випадкова змінна Y - стан тієї ж властивості в другій сукупності. Нехай існує дві серії спостережень над випадковими величинами Х і Y:
x1 , x2 , . . . , xi , . . . , ;
y1 , y2 , . . . , yj , . . . , ;
отримані при розгляді двох незалежних вибірок об`єму n1 i n2; xi (і = 1, 2, …, n1) – результати вимірювання деякої властивості у об`єктів першої вибірки, складеної із членів одної сукупності; yj (j = 1, 2, …, n2) – результати вимірювання тієї ж властивості у об`єктів другої вибірки. Обидві серії спостережень об`єднують в одну вибірку, об`єм якої якої рівний n1 +n2 і позначається N. Члени цієї вибірки записують в ряд по зростанню значень. Після чого кожному члену даного ряду приписується деяке число, яке називається рангом. Члену ряду, який стоїть на першому від початку місці, приписується число 1, на другому місці – число 2 і т. д. Таким чином, ранг члена ряду чисельно рівний номеру місця, яке займає даний член в цьому ряді. Ранг останнього члена ряду буде рівний N (N=n1 +n2 ). Якщо декілька членів ряду, які стоять один за одним, мають одне і теж значення, то кожному із них приписується один і той же ранг, рівний середньому арифметичному номерів місць, на яких стоять ці члени. Дальше знаходять суму рангів, приписаних членам вибірки меншого об`єму.
Припущення. Використання критерію Вілкоксона – Манна – Уітні для перевірки гіпотез можливе при виконанні наступних вимог: 1) обидві вибірки випадкові; 2) вибірки незалежні, і члени кожної вибірки також незалежні між собою; 3) досліджувана властивість об`єктів розподілена неперервно в обох сукупностях, із яких зроблені вибірки; 4) шкала вимірювань не нижче порядкової.
Гіпотези.
Припустимо,
що закони розподілу випадкових величин
Х
і
Y
в обох сукупностях однакові. При цій
умові буде справедлива рівність:
,
тобто з однаковою ймовірністю, рівною
0,5
значення змінної Х
в
першій сукупності будуть більші або
менші значень змінної Y
у другій сукупності. Справедливість
даної рівності і перевіряється за
допомогою критерію Вілкоксона – Манна
– Уітні. Двосторонній критерій дозволяє
перевірити нульову гіпотезу Н0:
- при альтернативній гіпотезі Н1:
.
Якщо гіпотеза Н1
істинна, то із цього випливає, що закони
розподілу
Х і
Y
відмінні в обох сукупностях, тобто різні
стани досліджуваної властивості в
об`єктів першої і другої сукупності.
Критерій також застосовний для перевірки
гіпотез відносно медіан досліджуваних
випадкові величини Х
і
Y.
Нульова гіпотеза має вид Н0:
медіана
(Х) = медіані (Y).
Якщо існують середні значення змінних
Х
і
Y
то критерій може використовуватись для
перевірки гіпотез відносно середніх
значень досліджуваних величин Х
і
Y.
Статистика критерію. Підраховується сума рангів, приписаних членам однієї з вибірок. Зазвичай перевага надається вибірці з меншим об`ємом. Позначимо суму рангів, приписаних членам цієї вибірки, через S. Тоді
(3.4.2.1)
де R(xi) – ранг, приписаний i – му об`єкту даної вибірки; n1, n2 – об`єми вибірок, а n – рівне мінімальному із значень n1 і n2. Для перевірки гіпотез з допомогою критерію Вілкоксона – Манна – Уітні підраховується значення статистики критерію Т за наступною формулою:
(3.4.2.2)
Правило прийняття рішень. Нехай об`єми вибірок рівні n1 і n2 і - прийнятий рівень значимості. Розглянемо правила прийняття рішень при перевірці різних гіпотез.
а).
Двосторонній
критерій.
Проводиться перевірка гіпотези Н0:
- при альтернативі Н1:
.
Для n1
20
і n2
20
складена табл. Д
(див. додатки) критичних значень статистики
Т
для різних значень .
В даній роботі в табл. Д
W
- критичні значення статистики Т
– дані для = 0,02;
= 0,05;
= 0,10;
= 0,20
при 5
n1
20
і 5
n2
20.
При
даних значеннях
n1
і n2
Н0
відхиляється на рівні ,
якщо для спостережуваного значення Т
справедлива
одна із нерівностей Т
або Т
;
визначається по таблиці Д,
а значення
можна
знайти з формули:
. (3.4.2.3)
Якщо хоча б одне із значень n1 і n2 більше 20, то критичне значення статистики Т знаходимо за формулою
(3.4.2.4)
де
-
квантиль нормального розподілу. Вкажемо
значення
для
деяких значень :
для =0,01
=2,58;
=0,05
=1,96;
=0,10
=1,64.
Нульова гіпотеза Н0
відхиляється на рівні ,
якщо для спостережуваного значення
статистики критерію Т
справедлива
одна із нерівностей Т
або
Т
.
б). Односторонній критерій. При наявності достатніх підстав для припущення про те, що значення змінної Х мають тенденцію в середньому переважати (бути меншими) значення змінної Y, для перевірки гіпотез замість двостороннього критерію використовують односторонній.
1).
Для випадку, коли припускається, що
значення Х
в середньому більші значень Y,
проводиться перевірка нульової гіпотези
Н0:
- при альтернативі Н1:
.
Критичні значення статистики критерію
визначаються по тій же таблиці Д,
що і для двостороннього критерію. Н0
відхиляється на рівні значимості ,
якщо спостережуване значення Т
(
,
а
визначається по таблиці Д
для даних значень
n1,
n2,
).
2).
В тому випадку, коли припускається, що
значення Х
в середньому менші значень Y,
проводиться перевірка нульової гіпотези
Н0:
- при альтернативі Н1:
.
Нульова гіпотеза Н0
відхиляється на рівні значимості ,
якщо спостережуване значення Т
менше
(
визначається по таблиці Д
для даних значень
n1,
n2,
).
Якщо хоча б одне із значень n1 і n2 більше 20, то критичне значення статистики критерію Т визначається за формулою:
(3.4.2.5)
де
-
квантиль нормального розподілу. Вкажемо
значення
для деяких значень :
для =0,01
=2,33;
=0,05
=1,64;
=0,10
=1,28.
При використанні критерію передбачається, що обидві змінні Х і Y мають неперервний розподіл.
Приклад використання критерію. Проводилась перевірка засвоєння теми “Постійний електричний струм” в учнів 8-х експериментальних класів (ЗОШ №6 м. Рівне) і 8-х контрольних класів (Рівненський природничо-математичний ліцей), які вивчали фізику за поглибленою програмою. Завдання для перевірки засвоєння даної теми складались з 11 номерів. Перші 6 номерів завдання оцінювались у 2 бали, наступні 5 – у три бали. Тобто, кожен учень за правильно виконане завдання мав змогу отримати максимальну оцінку 27 балів. Виходячи з попереднього досвіду використання даних завдань учням було запропоновано за урок розв`язати номери 2-х варіантів даного завдання. Таким чином, максимальна кількість балів, яку мав змогу отримати кожен учень за урок, становила 54 бали. Після виконання роботи з учнів ЗОШ №6 м. Рівне і Рівненського природничо-математичного ліцею методом випадкового відбору були сформовані 2 вибірки кількістю 35 чоловік кожна. Відповіді учнів обох вибірок об`ємом n1 = 35, n2 =35 були оцінені наступними баловими оцінками, які запишемо за зростанням балів окремо для першої і другої вибірок:
Вибірка №1 (n1 = 35): 22; 24; 25; 25; 26; 27; 27; 29; 29; 29; 30; 32; 32; 33; 34; 34; 36; 38; 40; 40; 41; 41; 41; 42; 42; 43; 45; 45; 47; 48; 51; 54; 54; 54; 54.
Вибірка №2 (n2 = 35): 13; 15; 16; 18; 20; 20; 22; 24; 24; 25; 26; 26; 26; 27; 28; 28; 30; 30; 31; 31; 32; 33; 33; 35; 37; 37; 38; 40; 40; 41; 45; 46; 47; 47; 50.
На основі порівняння результатів виконання роботи учнями обох вибірок передбачалось перевірити гіпотезу про відсутність різниці у стані знань з теми “Постійний електричний струм” в учнів ЗОШ №6 м. Рівне (які навчаються за експериментальною методикою) і учнів Рівненського природничо-математичного ліцею (які навчаються з використанням традиційних методів). В умовах проведеного експерименту можливе використання критерію Вілкоксона – Манна – Уітні і медіанного критерію для перевірки даної гіпотези.
Таблиця 3.15
Таблиця для критерію Вілкоксона – Манна - Уітні
№ |
хі |
yi |
R |
№ |
хі |
Yi |
R |
1 |
|
13 |
1 |
36 |
|
33 |
36 |
2 |
|
15 |
2 |
37 |
33 |
|
36 |
3 |
|
16 |
3 |
38 |
34 |
|
38,5 |
4 |
|
18 |
4 |
39 |
34 |
|
38,5 |
5 |
|
20 |
5,5 |
40 |
|
35 |
40 |
6 |
|
20 |
5,5 |
41 |
36 |
|
41 |
7 |
|
22 |
7,5 |
42 |
|
37 |
42,5 |
8 |
22 |
|
7,5 |
43 |
|
37 |
42,5 |
9 |
|
24 |
10 |
44 |
|
38 |
44,5 |
10 |
|
24 |
10 |
45 |
40 |
|
44,5 |
11 |
24 |
|
10 |
46 |
|
40 |
47,5 |
12 |
|
25 |
13 |
47 |
|
40 |
47,5 |
13 |
25 |
|
13 |
48 |
40 |
|
47,5 |
14 |
25 |
|
13 |
49 |
40 |
|
47,5 |
15 |
|
26 |
16,5 |
50 |
|
41 |
51,5 |
16 |
|
26 |
16,5 |
51 |
41 |
|
51,5 |
17 |
|
26 |
16,5 |
52 |
41 |
|
51,5 |
18 |
26 |
|
16,5 |
53 |
41 |
|
51,5 |
19 |
|
27 |
20 |
54 |
42 |
|
54,5 |
20 |
27 |
|
20 |
55 |
42 |
|
54,5 |
21 |
27 |
|
20 |
56 |
43 |
|
56 |
22 |
|
28 |
22,5 |
57 |
|
45 |
58 |
23 |
|
28 |
22,5 |
58 |
45 |
|
58 |
24 |
29 |
|
25 |
59 |
45 |
|
58 |
25 |
29 |
|
25 |
60 |
|
46 |
60 |
26 |
29 |
|
25 |
61 |
|
47 |
62 |
27 |
|
30 |
28 |
62 |
|
47 |
62 |
28 |
|
30 |
28 |
63 |
47 |
|
62 |
29 |
30 |
|
28 |
64 |
48 |
|
64 |
30 |
|
31 |
30,5 |
65 |
|
50 |
65 |
31 |
|
31 |
30,5 |
66 |
51 |
|
66 |
32 |
|
32 |
33 |
67 |
54 |
|
68,5 |
33 |
32 |
|
33 |
68 |
54 |
|
68,5 |
34 |
32 |
|
33 |
69 |
54 |
|
68,5 |
35 |
|
33 |
36 |
70 |
54 |
|
68,5 |
Слід віддати перевагу першому з критеріїв, оскільки він дозволяє більш точно дослідити явище, що вивчалось. Його використання дозволяє виявити в даному випадку різницю медіан розподілу балових оцінок в учнів двох шкіл, якщо така різниця має місце, а також установити, учні якої з шкіл одержують за середнім значенням більш високі оцінки. Нехай випадкова змінна Х – це кількість балів, отриманих учнем першої вибірки, а випадкова змінна Y - кількість балів, отриманих учнем другої вибірки. Об`єм першої і другої вибірки дорівнює 35; тобто будемо мати 35 значень хі (і=1, 2, …, 35) і 35 значень yj (j = 1, 2, …, 35). Об`єднаємо всі значення Х і Y в одну групу об`єктів N = 70, запишемо їх у ряд за зростанням значень і рангуємо їх – надамо кожному значенню Х і Y ранг R, який дорівнює номеру місця, яке дане значення посідає у цьому ряді.
Використовувався двосторонній критерій Вілкоксона – Манна – Уітні, тобто перевірялась гіпотеза Н0: - за альтернативи Н1: . Гіпотеза Н0 передбачає, що оцінки учнів експериментальних класів з однаковою ймовірністю (яка дорівнює 0,5) статистично перевищують, чи є меншими за оцінки учнів контрольних класів, тобто оцінки учнів експериментальних класів за середнім значенням не більші і не менші від оцінок учнів контрольних класів.
Знаходимо
суму рангів, наданих членам другої
вибірки
Підраховуємо статистику критерію Т1:
Об`єми вибірок більші за 20, тому критичне значення статистики критерію Т1 знаходимо за формулою:
Таким
чином виконується нерівність Тспост
(390779).
Згідно з правилом прийняття рішення,
під час використання двостороннього
критерію нульова гіпотеза Н0
відхиляється на рівні =0,05
і приймається альтернативна гіпотеза
Н1.
Прийняття цієї гіпотези показує, що
аналіз експериментальних даних дозволяє
зробити висновок про різницю законів
розподілення змінних Х
і Y
або про різницю у стані знань, які
перевірялись даною роботою в учнів
експериментальних і контрольних класів.
Маємо
достатні підстави використати
односторонній критерій Вілкоксона –
Манна – Уітні для перевірки нульової
гіпотези Н0:
- при альтернативі Н1:
.
Критичне значення статистики для =0,05,
х=1,64:
.
.
Т2=834.
Так
як Тспост
(834473),
можна зробити висновок про можливість
відхилення нульової гіпотези Н0
і
прийняття альтернативної гіпотези Н1,
що дозволяє стверджувати, що результати
виконання роботи учнями експериментальних
класів мають тенденцію бути статистично
більш високими за результати виконання
роботи учнями контрольних класів.
Критерій 2 (хі-квадрат).
Критерій 2 використовується для порівняння розподілу об`єктів двох сукупностей по стану деякої властивості на основі вимірювань по шкалі найменувань цієї властивості в двох незалежних вибірках із розглядуваних сукупностей.
Дані критерію. Нехай існує дві вибірки із двох сукупностей об`ємом n1 і n2 відповідно. Припустимо, що стан досліджуваної властивості (наприклад виконання певного завдання) вимірюється у кожного об`єкта по шкалі найменувань, яка має лише дві взаємовиключні категорії (наприклад: виконано вірно, виконано невірно). По результатам вимірювання стану досліджуваної властивості у об`єктів двох вибірок складається чотирьох кліткова таблиця 22.
|
Категорія 1 |
Категорія 2 |
|
Вибірка №1 |
О11
|
О12 |
О11 +О12 |
Вибірка №2 |
О21 |
О22 |
О21 +О22 |
|
О11+ О21 |
О12 +О22 |
n1+n2=N |
В цій таблиці О11 – число об`єктів першої вибірки, які потрапили в першу категорію за станом досліджуваної властивості; О12 – число об`єктів першої вибірки, які потрапили в другу категорію; О21 – число об`єктів другої вибірки, які потрапили в першу категорію; О22 – число об`єктів другої вибірки, які потрапили в другу категорію; N – загальне число спостережень, яке рівне О11+ О21 +О12 +О22 або n1+n2.
Припущення. Для використання критерію необхідно виконання наступних вимог: 1) обидві вибірки випадкові; 2) вибірки незалежні, і члени кожної вибірки також незалежні між собою; 3) шкала вимірювань може бути самою простою шкалою найменувань з двома категоріями.
Гіпотези. Імовірність того, що випадково вибраний із першої сукупності об`єкт буде належати першій категорії шкали вимірювань досліджуваної властивості, позначимо р1. Імовірність тієї ж події у другій сукупності позначимо р2. Тоді на основі даних таблиці 22 можна перевірити нульову гіпотезу про рівність ймовірностей потрапляння об`єктів першої і другої сукупностей в першу (другу) категорію шкали вимірювання досліджуваної властивості, наприклад гіпотезу про рівність ймовірностей вірного виконання завдань учнями контрольних і експериментальних класів. Для двостороннього критерію нульова гіпотеза буде мати вид Н0: р1 =р2, а альтернативна гіпотеза Н1: р1 р2. Для одностороннього критерію нульова гіпотеза прийме вигляд Н0: р1р2, а альтернативна гіпотеза Н1: р1 р2. При перевірці нульових гіпотез не обов`язково, щоб значення ймовірностей р1 і р2 були відомі, оскільки гіпотези лише встановлюють між ними деякі зв`язки (рівність, більше або менше). При використанні одностороннього критерію будь яка сукупність може бути позначена першою, тому гіпотеза виду Н0: р1 р2 спеціально не розглядається, оскільки може бути замінена гіпотезою Н0: р1 р2.
Статистика
критерію.
Для перевірки розглянутих вище гіпотез
за даними таблиці 22
підраховується значення статистики
критерію Т
(в
літературі з математичної статистики
для позначення величини Т
використовується також символ 2)
за формулою:
(3.4.3.1)
де
О
– спостережувані частоти, Е
– очікувані частоти потрапляння об`єктів
вибірки в першу або другу категорію
шкали найменувань, за якою проводиться
вимірювання досліджуваної властивості,
знак
означає суму чотирьох складових, які
відповідають частотам, що стоять в
чотирьох клітках таблиці 22.
Спостережувані частоти позначені О11,
О21,О12,О22
і розміщені в клітках таблиці 22.
Для кожної з цих спостережуваних частот
Оij
визначається очікувана частота по
формулі:
.
Так,
наприклад, для частоти О11
значення очікуваної частоти Е11
підраховується за формулою:
Для спрощення підрахунків значень
статистики критерію формулу (3.4.3.1) легко
перетворити до вигляду:
(3.4.3.2)
де n1, n2 – об`єми вибірок, N = n1+n2 - загальне число спостережень.
Правило прийняття рішень. Через велику кількість комбінацій можливих значень величин О11, О21,О12,О22 важко скласти таблицю значень точного розподілу статистики Т з метою перевірки справедливості нульової гіпотези. Однак розподіл статистики Т з достатньою точністю можна апроксимувати розподілом 2 з однією ступінню вільності (=1).
а). Двосторонній критерій. Проводиться перевірка гіпотези Н0: р1 =р2, при альтернативі Н1: р1 р2. Нехай - прийнятий рівень значимості. Тоді значення статистики Т, отримане на основі спостережень, порівнюється з критичним значенням статистики Т – х1-, яке визначається з “таблиці 2 з однією ступінню вільності” із врахуванням вибраного значення . Якщо спостережуване значення Т більше критичного, то нульова гіпотеза відхиляється на рівні значимості і приймається альтернативна гіпотеза. В протилежному випадку у нас немає достатніх підстав для відхилення нульової гіпотези.
б). Односторонній критерій. При наявності достатніх підстав для припущення про те, що ймовірність потрапляння об`єктів першої (другої) сукупності в першу (другу) категорію шкали вимірювання досліджуваної властивості більша (менша), ніж в другій сукупності, замість двохстороннього критерію використовується односторонній. Проводиться перевірка гіпотези Н0: р1 р2, при альтернативі Н1: р1 р2. Нехай - прийнятий рівень значимості. Тоді значення статистики Т, отримане на основі експериментальних даних, порівнюється з критичним значенням статистики х1-2, яке визначається з “таблиці 2 з однією ступінню вільності” із врахуванням вибраного значення . Якщо справджується нерівність Т х1-2, то нульова гіпотеза відхиляється на рівні значимості і приймається альтернативна гіпотеза. Якщо дана нерівність не виконується, то у нас немає достатніх підстав для відхилення нульової гіпотези. У зв`язку з тим, що заміна точного розподілу статистики Т розподілом 2 з однією ступінню вільності дає достатньо точне наближення лише для великих вибірок, використання критерію обмежено деякими умовами. Критерій не рекомендується використовувати, якщо 1) сума об`ємів двох вибірок (N = n1+n2) менше 20; 2) хоча б одна із абсолютних частот (О11, О21,О12,О22) в таблиці 22, складеної на основі експериментальних даних, менше 5. Деякі дослідники другу умову замінюють наступною: хоча б одна із очікуваних частот менше 5. Нажаль, обидва ці правила сформульовані на основі експериментальних досліджень і не мають строгих доведень. Якщо хоча б одна із абсолютних частот має значення, яке міститься в межах від 5 до 10, то використання критерію можливе при внесенні деяких змін у формулу підрахунку значення статистики критерію.
(3.4.3.3)
Використання критерію хі-квадрат можливе і в тому випадку, коли об`єкти двох вибірок із двох сукупностей по стану досліджуваної властивості розподіляються більш як на дві категорії.
Дані. Із двох сукупностей зроблені вибірки об`ємом n1 і n2. Результати вимірювання стану досліджуваної властивості у об`єктів кожної вибірки розподіляються на С категорій. На основі цих даних будується таблиця 2 С, в якій два ряди (за числом розглядуваних сукупностей) і С колонок (за числом відмінних категорій стану досліджуваної властивості).
|
Категорія 1 |
Категорія 2 |
. . . |
Категорія і |
. . . |
Категорія С |
|
Вибірка №1 |
О11 |
О12 |
. . . |
О1і |
. . . |
О1С |
N1 |
Вибірка №2 |
О21 |
О22 |
. . . |
О2і |
. . . |
О2С |
N2 |
|
О11+ О21 |
О12+ О22 |
|
О1і + О2і |
|
О1С + О2С |
N=n1+n2 |
Припущення. Для використання критерію необхідно виконання наступних умов: 1) обидві вибірки випадкові; 2) вибірки незалежні; 3) шкала вимірювань може бути не вище шкали найменувань з декількома (С) категоріями.
Гіпотези. Імовірність того, що випадково вибраний з першої сукупності об`єкт буде належати і-тій категорії шкали вимірювання досліджуваної властивості (і = 1, 2, . . ., С), позначимо р1і (і = 1, 2, . . ., С). Тоді на основі даних таблиці 2С можна перевірити нульову гіпотезу про рівність ймовірності потрапляння об`єктів першої і другої сукупності в кожну із і (і = 1, 2, . . ., С) категорій, тобто перевірити виконання всіх наступних рівностей: р11 =р21, р12=р22, . . . , р1і =р2і , . . . , р1С =р2С. Можлива, наприклад, перевірка гіпотези про рівність ймовірностей отримання оцінок “5”, “4”, “3”, “2” за виконання учнями контрольних і експериментальних класів деякого завдання. Таким чином, нульова гіпотеза буде мати вид Н0: р1і = р2і для всіх С категорій, при альтернативі Н1: р1і р2і хоча б для однієї із С категорій. Для перевірки даної гіпотези можна і не знати значення ймовірностей р1і і р2і (і = 1, 2, . . ., С), оскільки гіпотеза лише встановлює між ними відношення рівності або відмінності.
Статистика критерію. Для перевірки розглянутої вище нульової гіпотези з допомогою критерію 2 на основі даних таблиці 2С підраховується значення статистики критерію Т за наступною формулою:
(3.4.3.4)
де n1, n2 – об`єми вибірок. Формула (3.4.3.4) отримана із загальної формули (3.4.3.1) і дозволяє спростити обрахунок значення статистики критерію. Через велику кількість комбінацій можливих значень О1і,і О2і (і = 1, 2, . . ., С), важко скласти таблицю значень точного розподілу статистики Т. Однак розподіл статистики Т можна апроксимувати розподілом 2 з (С-1) ступінню вільності (=С-1).
Правило прийняття рішень. Нехай - прийнятий рівень значимості. Тоді значення Т, отримане на основі експериментальних даних, порівнюється з критичним значенням х1-, яке визначається з “таблиці 2 з С-1 ступінню вільності” з врахуванням вибраного значення . При виконанні нерівності Т х1- нульова гіпотеза відхиляється на рівні значимості і приймається альтернативна гіпотеза. Це означає, що розподіл об`єктів на С категорій по стану досліджуваної властивості відмінне в двох розглядуваних сукупностях. Якщо виконується нерівність Т х1-, то у нас немає достатніх підстав для відхилення нульової гіпотези, тобто немає достатніх підстав рахувати, що стан досліджуваної властивості відмінні в обох сукупностях.
Приклади. Перевірялась результативність складання екзамену з фізики у 9-х класах кількох шкіл міста Рівне (ЗОШ №6, ЗОШ №13, РПМЛ). Частина класів в усіх школах навчалась за програмою спеціалізованих класів з поглибленим вивченням фізики, а частина – за експериментальною методикою. За нашим проханням учителі-екзаменатори оцінювали окремо друге питання білетів у тих учнів, які мали виконати лабораторну роботу. Методом випадкового відбору з учнів, які навчались за експериментальною методикою було складено вибірку об`ємом 80 учнів (n1=80), із учнів, які навчались за програмою для спеціалізованих класів було складено вибірку такого самого об`єму 80 учнів (n2=80). У відповідності до спеціально розроблених критеріїв оцінки виконання лабораторної роботи кожен учень мав змогу потрапити до однієї з трьох категорій: “задовільно”, “добре” і “відмінно” (оцінка “незадовільно” не була отримана жодним учнем). Результати виконання робіт двома вибірками учнів використовуємо для перевірки гіпотези по те, що експериментальний метод навчання сприяє кращому умінню виконувати на високому рівні і обробляти результати лабораторних робіт з фізики, тобто учні експериментальних класів у середньому будуть отримувати кращі оцінки, ніж учні спеціалізованих класів. Вибірки учнів випадкові і незалежні, властивість, що вимірюється (уміння виконувати і обробляти результати лабораторних робіт з фізики) має неперервне розподілення і вимірюється за шкалою порядку, яка має 3 категорії: “задовільно”, “добре” і “відмінно”. Таким чином, у даному випадку можна використати двосторонній критерій 2, пристосований для тих ситуацій, коли експериментальні дані записані у формі таблиці 2С (у нашому випадку 23, оскільки С=3).
Результати виконання лабораторних робіт учнями обох вибірок запишемо у вигляді таблиці 23:
Таблиця 3.16
Результати виконання контрольних робіт
|
Категорія 1 “задовільно” |
Категорія 2 “добре” |
Категорія 3 “відмінно” |
|
Вибірка №1 |
О11=6 |
О12=29 |
О13=45 |
6+29+45 |
Вибірка №2 |
О21=13 |
О22=38 |
О23=29 |
13+38+29 |
|
6+13 |
29+38 |
45+29 |
160 |
Позначимо р1і (і = 1, 2, 3) імовірність виконання роботи учнями першої вибірки на оцінку і; р2і (і = 1, 2, 3) імовірність виконання роботи учнями другої вибірки на оцінку і. На основі даних нашої таблиці перевіряємо нульову гіпотезу Н0: р1і= р2і для всіх С=3 категорій за альтернативи Н1: р1і р2і хоча б для однієї з С=3 категорій.
Підрахуємо статистику критерію за формулою (3.4.3.4):
За таблицею Г (див. додатки) для =0,05 і кількості ступенів вільності =С-1=2 знаходимо критичне значення статистики критерію Т: х1- = 5,991. Тобто виконується нерівність Тспост Ткрит (7,35,991) і у відповідності до правила прийняття рішення одержані результати дозволяють відхилити нульву гіпотезу Н0 і прийняти альтернативну. Таким чином, можна зробити висновок про те, що учні експериментальних класів під час виконання лабораторних робіт з фізики і обробки результатів під час складання іспитів за 9-й клас показали кращі результати, ніж учні, які навчались без використання експериментальної методики.
Критерій Колмогорова – Смірнова.
Критерій призначений для виявлення відмінностей у двох сукупностях за станом розподілу деякої властивості. Критерій чутливий у фіксуванні будь-яких відмінностей в розподілі досліджуваної властивості в розглядуваних сукупностях (середніх значень, дисперсій, ексцесів і ін.).
Дані критерію. Будемо рахувати, що випадкова змінна Х характеризує стан досліджуваної властивості в одній з розглядуваних сукупностей, а випадкова змінна Y характеризує стан цієї ж властивості в другій сукупності. Нехай маємо n1 спостережень над випадковою змінною Х і n2 спостережень над випадковою змінною Y, отриманих при розгляді об`єктів двох вибірок об`ємів n1 і n2; ; xi (і = 1, 2, …, n1) – результати вимірювання деякої властивості у об`єктів першої вибірки, складеної із членів одної сукупності; yk (k = 1, 2, …, n2) – результати вимірювання тієї ж властивості у об`єктів другої вибірки; F(x) i G(x) – невідомі нам функції розподілу досліджуваної властивості у першій і другій сукупності відповідно.
Результати
вимірювання об`єктів першої вибірки
запишемо в ряд по зростанню значень:
Потім для кожного значення змінної Х
знайдемо значення емпіричної функції
розподілу досліджуваної властивості:
, де а
–
число значень хі,
менших або рівних х
(хі
х);
n1 –
об`єм вибірки. Аналогічно складемо
емпіричну функцію розподілу досліджуваної
властивості за результатами другої
вибірки:
де b
–
число значень yk,
менших або рівних х
(yk
х);
n2 –
об`єм другої вибірки. Для знаходження
значень функцій
і
зручно записати значення обох вибірок
у формі таблиці. Покажемо спосіб побудови
такої таблиці на конкретному прикладі.
Приклад. Із двох сукупностей зроблені дві вибірки об`ємом 6 і 8:
xi = 17, 10, 7, 9, 5, 4; yk = 2, 6, 7, 5, 8, 15, 3, 11.
Для знаходження значень емпіричних функцій розподілу досліджуваної властивості в кожній із вибірок складемо таблицю (3.17).
Таблиця 3.17
xі |
yk |
|
|
- |
- - 4 5 - 7 - 9 10 - - 17 |
2 3 - 5 6 7 8 - - 11 15 - |
0 0 1/6 2/6 2/6 3/6 3/6 4/6 5/6 5/6 5/6 6/6 |
1/8 2/8 2/8 3/8 4/8 5/8 6/8 6/8 6/8 7/8 8/8 8/8 |
- 1/8 - 2/8 - 1/12 - 1/24 - 1/6 - 1/8 - 1/4 - 1/12 + 1/12 - 1/24 - 1/6 0 |
n1=6 n2=8 |
Покажемо
спосіб визначення функції
на прикладі значень першої вибірки.
Запишемо значення xі
в ряд по зростанню значень x1=4,
x2=5,
x3=7,
x4=9,
x5=10,
x6=17.
При x=4
і n1=6
(чисельник рівний 1, оскільки в даній
вибірці лише одне значення xі
задовольняє нерівність хі
4, а
саме x1=4).
При x=5
(чисельник дробу рівний 2, оскільки в
даній вибірці лише два значення xі
задовольняє нерівність хі
5,
x1=4,
x2=5).
При x=7
.
При x=9
.
При x=10
.
При x=17
.
Такий спосіб визначення значень функцій і рекомендується при невеликих об`ємах обох вибірок. При великих об`ємах вибірок для підрахунку значень даних функцій складена таблиця, в якій значення спостережень обох вибірок записуються у формі інтервального ряду. Для кожного інтервалу значень спостережень підраховується абсолютна частота f – число спостережень досліджуваної вибірки, які потрапили в даний інтервал значень. По кожній вибірці на основі абсолютних частот підраховується накопичені частоти f – число спостережень, що мають значення менші, або рівні значенням із даного інтервалу. Проілюструємо даний спосіб визначення значень емпіричних функцій на конкретному прикладі.
Приклад. Контрольну роботу з теми “Архімедова сила” писали 40 експериментальних класів і 50 контрольних класів. Для кожного класу підраховувався відсоток вірних відповідей на це завдання. Значення цієї величини змінювалось в даному експерименті від 41 до 100%.
Таблиця 3.18
Відсоток вірних відповідей на завдання, х |
Абсолютна частота у вибірці №1, f1 |
Абсолютна частота у вибірці №2, f2 |
Накопичена частота |
|
|
|
f1 |
f2 |
|||||
100-96 95-91 90-86 85-81 80-76 75-71 70-66 65-61 60-56 55-51 50-46 45-41 |
15 10 4 3 2 1 1 1 - 1 1 1 |
18 8 2 5 6 2 2 4 1 1 - 1 |
40 25 15 11 8 6 5 4 3 3 2 1 |
50 32 24 22 17 11 9 7 3 2 1 1 |
1,00 0,63 0,38 0,28 0,20 0,15 0,13 0,10 0,08 0,08 0,05 0,03 |
1,00 0,64 0,48 0,44 0,34 0,22 0,18 0,14 0,06 0,04 0,02 0,02 |
n1=40 n2=50 |
У зв`язку з великими об`ємами вибірок отримані результати було доцільно записати у формі інтервальних рядів. При величині інтервалу, рівній 55, отримаємо 12 інтервалів (100%-40%=60%, 60%5%=12 (інтервалів)). Підрахуємо число спостережень, які потрапили в кожний з даних інтервалів, по першій і другій вибірці окремо і складемо таблицю 3.18, два останні стовпця якої містять значення функцій і .
Припущення. Для використання критерію необхідне виконання наступних вимог: 1) обидві вибірки випадкові; 2) вибірки незалежні, і члени кожної вибірки також незалежні між собою; 3) досліджувана властивість має неперервний розподіл в обох сукупностях, з яких зроблені вибірки; 4) шкала вимірювань не нижче порядкової.
Гіпотези. Припустимо, що закони розподілу випадкових величин Х і Y однакові в обох розглядуваних сукупностях, тобто функції розподілу F(x) i G(x) величин Х і Y рівні між собою. Двосторонній критерій дозволяє провести перевірку цієї гіпотези Н0: F(x) = G(x) для всіх можливих значень х – при альтернативі Н1: F(x) G(x) хоча б для одного значення х. Якщо гіпотеза Н1 істинна, то це означає, що закони розподілу величин Х і Y відмінні і, значить, суттєво відмінні стани досліджуваної властивості в розглядуваних сукупностях.
Односторонній критерій дозволяє провести перевірку наступних гіпотез:
Н0: F(x) G(x) для всіх можливих значень х – при альтернативі Н1: F(x)G(x). Якщо дана нульова гіпотеза істинна, то це означає, що стохастичні значення змінної Х не менше значень змінної Y. Якщо істинна альтернативна гіпотеза, то це означає, що значення змінної Х стохастично менше значень змінної Y.
Н0: F(x) G(x) для всіх можливих значень х – при альтернативі Н1: F(x)G(x). Якщо дана нульова гіпотеза істинна, то це означає, що стохастичні значення змінної Х стохастично не більші значень змінної Y. Якщо істинна альтернативна гіпотеза, то це означає, що значення змінної Х стохастично більші значень змінної Y.
Статистика критерію: Для використання критерію необхідно визначити значення статистик Т1, Т2, Т3 на основі значень емпіричних функцій розподілу і . Для початку обраховуємо вирази:
Статистики критерію підраховуються за формулами:
Використаємо розглянутий вище приклад для ілюстрації способу визначення статистик критерію. Із таблиці 3.18 випишемо дані першого і двох останніх стовпців і на їх основі заповнимо дані нової таблиці 3.19:
Згідно
даним таблиці, максимальне значення
різниці |
|
рівне 0,16; значить Т1=0,16.
Максимальне значення різниці
рівне 0,04; значить Т2=0,04.
Максимальне значення різниці
-
рівне 0,16; значить Т3=0,16.
Відмітимо, що Т1
завжди
рівне найбільшому із значень Т2
і Т3.
Таблиця 3.19
Відсоток вірних відповідей на завдання, х |
|
|
|
| | |
- |
100-96 95-91 90-86 85-81 80-76 75-71 70-66 65-61 60-56 55-51 50-46 45-41 |
1,00 0,63 0,38 0,28 0,20 0,15 0,13 0,10 0,08 0,08 0,05 0,03 |
1,00 0,64 0,48 0,44 0,34 0,22 0,18 0,14 0,06 0,04 0,02 0,02 |
0,00 - 0,01 - 0,10 - 0,16 - 0,14 - 0,07 - 0,05 - 0,04 0,02 0,04 0,03 0,01 |
0,01 0,01 0,10 0,16 0,14 0,07 0,05 0,04 0,02 0,04 0,03 0,01 |
0,00 0,01 0,10 0,16 0,14 0,07 0,05 0,04 - 0,02 - 0,04 - 0,03 - 0,01 |
Вибірки однакового об`єму. Підрахунок значень статистик критерію значно спрощується, якщо об`єми обох вибірок однакові, тобто n1=n2=n. В цих випадках значення статистик визначаються за формулами:
де
f1
– сума
накопичених частот у вибірці №1, f2
– сума
накопичених частот у вибірці №2.
Відповідно, замість знаходження значень
функції
і
,
як це приходиться робити при різних
об`ємах вибірок, достатньо підрахувати
лише накопичені частоти в кожній вибірці.
Правило прийняття рішень. Нехай - прийнятий рівень значимості.
а) Гіпотеза, яка перевіряється, Но відхиляється на рівні значимості , якщо спостережуване значення статистики критерію переважає критичне значення цієї статистики W1-. Якщо вірна нерівність Т1 W1-, то Но: F(x) = G(x) відхиляється і приймається альтернативна гіпотеза Н1: F(x) G(x), що дозволяє зробити висновок про відмінність розподілу змінних Х і Y, тобто про відмінність станів досліджуваної властивості у об`єктів двох розглядуваних сукупностей.
б) Якщо справедлива рівність Т2 W1-, то Но: F(x) G(x) відхиляється на рівні значимості і приймається гіпотеза Н1: F(x) G(x), що приводить до висновку про відмінність розподілу змінних Х і Y в тому змісті, що значення Х стохастично менше значень змінної Y, тобто об`єкти сукупності Х стохастично менші об`єктів сукупності Y по стану досліджуваної властивості.
в) При виконанні нерівності Т3 W1- Но: F(x) G(x) відхиляється на рівні і приймається гіпотеза Н1: F(x) G(x), в результаті чого приходять до висновку про те, що значення змінної Х стохастично більші значень змінної Y, тобто об`єкти сукупності Х стохастично більші об`єктів сукупності Y по стану досліджуваної властивості.
Для 0,2 критичне значення статистики Т1 = W1- рівне квантилю - критичному значенню статистик Т2 і Т3. Це твердження справедливе і для рівня значимості = 0,05, прийнятого в даній роботі. Визначення критичних значень критерію Колмогорова – Смірнова пов`язане з великим об`ємом обрахунків, тому таблиці цих значень складені поки що лише для вибірок невеликого об`єму, а саме при n1=n2=n для n40, при n1n2 для n120 і n220 (див. додатки, табл. Е, Ж). Для вибірок більшого об`єму критичні значення статистик критерію визначаються за наближеною формулою:
(3.4.4.7)
де - квантиль функції Колмогорова К (), який відповідає вибраному рівні значимості . Величини знаходяться за таблицею значень функції К (), як розв`язок рівняння виду К ()=1-.
Приведемо деякі, найбільш вживані значення : 0,2=1,07; 0,1=1,22; 0,05=1,36; 0,02=1,52; 0,01=1,63.
Приклад. В експериментальних і контрольних класах виконувалась лабораторна робота “Дослідження ККД нагрівального елементу від сили струму в ньому”. Під час проведення даної роботи використовувались рівневі інструкції. Спочатку всім учням давалось завдання у загальному вигляді. Їм необхідно було підібрати обладнання, спланувати експеримент, провести математичну обробку даних, отриманих із дослідів і похибок вимірів, зробити висновки. Ті учні, які не були у змозі виконати завдання, запропоноване у такому вигляді, одержували за їх проханням більш докладні інструкції, які мали перелік необхідного обладнання і приблизний хід експерименту.
Природно, що учні, які отримали такі інструкції, за повністю виконану роботу отримували нижчу оцінку ніж ті, хто виконав завдання, поставлене у загальному вигляді. Така диференціація сприяла тому, що навіть слабкі учні не прохали відразу надати їм детальні інструкції, а прагнули самостійно виконати завдання, поставлене у загальному вигляді. Для учнів, які не виконали завдання поставлене у такому, дещо конкретизованому вигляді, надавалась докладна інструкція з усіма необхідними математичними викладками, з докладним ходом експерименту, схемою досліду, описом методики обрахунку похибок. Для більш чіткого виявлення різниці в умінні виконувати лабораторні роботи творчого характеру бали за роботу були виставлені від 0 до 7. В експерименті брали участь 8-мі спеціалізовані класи шкіл м. Рівне. Частина з них навчалась за експериментальною методикою, частина – за традиційною.
У результаті випадкового відбору були сформовані дві вибірки (f1 – ті, що навчались за експериментальною методикою і f2 – за звичайною) рівні за об`ємом n1=n2=n=100 учнів. У проведеному експерименті виконуються всі вимоги, необхідні для використання критерію Колмогорова – Смірнова для виявлення ефективності експериментальної методики. Перевірялась гіпотеза Н0: F(x) = G(x), або припущення про однаковість функцій розподілу балових оцінок за виконання творчих лабораторних робіт серед учнів, які навчались за різними методиками (за експериментальною і традиційною). Альтернативна гіпотеза Н1: F(x) G(x) передбачає, що функції розподілу балових оцінок відмінні у двох досліджуваних сукупностях учнів.
Максимальне
значення виразу |f1-f2|
дорівнює 31. Тобто,
.
Критичне значення статистики критерію
знаходимо за формулою (3.4.4.7) для вибірок
великого об`єму (n40).
Для
=0,05 =1,36
.
Тобто виконується нерівність Т1спостер. W1- (0,340,19). Тому у відповідності до правила прийняття рішень нульова гіпотеза відхиляється і приймається альтернативна гіпотеза Н1, що дозволяє зробити висновок про різницю у розподілі балових оцінок за виконання лабораторної роботи творчого характеру серед учнів, які навчались за експериментальною і традиційною методикою.
Таблиця 3.20
Відсоток вірних відповідей |
Абсолютна частота у вибірці №1, f1 |
Абсолютна частота у вибірці №2, f2 |
Накопичена частота |
|f1-f2| |
|
f1 |
f2 |
||||
7 6 5 4 3 2 1 0 |
34 35 22 6 3 0 0 0 |
20 18 24 16 12 8 1 1 |
100 66 31 9 3 0 0 0 |
100 80 62 38 22 10 2 1 |
0 14 31 29 19 10 2 1 |
Аналіз експериментальних даних дозволяє нам уточнити одержаний висновок, так як дає підстави сказати, що учні, які навчались за експериментальною методикою, одержують стохастично більше балів, тобто експериментальна методика ефективніша за звичайну у відношенні підготовки учнів до виконання лабораторних робіт творчого характеру.
Завдання для самоконтролю
1. Шкала порядку 2. Шкала найменувань 3. Шкала відношень |
Вимірювання по . А . можливе, якщо існує критерій, який задає на множині об’єктів, які володіють даною властивістю, відношення рівності і порядку, що можна використати до стану даної властивості
|
1. Шкала відносин 2. Інтервальна шкала 3. Шкала порядку |
Шкала . В . дозволяє визначити не лише на скільки більше (менше) один об’єкт від іншого у відношенні вимірювальної якості, але і у скільки разів
|
1. хі - квадрат 2. Медіанний критерій 3. Критерій знаків
|
Критерій . С . призначений для виявлення відмінностей в центральних тенденціях стану деякої властивості в двох сукупностях на основі вивчення членів двох незалежних вибірок із цих сукупностей
|
1. n 20 2. n 20 3. n = 20
|
У випадку двостороннього критерію вілкоксона, у випадку для . D . Критичні значення статистики Т - визначаються за формулами:
|
1. Медіанний критерій 2. Колмогорова -Смірнова 3. Вілкоксона-Манна-Уітні
|
Не рекомендується використовувати критерій . Е . для перевірки гіпотез, якщо 20 n1 + n2 20 і хоча б одне із значень A, B, C, D, записаних у таблиці 22, менше 5.
|
1. Колмогорова -Смірнова
2. Вілкоксона-Манна-Уітні 3. Медіанний критерій |
Для перевірки гіпотез з допомогою критерію . F . підраховується значення статистики критерію Т за наступною формулою:
|
1. 25 2. 30 3. 40 |
Критичне значення критерію Вілкоксона-Манна-Уітні для n1=8, n2=15 (=0,01) рівне .G .
|
1. ½ 2. 2,5 3. 9/20
|
Критичне значення статистики одностороннього критерію Колмогорова-Смірнова для двох вибірок різних об’єктів N1=10, N2=20 (1-=0,975) рівне . Н . |
1. Медіанний критерій 2. хі-квадрат 3. Критерій Вілкоксона
|
Статистика критерію . І . підраховується за формулою: |
1. Критерій знаків 2. Критерій Макнамари 3. Колмогорова -Смірнова
|
Статистики критерію . J . підраховуються за формулами:
|