
- •Завдання для самоконтролю
- •Питання до колоквіуму
- •Тематика рефератів.
- •Тема 1. Основні типи вимірювань і статистичні гіпотези в педагогічних дослідженнях.
- •Тема 2. Порівняння результатів двох залежних вибірок
- •Тема 3. Порівняння результатів двох незалежних вибірок
- •Питання до колоквіуму
- •Тематика рефератів.
- •Критичні значення статистик, які мають розподіл 2 з числом ступенів вільності , для рівня значимості
- •Критичні значення статистики критерію Вілкоксона – Манна - Уітні
Тема 2. Порівняння результатів двох залежних вибірок
Література
Воловик П.М. Теорія ймовірностей і математична статистика в педагогіці. – К.: Рад. школа, 1969. – 223 с.
Гласс Дж. Статистические методы в педагогике и психологии. – М.: Прогресс, 1976. – 495 с.
Гнеденко Б.В. Хингин А. Я. Элементарное введение в теорию вероятностей. – М.: Наука, 1970. – 168 с.
Грабарь М.И. Исследование факторов, влияющих на результаты педагогических экспериментов. // Советская педагогика. №2. – 1987. – С. 34 – 40.
Грабарь М.И., Краснянская К.А. Применение математической статистики в педагогических исследованиях. Непараметрические методы. – М.: Педагогика, 1977. – 135 с.
Жалдак М.І., Кузьміна Н.М., Берлінська С.Ю. Теорія ймовірностей і математична статистика з елементами інформаційної технології. Навчальний посібник. – К.: Вища школа, 1995. – 351 с.
Кыверялг А.А. Методы исследования в профессиональной педагогике. – Таллин: Валгус, 1980. – 333 с.
Підласий І.П. Діагностика та експертиза педагогічних проектів. Навчальний посібник для студентів вищих навчальних закладів. – К.: Україна, 1998. – 344 с.
Розенберг Н.М. Проблемы измерений в дидактике. – К.: Вища школа, 1979. – 175 с.
Цехмістрова Г.С. Основи наукових досліджень. – К.: «Слово», 2003. – 240 с.
Понятійний апарат
Дані критерію, припущення, гіпотези, статистика критерію, правила прийняття рішень, односторонній критерій, двосторонній критерій, критерій Макнамарі, критерій знаків, критерій Вілкоксона.
Конспект основних питань
Критерій Макнамарі.
Критерій призначений для порівняння розподілу об`єктів двох сукупностей по стану деякої властивості на основі вимірювань (хоча б по шкалі найменувань) даної властивості в двох залежних вибірках розглядуваних сукупностей.
Дані критерію. В педагогічних дослідженнях нерідко виникає проблема порівняння стану деякої властивості у членів двох залежних вибірок, коли дана властивість може бути виміряна лише по шкалі найменувань. Наприклад, відношення групи учнів до деякої професії до і після бесіди по профорієнтації виміряне по шкалі найменувань, яка має наступні категорії: зовсім не подобається – не подобається – байдужа – подобається – дуже подобається. В цьому випадку виникає необхідність порівняння відповідей одних і тих же учнів до і після бесіди, так як отримані результати дозволять судити про ефективність даної бесіди.
Для тих випадків, коли вимірювання стану розглядуваної властивості проводиться по шкалі найменувань, яка має лише дві категорії, розроблений спеціальний критерій для порівняння результатів двох залежних вибірок. Цей критерій називається критерієм Макнамарі. Він може бути використаний в дослідженні, про яке йшлося вище, якщо відношення учнів до професії буде виміряне по шкалі найменувань, яка має лише дві категорії. Прийнято позначати одну із двох категорій шкали значком “0”, другу – значком “1”.
Будемо рахувати, що випадкова змінна Х характеризує стан деякої властивості в розглядуваній сукупності об`єктів при першому вимірюванні даної властивості. А випадкова змінна Y характеризує стан цієї ж властивості в тій же сукупності об`єктів при повторному вимірюванні.
Нехай існує дві серії спостережень
x1 , x2 , . . . , xi , . . . , xN ;
y1 , y2 , . . . , yi , . . . , yN ;
над випадковими змінними Х і Y, отримані при розгляді двох залежних вибірок. Складемо N пар виду (xi , yi), де xi ,yi – результати дворазового вимірювання однієї і тієї ж властивості у одного і того ж об`єкта. В педагогічних дослідженнях пари (xi , yi), можуть бути результатами вимірювання стану однієї і тієї ж властивості у одного і того ж учня до і після використання деякого педагогічного засобу, причому xi – стан властивості до використання даного засобу, yi – після його використання. xi ,yi - вимірювання по шкалі найменувань, яка має дві категорії, позначені “0” і “1”. У зв`язку з цим пари (xi , yi) можуть бути лише чотирьох видів (0, 0), (0, 1), (1, 0), (1, 1). Для використання критерію дані сумуються у вигляді чотирикліткової таблиці, яка називається “таблиця 22”.
Таблиця 3.1
Класифікація
хі |
хi = 0 |
Класифікація yi |
|
|
yi = 0 |
yi = 1 |
|||
а (число пар, у яких хi =0, yi = 0 |
b (число пар, у яких хi =0, yi = 1 |
a + b |
||
хi = 1 |
c (число пар, у яких хi =1, yi = 0 |
d (число пар, у яких хi =1, yi = 1 |
c + d |
|
a + c |
b + d |
|
Припущення. Для використання критерію Макнамарі необхідне виконання наступних умов: 1) вибірки випадкові1; 2) вибірки залежні; 3) пари (xi , yi) взаємно незалежні, тобто члени вибірки ніяк не впливають один на одного (в педагогічних дослідженнях виконання цієї вимоги рівносильне, наприклад, виключенню можливості консультацій і списування відповідей один у одного); 4) шкала вимірювань – шкала найменувань з двома категоріями.
Гіпотези. Припустимо, що закони розподілу випадкових величин Х і Y однакові. Тоді виконується наступна рівність:
P (х i = 0, y i = 1) = P (х i = 1, y i = 0) (1)
для всіх N пар (xi , yi). Рівність (1) означає, що поява пар (0, 1) і (1, 0) має однакову імовірність.
Критерій Макнамарі і призначений для перевірки справедливості даної рівності. Нульова гіпотеза має вид:
Н0: P (х i = 0, y i = 1) = P (х i = 1, y i = 0)
для всіх і. В якості альтернативної гіпотези вибирається гіпотеза:
Н1: P (х i = 0, y i = 1) P (х i = 1, y i = 0)
для всіх і. Якщо гіпотеза Н1 справедлива, то це означає, що закони розподілу змінних Х і Y відмінні, тобто стан розглядуваної властивості суттєво відрізняються в одній і тій же сукупності при початковому вимірюванні даної властивості (наприклад, до використання нового методу навчання) і при повторному його вимірюванні (після використання). Справедливість нульової гіпотези призводить до висновку про відсутність значних відмінностей у стані розглядуваної властивості при першому і другому вимірюваннях його стану у об`єктів розглядуваних сукупностей.
Статистика критерію. Для перевірки статистичних гіпотез з допомогою критерію Макнамарі підраховується значення величини, яке називається статистикою критерію. Припустимо, що N пар (xi , yi) розподілились наступним чином: число пар виду (х i = 0, yi = 1) рівне b, число пар виду (х i = 1, yi = 0) рівно с. Тоді, якщо b + c 20, то в якості статистики вибирається величина
(3.3.1)
Якщо b + c 20, то використовується величина Т2, рівна найменшому із значень b і c, тобто
(3.3.2)
Значення статистик Т1 і Т2 не залежить від значень а і d – числа пар вигляду (х i = 0, yi = 0) і (х i = 1, yi = 1), оскільки ці пари представляють вимірювання об`єктів, індиферентних до впливу методу, ефективність якого перевіряється у проведеному експерименті.
Правило прийняття рішень. Нехай b + c = n і - прийнятий рівень значимості. Розглянемо правила прийняття рішень у випадку використання критерію Макнамарі для перевірки різного виду гіпотез.
Проводиться
перевірка гіпотези Н0:
P (х i
= 0, yi
= 1) = P (х i
= 1, yi
= 0)
– при альтернативі Н1:
P (х i
= 0, yi
= 1)
P (х i
= 1, yi
= 0).
Якщо справедлива нульова гіпотеза, то
статистика критерію
розподілена по біномінальному закону
з р
= 0,5.
Тому для
n
20 по
таблиці А (див. додатки) за значенням
n і
величині статистики критерію Т2
знаходимо Р
(Т2
Т2
спостережуване), тобто імовірність
появи значення статистики, меншої чи
рівної спостережуваному значенню Т2
при даному значенні n.
Якщо
ця ймовірність менше половини заданого
рівня значимості ,
тобто
,
то Н0
відхиляється на рівні значимості .
При цьому у випадку, коли b
c,
приймається гіпотеза Н1:
P (х i
= 0, yi
= 1)
P (х i
= 1, yi
= 0),
а у випадку b
c
– гіпотеза Н1:
P (х i
= 0, yi
= 1)
P (х i
= 1, yi
= 0).
Таблиці біномінального розподілу,
зручні для використання критерію
Макнамарі, складені для n
25.
Однак для n
20 при
припущенні про справедливість нульової
гіпотези розподіл статистики критерію
Т1
апроксимується розподілом 2
(хі-квадрат) з однією ступінню вільності
(
1).
Н0
відхиляється на рівні значимості ,
якщо
спостережуване значення Т1
переважає критичне значення статистики
критерію, яке відповідає даному рівню
значимості ,
яке визначається за таблицею Г (див.
додатки) розподілу 2
для однієї ступені вільності. Для
= 0,05
Т1критич=3,84;
= 0,25
Т1критич=5,02;
= 0,01
Т1критич=6,63.
При відхиленні Н0
приймається гіпотеза Н1:
P (х i
= 0, yi
= 1)
P (х i
= 1, yi
= 0),
якщо b
c,
і гіпотеза Н1:
P (х i
= 0, yi
= 1)
P (х i
= 1, yi
= 0),
якщо b
c.
У випадку, коли b
= c,
використання статистики критерію Т2
при n
20
і статистики Т1
при n
20 наперед
не дозволяє відхилити нульову гіпотезу
на будь-якому рівні значимості .
Тому при b
= c
результати експерименту не дозволяють
використовувати критерій Макнамарі
для перевірки статистичних гіпотез.
Приклади використання критерію Макнамарі.
Приклад 1. Розглянемо використання критерію Макнамарі на етапі пошукового експерименту. З учнів 13-ї школи м. Рівне, які закінчили 7-й клас, методом випадкового відбору були відібрані по 20 учнів з п`яти класів і серед них було проведене анкетування, спрямоване на виявлення їх інтересу до лабораторних робіт з фізики. У 7-му класі роботи виконувались усіма учнями тільки у вигляді фронтальних лабораторних робіт за стандартною методикою. Оскільки після сьомого класу учні даної школи складали екзамен з фізики і за його результатами зараховувались у різнорівневі і різнопрофільні класи (7 А, 7 Б, - фізичні, 7 В – математичний, 7 Г – біологічний, 7 Д – загальноосвітній), то перше анкетування проводилось після зарахування школярів до класу певного профілю. Повторне опитування проводилось після закінчення 8-го класу. На протязі року усі класи навчались за експериментальною методикою з урахуванням їх профільної та рівневої диференціації, а також кількості навчальних годин, які було відведено на вивчення фізики. Результати дворазових відповідей на питання про відношення до виконання лабораторних робіт з фізики – це виміри за шкалою найменувань, яка має дві категорії (“подобається” позначимо позначкою “0”, “не подобається” – позначкою “1”), такої властивості учнів, як відношення до виконання лабораторних робіт з фізики.
У цих умовах можливе використання критерію Макнамарі для виявлення тенденції у зміні відношення учнів до виконання лабораторних робіт з фізики після навчання за експериментальною методикою на протязі навчального року, так як виконуються усі припущення даного критерію. Результати дворазового опитування учнів з кожного класу запишемо у формі таблиці 22. За умов даного експерименту значення а дорівнює кількості учнів, які обидва рази дали відповідь “подобається”, значення в – кількості учнів, які першого разу дали відповідь “подобається”, другого разу – “не подобається”; значення с – кількості учнів, які першого разу дали відповідь “не подобається”, другого – “подобається”; значення d – кількості учнів, які обидва рази дали відповідь “не подобається”.
Перевіряємо гіпотезу Н0 : навчання за експериментальною методикою не впливає на інтерес учнів до проведення лабораторних робіт з фізики. У відповідності до одержаних результатів (для всіх п`яти класів b c) альтернативна гіпотеза Н1 може бути сформульована таким чином: навчання за експериментальною методикою позитивно впливає на інтерес учнів до проведення лабораторних робіт з фізики.
Таблиця 3.2
Результати опитувань 8 А класу
Перше опитування |
Друге опитування |
||
|
подобається |
не подобається |
|
подобається |
а = 10 |
b = 1 |
|
не подобається |
c = 8 |
d = 1 |
Таблиця 3.3
Результати опитувань 8 Б класу
Перше опитування |
Друге опитування |
||
|
подобається |
не подобається |
|
подобається |
а = 12 |
b = 0 |
|
не подобається |
c = 7 |
d = 1 |
Таблиця 3.4
Результати опитувань 8 В класу
Перше опитування |
Друге опитування |
||
|
подобається |
не подобається |
|
подобається |
а = 8 |
b = 0 |
|
не подобається |
c = 10 |
d = 2 |
Таблиця 3.5
Результати опитувань 8 Г класу
Перше опитування |
Друге опитування |
||
|
подобається |
не подобається |
|
подобається |
а = 9 |
b = 1 |
|
не подобається |
c = 9 |
d = 1 |
Таблиця 3.6
Результати опитувань 8 Д класу
Перше опитування |
Друге опитування |
||
|
подобається |
не подобається |
|
подобається |
а = 7 |
b = 1 |
|
не подобається |
c = 8 |
d = 4 |
У
цих умовах для перевірки гіпотези
використовується критерій Макнамарі
для n
20
а) n
= b + c =1+8=9
20; б) n
= b + c =0+7=7
20; в) n
= b + c =0+10=10
20; г) n
= b + c =1+9=10
20; д) n
= b + c =1+8=9
20, тобто підраховується значення
статистики Т2,
яке дорівнює меншому із значень b
і
c
(див. формулу 3.3.2). У даному випадку а) Т2
=1; б) Т2
=0; в) Т2 =0;
г) Т2
=1; д) Т2
=1. За таблицею А (див. додатки) імовірність
з`явлення значення: а) Т2
1
за умови, що n
=
9, дорівнює 0,020; б) Т2
=0 за умови, що n =
7, дорівнює 0,08; в) Т2
=0 за умови, що n
=
10, дорівнює 0,001; г) Т2
1
за умови, що n
=
10, дорівнює 0,011; д) Т2
1
за умови, що n
=
9, дорівнює 0,020. Якщо рівень значущості
перевірки гіпотез = 0,05,
то
і
таким чином виконуються нерівності: а)
;
б)
;
в)
;
г)
;
д)
.
Як бачимо з результатів, в усіх класах спостерігалось підвищення інтересу до проведення лабораторних робіт з фізики. Незначна кількісна різниця у результатах передбачалась на підставі того, що в учнів спеціалізованих класів заздалегідь був більш високий інтерес до вивчення фізики і проведення фізичного експерименту. Даний прогноз виправдався, до того ж підвищення інтересу спостерігалось і в 8 Д класі, не дивлячись на менші можливості у застосуванні різних форм проведення експерименту за браком часу і за причини низького рівня загальної фізико-математичної підготовки класу. На підставі результатів анкетування була прийнята альтернативна гіпотеза Н1 про те, що використання експериментальної методики проведення лабораторних робіт з фізики підвищує в учнів інтерес до виконання фізичного експерименту.
Приклад 2. Перевірявся вплив форми контролю знань учнів по деякому розділу програми на результати контрольного опитування. На одному і тому ж змістовому матеріалі були складені: письмова робота звичайного типу із трьох завдань і тест із 20 питань. На основі результатів виконання завдань кожної із форм учні розподілялися на дві категорії: засвоїв – не засвоїв. При виконанні письмової роботи в першу групу відносили учнів, які отримали оцінки від “4” до “12” балів, виставленні згідно з нормами, розробленими експериментаторами. При виконані тесту в першу групу відносились учні, які вірно відповіли на 13 і більше питань. Решта учнів було віднесено до другої групи. Із різних шкіл було вибрано методом випадкового відбору 100 учнів. Кожний із них виконував обидві форми контрольних робіт одну за іншою. Результати двократного контролю знань цих учнів представляють вимірювання по шкалі найменувань з двома категоріями (засвоїв – не засвоїв) стану знань учнів по певному розділу. В даних умовах можливо використати критерій Макнамарі для виявлення відмінності в розподілі учнів по стану знань при різних формах контролю: письмова контрольна робота і тести, оскільки виконані всі припущення даного критерію. Результати двократного виконання роботи запишемо у формі таблиці 22 (таблиця 3.7). Перевіряється нульова гіпотеза Н0: форма контролю за засвоєнням даного розділу програми не вказує впливу на розподіл учнів по стану знань. У зв`язку з завданнями експерименту альтернативна гіпотеза Н1 формулюється наступним чином: розподіл учнів по стану знань різний при різних формах контролю. В даних умовах для перевірки гіпотези використовується двохсторонній критерій Макнамарі для n 20 (n = b + c =21+4=25), тобто підраховуємо значення статистики Т1 по формулі (3.3.1).
Таблиця 3.7
Результати по контрольній роботі |
Результати по тесту
|
||
|
засвоїв |
не засвоїв |
|
засвоїв |
а = 63 |
b = 21 |
|
не засвоїв |
c = 4 |
d = 12 |
У
даному випадку
Для рівня значимості = 0,05 критичне значення Т1критич=3,84 (див. вище). Відповідно виконується рівність Т1спостер Т1критич. Тому нульова гіпотеза відхиляється на рівні значимості = 0,05 і приймається альтернативна гіпотеза. Таким чином, на основі результатів проведеного експерименту можна зробити висновок про те, що форма контролю за засвоєнням відповідного розділу програми суттєво впливає на розподіл учнів по стану отриманих знань.
Приклад 3. Група із 120 учнів відповідала на два питання. Відсоток вірних відповідей на перше питання – 57, на друге – 68. При цьому із 120 учнів 50 правильно відповіли на два питання, 19 – правильно на перше питання і не правильно на друге, 31 – неправильно відповіли на перше і правильно на друге, 20 – неправильно відповіли на два питання. В даних умовах можна використати критерій Макнамарі для порівняння рівнів відповідей на два питання, оскільки виконуються всі припущення критерію. Таблиця 22 буде мати вид:
Таблиця 3.8
Результати виконання другого питання |
Результати виконання першого питання |
||
|
правильно |
не правильно |
|
правильно |
а = 50 |
b = 31 |
|
не правильно |
c = 19 |
d = 20 |
Перевіряється
гіпотеза Н0
: не існує відмінностей у виконанні обох
завдань даною групою учнів – при
альтернативі Н1
: рівні виконання завдань суттєво
відрізняються. В цих умовах для перевірки
гіпотез використовується критерій
Макнамарі для n
20
(n
= b + c =31+19=50
20).
Підрахуємо значення статистики критерію
.
Для рівня значимості = 0,05
Т1критич=3,84.
Відповідно виконується рівність
Т1спостер
Т1критич.
Тому на рівні значимості = 0,05
у нас нема достатніх підстав для
відхилення Н0.
Інакше кажучи, нема достатніх підстав
рахувати, що відсотки правильних
відповідей групи учнів на питання 1 і 2
відрізняються статистично значимо.
Критерій знаків
Критерій призначений для порівняння стану деякої властивості у членів двох залежних вибірок на основі вимірювань, зроблених по шкалі не нижче порядкової.
Дані критерію. Будемо рахувати, що випадкова змінна Х характеризує стан деякої властивості в розглядуваній сукупності об`єктів при першому вимірюванні даної властивості, випадкова змінна Y характеризує стан цієї ж властивості в тій же сукупності об`єктів при повторному вимірюванні.
Мається дві серії спостережень
x1 , x2 , . . . , x i , . . . , x N ;
y1 , y2 , . . . , y i , . . . , y N ;
над випадковими змінними Х і Y, отримані при розгляді двох залежних вибірок. На їх основі складено N пар виду (xi , yi), де xi ,yi – результати дворазового вимірювання однієї і тієї ж властивості у одного і того ж об`єкта. В педагогічних дослідженнях об`єктами вивчення можуть служити учні, вчителі, адміністрація шкіл. При цьому xi , yi можуть бути, наприклад, балові оцінки, виставлені за дворазове виконання однієї і тієї ж або різних робіт однією групою учнів до і після використання деякого педагогічного засобу. Елементи кожної пари xi , yi порівнюються між собою по величині, і парі присвоюється знак “+”, якщо xi yi, знак “-”, якщо xi yi, і “0”, якщо xi = yi. Встановлення відношення “більше” (“менше”) між двома вимірюваннями можливе, якщо ці вимірювання зроблені хоча б за шкалою порядку. Відповідно, знаковий критерій не застосовний у випадку вимірювань по шкалі найменувань.
Припущення. Для використання знакового критерію необхідне виконання наступних вимог: 1) вибірки випадкові; 2) вибірки залежні; 3) пари (xi , yi) взаємно незалежні; 4) розглядувана властивість об`єктів розподілена неперервно в обох сукупностях, із яких зроблені вибірки; 5) шкала вимірювань повинна бути не нижче порядкової.
Гіпотези. Припустимо, що закони розподілу випадкових величин Х і Y однакові. Тоді виконується наступна рівність: P (х i y i) = P (х i y i) для всіх пар (xi , yi), яка означає, що імовірність того, що перше вимірювання (xi) в парі (xi , yi) менше другого вимірювання (yi), рівна імовірності того, що перше вимірювання в парі більше за друге, для всіх N пар. Справедливість цієї рівності і перевіряється за допомогою знакового критерію. Таким чином нульова гіпотеза має вид:
Н0 : P (х i y i) = P (х i y i ) для всіх і.
При використанні знакового критерію в якості альтернативної гіпотези вибирається гіпотеза:
Н1 : P (х i y i) P (х i y i ) для всіх і.
Якщо гіпотеза Н1 справедлива, то звідси слідує, що закони розподілу величин Х і Y різні, тобто стан досліджуваної властивості суттєво відрізняються в одній і тій же сукупності при початковому і повторному вимірюванні даної властивості. Справедливість нульової гіпотези інтерпретується наступним чином: в стані досліджуваних властивостей нема значних відмінностей при першому і повторному вимірюваннях.
Статистика критерію. Для перевірки гіпотез з допомогою знакового критерію на основі спостережень підраховується значення статистики критерію Т. Припустимо, що серед N пар (xi , yi) знайшлось кілька пар, в яких значення х i і yi рівні. Такі пари позначаються знаком “0” і при підрахунку значення величини Т не враховуються. Припустимо, що після віднімання від числа N числа пар, позначених “0”, залишилось всього n пар. Серед пар, що залишились, підраховуємо число пар, позначених знаком “+” (тобто ті пари, в яких х i y i). Значення величини Т і рівне числу пар зі знаком “+”.
Правило прийняття рішень. Нехай число пар, в яких х i y i рівне n і - прийнятий рівень значимості. Розглянемо правила прийняття рішень при перевірці різного виду гіпотез.
1. Двосторонній критерій. Проводиться перевірка гіпотези
Н0 : P (х i y i) = P (х i y i ) при альтернативі Н1: P (х i y i) P (х i y i).
Для n 100 складена спеціальна таблиця (див. таблицю Б, додатки), в якій для кожного значення n дані критичні значення t і n-t статистики Т для різних рівнів значимості . В таблиці Б ці значення дані для = 0,05; = 0,02; = 0,01. При даному значені n гіпотеза Н0 відхиляється на рівні значимості , якщо для спостережуваного значення Т справедлива одна з нерівностей Т t або Т n-t.
2. Односторонній критерій. У тих випадках, коли є достатні підстави припустити, що результати другого вимірювання розглядуваної властивості у одних і тих же об`єктів - y i мають тенденцію переважати (або навпаки бути меншими) результатів першого вимірювання - х i замість двостороннього критерію використовується односторонній критерій.
а). Для випадку, коли х i мають тенденцію переважати y i проводиться перевірка гіпотези:
Н0 : P (х i y i) P (х i y i ) при альтернативі Н1: P (х i y i) P (х i y i ).
Для n 100 може бути використана таж таблиця Б, що і для двохстороннього критерію. Н0 відхиляється на рівні значимості , вказаному для одностороннього критерію, якщо спостережуване значення Т t . Таблиця Б пропонує значення t для рівнів значимості = 0,025; = 0,01; = 0,005.
б). В тому випадку, коли yi мають тенденцію переважати за значенням хi проводиться перевірка гіпотези:
Н0 : P (х i y i) P (х i y i ) при альтернативі Н1: P (х i y i) P (х i y i ).
Н0 відхиляється на рівні значимості , якщо спостережуване значення Т n-t, де значення n-t визначається із таблиці Б.
Приклади використання знакового критерію.
Приклад 1. Учні виконували контрольну роботу, спрямовану на перевірку засвоєння деякого поняття. П`ятнадцяти учням, 7 з яких отримали оцінку “2” бали і 8 – оцінку “3”, було запропоноване програмовий посібник, складений з метою формування даного поняття в учнів з низьким рівнем успішності. Після вивчення посібника учні знову виконали ту саму контрольну роботу, яка оцінювалась по п`ятибальній системі. Даний експеримент проводився з метою перевірки ефективності програмованого посібника як засобу підвищення знань слабких учнів шляхом самоосвіти. Результати дворазового виконання роботи учнями представляють вимірювання за шкалою порядку (п`ятибальна шкала) такої якості, як засвоєння деякого поняття. В даних умовах можливе використання знакового критерію. Результати дворазового виконання роботи (в балах) 15 учнями запишемо у формі таблиці.
Таблиця 3.9
Учні |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
Перше виконання |
2 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
3 |
3 |
2 |
2 |
3 |
3 |
3 |
Друге виконання |
2 |
3 |
3 |
4 |
3 |
2 |
3 |
4 |
4 |
3 |
4 |
3 |
2 |
4 |
4 |
Знак різниці оцінок |
0 |
+ |
+ |
+ |
+ |
- |
0 |
+ |
+ |
0 |
+ |
+ |
- |
+ |
+ |
Перевіряється гіпотеза Н0 : стан знань учнів не підвищився після вивчення посібника – при альтернативі Н1 : стан знань учнів підвищився після вивчення посібника. У відповідності до змісту гіпотез слід використати односторонній знаковий критерій. Підрахуємо значення статистики критерію Т, яке рівне числу позитивних різниць оцінок, отриманих учнями. Згідно даним таблиці 3.9., Т=10. Із 15 пар в 3 випадках різниця вимірювань рівна нулю, значить, залишається лише 12 (15-3) пар, тобто n =12. Для визначення критичних значень статистики критерію n-t використаємо таблицю Б, оскільки n 100. Для рівня значимості =0,05, при n =12 значення n-t = 9. Відповідно виконується нерівність Тспостер n-t (109). Тому у відповідності до правила прийняття рішень нульова гіпотеза відхиляється на рівні значимості =0,05 і приймається альтернативна гіпотеза, що дозволяє зробити висновок про покращення знань учнів після самостійного вивчення посібника.
Приклад 2. Учні 8 А спеціалізованого з фізики класу школи №13 м. Рівне на початку навчального року вивчили способи обробки похибок вимірювань: а) метод середнього арифметичного для прямих вимірювань і б) метод границь для непрямих вимірювань. Після цього, на протязі першої чверті, учні даного класу виконували роботи тематичного фізичного практикуму та інші види експерименту за стандартною методикою з використанням вищеназваних методів обробки похибок вимірів і, таким чином, одержали достатній досвід для їх використання.
На початку та в кінці 2-ї чверті, на протязі якої учні даного класу виконували всі види практичних і лабораторних робіт у відповідності до вимог експериментальної методики, у цьому класі проводилось контрольне тестування, спрямоване на перевірку вміння класифікувати результати експерименту (на прямі та непрямі) і, відповідно до цього, правильно використовувати вивчені способи обробки похибок вимірювань. Для цього були розроблені тести, які складались з опису трьох експериментів, які включали: опис обладнання, опис ходу експерименту, результатів вимірювань та обчислень. У відповідності до кількості правильно оброблених похибок була виставлена оцінка (від “2” до “5”). “5” за 3 правильно визначені похибки; “4” – за 2 правильно визначені похибки; “3” – за 1 правильно визначену похибку.
Даний експеримент проводився з метою перевірки ефективності експериментальної методики під час засвоєння учнями методів обробки похибок вимірювань при виконанні фізичних дослідів. Результати дворазового виконання роботи учнями є вимірювання за шкалою порядку (п`ятибальна шкала) такої властивості, як уміння правильно вибирати та застосовувати метод обробки похибок у випадку даного конкретного експерименту. В цих умовах можливе використання критерію для виявлення тенденції зміни стану умінь учнів правильно проводити визначення похибок експерименту після проведення лабораторних і практичних робіт на протязі навчальної чверті за експериментальною методикою, бо виконуються всі умови даного критерію. Результати дворазового тестування (у балах) учнів запишемо у формі таблиці.
Таблиця 3.10
Результати дворазового тестування учнів 8 А класу
Учні № |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
Перше виконання |
3 |
3 |
4 |
3 |
3 |
5 |
4 |
3 |
3 |
4 |
4 |
3 |
5 |
3 |
3 |
3 |
5 |
4 |
4 |
3 |
4 |
3 |
3 |
4 |
4 |
5 |
3 |
3 |
3 |
Друге виконання |
4 |
4 |
5 |
5 |
3 |
5 |
4 |
4 |
5 |
5 |
4 |
4 |
5 |
3 |
4 |
4 |
4 |
5 |
4 |
5 |
5 |
4 |
3 |
3 |
4 |
5 |
4 |
4 |
5 |
Знак різниці оцінок |
+ |
+ |
+ |
+ |
0 |
0 |
0 |
+ |
+ |
+ |
0 |
+ |
0 |
0 |
+ |
+ |
- |
+ |
0 |
+ |
+ |
+ |
0 |
- |
0 |
0 |
+ |
+ |
+ |
Перевірялась гіпотеза Н0 : стан умінь учнів класифікувати похибки вимірювань під час експерименту не підвищився після навчання за експериментальною методикою, за альтернативи Н1 : стан даного вміння підвищився після навчання за експериментальною методикою. У відповідності до змісту гіпотез необхідно застосувати односторонній знаковий критерій. Підрахуємо значення статистики критерію Т , яке дорівнює кількості додатних різниць оцінок, одержаних учнями. Згідно даних таблиці 3.10 для учнів 8 А класу Т = 17. Для 8 А з 29 пар в 10 випадках різниця вимірів дорівнює нулю, тобто, n = 19. Для визначення критичних значень критерію скористаємось таблицею Б (див. додатки), оскільки n 100. Для рівня значущості =0,05, при n =19 значення n-t = 15. Відповідно виконується нерівність Тспостер n-t (1715). Тому у відповідності до правила прийняття рішень нульова гіпотеза відхиляється на рівні значимості =0,05 і приймається альтернативна гіпотеза, що дозволяє зробити висновок про поліпшення уміння учнів використовувати відповідні методи обробки похибок прямих та непрямих вимірювань під час проведення фізичних експериментів після навчання за експериментальною методикою.
Критерій Вілкоксона.
В педагогічних дослідженнях критерій Вілкоксона може бути використаний для перевірки наступного припущення: медіана результатів вимірювання однієї і тієї ж властивості в деякій сукупності учнів до проведення експерименту рівна медіані результатів вимірювання тієї ж властивості в учнів тієї ж сукупності після даного експерименту. Критерій Вілкоксона може використовуватись до результатів, отриманих на основі однократного вимірювання деякої властивості в учнів одної вибірки. В даному випадку він використовується для перевірки припущення про те, що дана вибірка належить сукупності учнів, медіана результатів яких рівна певному числовому значенню.
1. Випадок двох залежних вибірок.
Дані критерію: Будемо рахувати, що випадкова змінна Х характеризує стан деякої властивості в розглядуваній сукупності об`єктів при першому вимірюванні, а випадкова змінна Y характеризує стан цієї ж властивості в тій же сукупності об`єктів при повторному вимірюванні.
Нехай мається дві серії спостережень
x1 , x2 , . . . , x i , . . . , x N ;
y1 , y2 , . . . , y i , . . . , y N ;
над випадковими змінними Х і Y, отримані при розгляді двох залежних вибірок. Складено N пар виду (xi , yi), де xi, yi – результати дворазового вимірювання деякої властивості у одного і того ж об`єкта. Для кожної пари (xi , yi) знаходимо | D i | = | yi - xi| - абсолютні значення різниці вимірювань xi , yi. Пари, у яких D i = 0 – значення xi і yi співпадають (xi = yi), не враховуються при підрахунку статистики критерію. Нехай після віднімання таких пар із загального числа пар N залишиться n пар (n N). Виписуємо для n пар, що залишилися значення | D i | в ряд по зростанню значень. Значення | D i |, яке стоїть на лівому фланзі цього ряду, приписуємо ранг 1, наступному за ним – ранг 2 і т. д., останньому - n. Якщо декілька послідовних значень | D i |, які стоять в цьому ряду, співпадають, то кожному з них приписується один і той же ранг, рівний середньому арифметичному їх рангів. Однак, приписування однакових рангів значенням | D i | знижує точність висновків, отриманих при використанні критерію. Потім кожному рангу приписується знак “+”, якщо він відповідає позитивній різниці (D i 0), і знак “-”, якщо він відповідає від`ємній різниці.
Покажемо процес приписування рангів на прикладі. Нехай маємо шість пар спостережень виду (xi ; yi): (2, 8); (12, 14); (7, 7); (10, 4); (4, 1); (12, 8). Тоді D1 = 6, D2 = 2, D3 = 0, D4 = -6, D5 = -3, D6 = -4. | D 1 |=6, | D 2 |=2, | D 3 |=0, | D 4 |=6, | D 5 |=3, | D 6 |=4. За винятком пари №3 (| D 3 |=0) залишається 5 пар. Запишемо значення | D і | в ряд по зростанню значень:
2, 3, 4, 5, 6, 6. (1)
Числу
2 припишемо ранг 1, числу 3 – ранг 2, числу
4 – ранг 3. Тоді числам 6 і 6 будуть
відповідати ранги 4 і 5, тобто кожному з
них припишемо ранг, рівний середньому
арифметичному їх рангів:
.
Далі кожному рангу припишемо знак
різниці, якій даний ранг відповідає. В
ряді (1) числу 2 буде приписано ранг (+1)
(D2
0), числу 3 - ранг (- 2) (D5
0), числу 4 - ранг (- 3) (D6
0), числу 6 – ранг (+ 4,5) (D1
0), числу 6 – ранг (- 4,5) (D4
0). Процес приписування рангів Ri
в даному прикладі представимо у формі
таблиці.
Таблиця 3.11
Номера пар (xi , yi) |
1 |
2 |
3 |
4 |
5 |
6 |
Значення xi Значення yi |
2 8 |
12 14 |
7 7 |
10 4 |
4 1 |
12 8 |
xi - yi = D i | D і | |
+ 6 6 |
+ 2 2 |
0 |
- 6 6 |
- 3 3 |
- 4 4 |
Ранг | D і | |
4,5 |
1 |
|
4,5 |
2 |
3 |
R i |
+ 4,5 |
+1 |
|
- 4,5 |
- 2 |
- 3 |
Припущення. Для використання критерію Вілкоксона необхідно виконання наступних вимог: 1) вибірки випадкові і незалежні; 2) розглядувана властивість об`єктів розподілена неперервно в обох сукупностях, з яких зроблені вибірки; 3) розподіл кожної із змінних Х і Y симетричні (розподіл випадкової змінної Х симетрично відносно прямої Х = с, якщо Р (Х с – х ) = Р (Х с + х) для всіх можливих значень х); 4) пари значень (xi , yi) взаємно незалежні; 5) шкала вимірювань xi і yi повинна бути не нижче інтервальної.
Критерій Вілкоксона більш чутливий до вловлювання особливостей вимірювань в порівнянні із знаковим критерієм, оскільки його використання пов`язане не лише на врахуванні знаків різниць вимірювань xi і yi , але і на врахуванні абсолютних значень цих різниць.
Гіпотези. Припустимо, що закони розподілу випадкових змінних Х і Y однакові. Тоді виконується і наступна рівність Р (D i 0) = Р (D i 0), яка означає, що медіана всіх різниць D i рівна нулю. Критерій Вілкоксона і призначений для перевірки справедливості даної рівності. Нульова гіпотеза має вид: Н0 : медіана D i = 0 – медіана різниць вимірювань xi і yi рівна нулю. При використанні критерію Вілкоксона в якості альтернативної гіпотези вибирається гіпотеза Н1 : медіана D i 0.
Статистика критерію. Для перевірки гіпотез з допомогою критерію Вілкоксона на основі спостережень підраховується величина Т – статистика критерію. Припустимо, що із N пар спостережень (xi , yi) є кілька пар, в яких xi = yi. Такі пари при знаходженні значення Т не враховуються. Значення Т рівне сумі позитивних рангів (R i 0), присвоєних різницям D i.
Правило прийняття рішень. Розглянемо правило прийняття рішень при перевірці різного виду гіпотез.
1.
Двохсторонній
критерій.
Проводиться перевірка гіпотези Н0
:
медіана
D i
= 0 – при альтернативі Н1
: медіана D i
0. Для n
20 складена
таблиця (див. таблицю
В,
додатки), в якій для кожного значення n
дані критичні значення
і
статистики Т
для рівнів значимості = 0,10;
= 0,05;
= 0,02;
= 0,01.
При даному значені n
гіпотеза Н0
відхиляється
на рівні значимості , вказаному
для двостороннього критерію, якщо
спостережуване значення Тспостер
або Тспостер
. якщо вірна рівність
Т
,
то приходиться робити висновок про те,
що отримані спостереження не дають
достатніх підстав для відхилення
нульової гіпотези.
2.
Односторонній
критерій.
В ряді випадків отримані спостереження
або результати проведених раніше
досліджень призводять до висновку про
те, що існує деяка тенденція у
взаємовідносинах між значеннями змінних
Х
і Y,
а саме значення xi має
тенденцію переважати (або бути меншою)
значення yi.
В цих умовах доцільно замість двостороннього
критерію використати односторонній.
Якщо більша частина xi
переважає відповідні значення yi,
то проводиться перевірка гіпотези Н0
:
медіана
D i
0 – при альтернативі Н1
: медіана D i
0. Якщо Н1
справедлива, то можна зробити висновок
про те, що значення xi
переважають відповідні значення yi,
тобто значення вимірювальної властивості
суттєво вищі у об`єкта сукупності Х,
ніж у відповідного йому об`єкта сукупності
Y.
Для n
20 використовується
та ж
таблиця
В,
що і для двостороннього критерію. При
даному значені n
гіпотеза Н0
відхиляється
на рівні значимості , вказаному
для одностороннього критерію, якщо
спостережуване значення Т
.
В таблиці даються критичні значення Т
-
для рівнів значимості = 0,005;
= 0,01;
= 0,025;
= 0,05.
Якщо
yi
мають
тенденцію переважати по значенню
xi,
то проводиться перевірка гіпотези Н0
:
медіана
D i
0 – при альтернативі Н1
: медіана D i
0. При n
20 використовується
та ж
таблиця,
що і для двостороннього критерію. Для
даного значення n
Н0
відхиляється
на рівні значимості , вказаному
для одностороннього критерію, якщо
спостережуване значення Т
.
Таблиця критичних значень статистики критерію Вілкоксона побудована на основі біномінального розподілу. Для достатньо великих n біномінальний розподіл апроксимується нормальним. Наприклад, у випадку двостороннього критерію для n 20 критичні значення статистики Т - визначаються за формулою:
(3.2)
де
- квантиль нормального розподілу, який
відповідає імовірності
.
1. Випадок однієї вибірки.
Дані критерію: Нехай є серія вимірювань змінної Х, зроблена по інтервальній шкалі при розгляді однієї випадкової вибірки із деякої сукупності x1 , x2 , . . . , x i , . . . , x N . Розподіл Х в сукупності передбачається симетричним. В даних умовах критерій Вілкоксона може бути використаний для перевірки наступних гіпотез:
а). Двосторонній критерій. Н0 : медіана змінної Х = с (с – стала величина, яка має певне числове значення) – і альтернатива Н1 : медіана змінної Х с.
б). Односторонній критерій. Н0 : медіана змінної Х с – і альтернатива Н1 : медіана змінної Х с.
в). Односторонній критерій. Н0 : медіана змінної Х с – і альтернатива Н1 : медіана змінної Х с.
Критерій Вілкоксона може бути використаний і для перевірки гіпотез про середнє значення змінної Х, оскільки розподіл змінної Х передбачається симетричним, і, відповідно, медіана змінної Х рівна середньому значенню змінної Х.
Приклади використання критерію.
Приклад 1. Критерій Вілкоксона використовувався для виявлення впливу циклу з восьми короткотривалих фронтальних лабораторних робіт (КФЛР) з розділу електрика, які проводилися після вивчення даної теми, під час вивчення за традиційною методикою, на рівень засвоєння основних понять даної теми. Перевірка засвоєння понять проводилась за допомогою 15 контрольних завдань, розрахованих на середнього учня. Робота виконувалась дворазово одними і тими самими 20 учнями – до і після проведення циклу КФЛР. Виконання роботи кожним учнем оцінювалось кількістю вірних відповідей, тобто в даному експерименті оцінки учнів приймали значення від 0 до 15. В умовах даного експерименту можливе використання критерію Вілкоксона для виявлення значущості різниці у знаннях учнів до і після проведення циклу КФЛР, так як виконані всі припущення даного критерію. Результати дворазового виконання роботи 20 учнями запишемо у вигляді таблиці, в яку внесемо усі обчислення, необхідні для визначення статистики критерію. Перевірялась гіпотеза Н0 : медіана Di 0 – виконання циклу короткотривалих лабораторних робіт з розділу електрика не поліпшує знання учнів. Зміст даного циклу дозволяє обґрунтовано передбачити, що стан знань учнів має підвищитись після його виконання. Тому альтернативна гіпотеза формулюється наступним чином Н1 : виконання даного циклу короткотривалих фронтальних лабораторних робіт підвищує стан знань учнів з розділу електрика (Н1 : медіана Di 0).
Таблиця 3.12
Результати дворазового виконання учнями роботи
Учні № за порядком |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
Кількість вірних відповідей під час першої перевірки |
8
|
4 |
10 |
8 |
7 |
11 |
10 |
8 |
7 |
13 |
10 |
8 |
9 |
9 |
13 |
10 |
10 |
7 |
9 |
12 |
Кількість вірних відповідей під час другої перевірки |
10 |
6 |
14 |
12 |
10 |
11 |
12 |
7 |
10 |
15 |
13 |
10 |
9 |
12 |
14 |
11 |
10 |
10 |
11 |
13 |
Різниця балів оцінок |
2 |
2 |
4 |
4 |
3 |
0 |
2 |
-1 |
3 |
2 |
3 |
2 |
0 |
3 |
1 |
1 |
0 |
3 |
2 |
1 |
Ранг абсолютного значення різниці | D і | |
7,5 |
7,5 |
16,5 |
16,5 |
13 |
|
7,5 |
2,5 |
13 |
7,5 |
13 |
7,5 |
|
13 |
2,5 |
2,5 |
|
13 |
7,5 |
2,5 |
R i |
7,5 |
7,5 |
16,5 |
16,5 |
13 |
|
7,5 |
-2, 5 |
13 |
7,5 |
13 |
7,5 |
|
13 |
2,5 |
2,5 |
|
13 |
7,5 |
2,5 |
У даних умовах використовується односторонній критерій Вілкоксона для n 20. Підраховуємо значення статистики критерію Т, яке дорівнює сумі додатних значень Ri. У даному випадку:
Т=7,5+7,5+16,5+16,5+13+7,5+13+7,5+13+7,5+13+2,5+2,5+13+7,5+2,5=150,5
З 20 пар три пари значень змінних мають різницю, яка дорівнює нулю, тобто n = 20-3=17. Для n = 17 і рівня значущості = 0,05 таблиця В дає для випадку використання одностороннього критерію Вілкоксона критичне значення статистики Т = 111. Тобто виконується нерівність Тспостер Ткр. (150,5111). Відхиляємо на рівні значущості = 0,05 нульову і приймаємо альтернативну гіпотезу. Таким чином, на основі результатів експерименту з достовірністю =1- = 0,95 є справедливим висновок про поліпшення знань учнів за темою “Електрика” після проведення циклу короткотривалих фронтальних лабораторних робіт за даною темою.
Приклад 2. Вивчався вплив перегляду деякого діафільму на рівень засвоєння певного поняття. Перевірка засвоєння поняття проводилась з допомогою 10 контрольних завдань, розрахованих на середнього учня. Робота виконувалась двічі одними і тими ж 12 учнями – до перегляду і після. Виконання роботи кожним учнем оцінювалось кількістю правильних відповідей.
В умовах даного експерименту можливе використання критерію Вілкоксона для вияснення залежності відмінностей в знаннях учнів до і після перегляду діафільму. Результати двократного виконання роботи 12 учнями запишемо у вигляді таблиці, в яку занесемо всі обрахунки, необхідні для визначення статистики критерію.
Таблиця 3.13
Результати дворазового виконання учнями роботи
Учні № за порядком |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Кількість вірних відповідей під час першої перевірки |
3 |
8 |
5 |
4 |
2 |
1 |
6 |
7 |
1 |
3 |
4 |
2 |
Кількість вірних відповідей під час другої перевірки |
4 |
8 |
6 |
2 |
6 |
3 |
6 |
10 |
6 |
10 |
7 |
8 |
Різниця балів оцінок |
1 |
0 |
1 |
-2 |
4 |
2 |
0 |
3 |
5 |
7 |
3 |
6 |
Ранг абсолютного значення різниці | D і | |
1,5 |
|
1,5 |
3,5 |
7 |
3,5 |
|
5,5 |
8 |
10 |
5,5 |
9 |
R i |
1,5 |
|
1,5 |
- 3,5 |
7 |
3,5 |
|
5,5 |
8 |
10 |
5,5 |
9 |
Перевіряється гіпотеза Н0 : медіана Di 0 – перегляд діафільму не поліпшує стану знань учнів. Зміст діафільму дозволяє обґрунтовано передбачити, що стан знань учнів має підвищитись після його перегляду. Тому альтернативна гіпотеза формулюється наступним чином Н1 : перегляд діафільму підвищує стан знань учнів (Н1 : медіана Di 0). У даних умовах використовується односторонній критерій Вілкоксона для n 20. Підраховуємо значення статистики критерію Т, яке дорівнює сумі додатних значень Ri. У даному випадку: Т=1,5+1,5+7+16,5+3,5+5,5+8+7,5+10+5,5+9=51,5. З 12 пар дві пари значень змінних мають різницю, яка дорівнює нулю, тобто n = 12-2=10. Для n = 10 і рівня значущості = 0,05 таблиця В дає для випадку використання одностороннього критерію Вілкоксона критичне значення статистики Т - = 44. Тобто виконується нерівність Тспостер Ткр. (51,544). Відхиляємо на рівні значущості = 0,05 нульову і приймаємо альтернативну гіпотезу. Таким чином, на основі результатів експерименту з достовірністю =1- = 0,95 є справедливим висновок про поліпшення стану знань учнів після перегляду діафільму.