- •Державний вищий навчальний заклад донецький національний технічний університет
- •Логіка та методи наукових досліджень
- •Інформаційне забезпечення наукових досліджень
- •Гіпотези і доведення у наукових дослідженнях
- •Двовибіркові t-тести Стьюдента
- •Методологічні основи статистичного моделювання та прогнозування
- •Моделювання та прогнозування динаміки
- •Основи моделювання взаємозв’язків
- •Множинна регресія в соціально-економічних дослідженнях
- •Моделювання причинних комплексів
- •Науковий результат: зміст і порядок оформлення
Двовибіркові t-тести Стьюдента
Другий тип задач пов'язаний з порівнянням параметрів двох сукупностей.
Приклад. Ведеться вибіркове обстеження продуктивності праці двох груп робітників, які виготовляють один і той же виріб на верстатах, модернізованих за різними проектами. Перша група працює на верстатах, модернізованих за проектом А, друга - за проектом Б(п1=n2=8). Погодинний виробіток робітників становить, виробів:
Проект А |
10 |
12 |
15 |
11 |
12 |
9 |
14 |
13 |
Проект Б |
8 |
10 |
12 |
9 |
10 |
8 |
11 |
12 |
Вибіркові оцінки середніх і дисперсій за групами:
= 12 штук при s2 = 4,00;
= 10 штук при s2= 2,57.
Різниця між середніми (-) = (12 - 10) = 2 вироби.
Потрібно визначити, чи істотна розбіжність середніх, тобто чи зумовлена вона різною ефективністю проектів модернізації чи випадкова.
Нульова гіпотеза формулюється на припущенні, що розбіжності середніх випадкові Н0: =.Альтернативна гіпотеза передбачає, що проект А ефективніший: На: >. При такому формулюванні На проводиться одностороння (правостороння) перевірка.
Тестування гіпотези Hо можна виконати за допомогою критерію Стьюдента з числом ступенів свободи df= n1 + п2 - 2. Вибіркове значення t-тесту обчислюється діленням розбіжності вибіркових середніх на стандартну похибку розбіжності , яка дорівнює сумі стандартних похибок цих середніх
,
У нашому прикладі стандартна похибка розбіжності середніх дорівнює
а вибіркове значення t –тесту:
Для числа ступенів свободи df= 8 + 8 - 2 = 14 критичне значення одностороннього критерію t0,05(14) = 1,76. Оскільки фактичне значення перевищує критичне (2,20 >1,76), нульова гіпотеза відхиляється, і з імовірністю 0,95 можна стверджувати, що розбіжності середніх невипадкові, тобто проект модернізації верстатів А ефективніший за проект Б.
Оцінка розбіжності середніх дещо змінюється, коли ряди спостережень утворюють пари. Така ситуація виникає у повторних обстеженнях типу «до - після», скажімо, до і після регулювання пристрою, зміни умов праці, зміни законодавства тощо. У таких випадках два ряди попарно зв'язаних даних замінюються одним рядом відхилень між ними Дисперсія і стандартна похибка цих відхилень визначаються за такими формулами
Дисперсійний аналіз
Розглянутий метод двовибіркового тестування розбіжностей середніх перетинається з методом дисперсійного аналізу, в якому аналогічна нульова гіпотеза висувається не для двох, а для m - вибірок, кожна з яких представляє ідентифіковану у певний спосіб групу: Н0:х1 = х2 - ...хт. Тестування такої гіпотези ґрунтується на порівнянні дисперсій, звідси і назва методу Дисперсійний аналіз.
Сутність дисперсійного аналізу полягає в декомпозиції варіації показника за джерелами формування. Кількість джерел варіації залежить від кількості факторів, за якими виокремлено групи. В однофакторному дисперсійному аналізі (скорочено ANOVA) виокремлюються дві компоненти варіації:
міжгрупова, зумовлена дією фактору, покладеного в основу групування;
внутрішньогрупова, випадкова варіація.
Основну тотожність однофакторного дисперсійного аналізу можна подати як взаємозв'язок між сумами квадратів відхилень:
де Q - сума квадратів відхилень окремих спостережень Хij від загальної середньої х ;
Qв - сума квадратів відхилень групових середніх від загальної (betwееп);
Qw - сума квадратів відхилень окремих спостережень Хij всередині груп від групових середніх (within);
nj- - кількість спостережень у j-й групі; т - кількість груп, п = пjm - загальна кількість спостережень.
На основі сум квадратів відхилень розраховуються три оцінки дисперсій за джерелами варіації:
загальна
міжгрупова
внутрішньогрупова
Знаменники оцінок дисперсії є ступенями свободи відповідних джерел варіації. Очевидно, вони співвідносяться так само, як суми квадратів відхилень:
Перевірка нульової гіпотези в однофакторному дисперсійному аналізі ґрунтується на співвідношенні міжгрупової і внутрішньогрупової варіації (в розрахунку на одну ступінь свободи). F-тест показує, у скільки разів оцінка міжгрупової варіації перевищує випадкову
Схема однофакторного дисперсійного аналізу подана в табл. 4.3.1.
Критичні значення. F-тесту для рівня істотності, а визначаються співвідношенням чисел ступенів свободи чисельника (т -1) і знаменника (n - т). Процедура тестування стандартна: коли нульова гіпотеза відхиляється. Якщо , підстав для відхилення нульової гіпотези немає.