
- •Лекція № 15
- •Питання лекції:
- •1*. Порівняння декількох середніх. Поняття про дисперсійний аналіз
- •2*. Загальна факторна і залишкова суми квадратів відхилень
- •3*. Зв’язок між загальною, факторною і залишковою сумами
- •4*. Загальна, факторна і залишкова дисперсії
- •5*. Порівняння декількох середніх методом дисперсійного аналізу
- •6*. Неоднакове число випробувань на різних рівнях
3*. Зв’язок між загальною, факторною і залишковою сумами
Покажемо, що
Для
спрощення висновку обмежимося двома
рівнями
і двома випробуваннями на кожному рівні
.
Результати випробувань представимо у
вигляді таблиці.
-
Номер випробування
Рівні фактора
Тоді
.
Віднімемо і додамо до кожного спостережуваного значення на першому рівні групову середню , а на другому – . Виконавши підведення до квадрату і враховуючи, що сума всіх подвоєних добутків дорівнює нулю, отримаємо
.
Отже,
.
Слідство. З отриманої рівності витікає важливе слідство:
.
Звідси видно, що немає потреби безпосередньо обчислювати залишкову суму: достатньо знайти загальну і факторну суми, а потім їх різницю.
4*. Загальна, факторна і залишкова дисперсії
Розділивши суми квадратів відхилень на відповідне число ступенів свободи, отримаємо загальну, факторну і залишкову дисперсії:
,
,
,
де
– число, рівнів фактора;
– число спостережень на кожному рівні;
– число степенів свободи загальної
дисперсії;
– число степенів свободи факторної
дисперсії;
– число степенів свободи залишкової
дисперсії.
Якщо нульова гіпотеза про рівність середніх справедлива, то всі ці дисперсії є незміщеними оцінками генеральної дисперсії. Наприклад, враховуючи, що об’єм вибірки укладаємо, що
– виправлена вибіркова дисперсія, яка, як відомо, є незміщеною оцінкою генеральної дисперсії.
Зауваження.
Число степенів свободи
залишкової дисперсії дорівнює різниці
між числами степенів свободи загальної
і факторної дисперсій. Дійсно
.
5*. Порівняння декількох середніх методом дисперсійного аналізу
Треба перевірити при заданому рівні значущості нульову гіпотезу про рівність декількох середніх нормальних сукупностей з невідомими, але однаковими дисперсіями. Покажемо, що розв’язок цієї задачі зводиться до порівняння факторної і залишкової дисперсій по критерію Фишера – Снедекора.
1. Нехай нульова гіпотеза про рівність декількох середніх (надалі називатимемо їх груповими) правильна. В цьому випадку факторна і залишкова дисперсії є незміщеними оцінками невідомої генеральної дисперсії і, отже, розрізняються незначущо. Якщо порівняти ці оцінки по критерію , то очевидно, критерій вкаже, що нульову гіпотезу про рівність факторної і залишкової дисперсій слід прийняти.
Таким чином, якщо гіпотеза про рівність групових середніх правильна, то вірна і гіпотеза про рівність факторної і залишкової дисперсій.
2. Нехай
нульова гіпотеза про рівність групових
середніх помилкова. В цьому випадку із
зростанням расхождения між груповими
середніми збільшується факторна
дисперсія, а разом з нею і відношення
.
У результаті
виявиться більше
і, отже, гіпотеза про рівність дисперсій
буде знехтувана.
Таким чином, якщо гіпотеза про рівність групових середніх помилкова, то помилкова і гіпотеза про рівність факторної і залишкової дисперсій.
Легко довести від протилежного справедливість зворотних тверджень: з правильності (помилковості) гіпотези про дисперсії слідує правильність (помилковість) гіпотези про середні.
Отже, для того, щоб перевірити нульову гіпотезу про рівність групових середніх нормальних совокупностей з однаковими дисперсіями, достатньо перевірити по критерію нульову гіпотезу про рівність факторної ізалишкової дисперсій. В цьому і полягає метод дисперсійного аналізу.
Зауваження 1. Якщо факторна дисперсія виявиться менше залишкової, то вже звідси слідує справедливість гіпотези про рівність групових середніх і, значить, немає потреби вдаватися до критерію .
Зауваження
2. Якщо
немає впевненості в справедливості
предположення про рівність дисперсій
розглядаваних
сукупностей, то це припущення слід
перевірити заздалегідь, наприклад по
критерію Кочрена.
Приклад.
Проведено по
випробування на кожних з трьох рівнів.
Результати випробувань приведені в
таблиці. Методом дисперсійного аналізу
при рівні значущості
перевірити нульову гіпотезу про рівність
группорых середніх. Передбачається, що
вибірки витягнуті з нормальних
Номер випробування |
Рівні фактора |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
совокупностей з однаковими дисперсіями.
Розв’язання.
Для спрощення розрахунку віднімемо
з кожного спостережуваного значення:
.
Складемо розрахункову таблицю.
Користуючись
таблицею і враховуючи, що число рівнів
фактора
,
число випробувань на кожному рівні
,
знайдемо загальну і факторну суми
квадратів відхилень:
;
.
Знайдемо залишкову суму квадратів відхилень:
.
Знайдемо факторну і залишкову дисперсії:
;
Номер випробування |
Рівні фактора |
Підсумковий стовпець |
|||||
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

Порівняємо
факторну і залишкову дисперсії по
критерію
,
для чого знайдемо спостережуване
значення критерію:
.
Враховуючи, що
число ступенів свободи чисельника
,
а знаменника
і рівень значущості
,
по таблиці знаходимо критичну точку:
.
Оскільки
– нулевую гіпотезу про рівність групових
середніх відкидаємо. Іншими словами,
групові середні «в цілому» розрізняються
значущо. Якщо вимагається порівняти
середні попарно, то слід скористатися
критерієм Стьюдента.
Зауваження
3. Якщо
спостережувані значення
– десяткові дроби з одним знаком після
коми, то доцільно перейти до чисел
,
де
– приблизно середнє значення чисел
.
В підсумку отримаємо порівняно невеликі
цілі
числа. Хоча при цьому факторна і залишкова
дисперсія збільшуються в
разів, їх відношення не зміниться.
Наприклад; якщо
,
,
,
то, прийнявши
,
отримаємо:
,
,
.
Аналогічно
поступають, якщо після коми є
знаків:
.