Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1362.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
3.43 Mб
Скачать

3. Елементи дисперсійного аналізу

3.1 Початкові поняття

Дисперсійний аналіз - це статистичний метод обробки результатів вимірювань, які залежать від різних діючих одночасно факторів. Цей метод застосовують для з'ясування питання про суттєвість впливу того чи іншого фактора на вимірювану величину. В залежності від кількості факторів, що вивчаються, розрізняють однофакторпий. двофакторний і багатофакторний дисперсій-ний аналіз.

Методи однофакторного дисперсійною аналізу можна, наприклад, застосувати для перевірки впливу на продуктивність праці такого якісного фактора, як організація виробництва на кількох однотипних підприємствах. Число рівнів цього фактора дорівнює чисту підприємств (кількість способів організації виробництва).

Методи двофакторного дисперсійного аналізу застосовуються для виявлення ступеня впливу на врожайність деякої сільськогоспо-дарської культури таких факторів, як сорт культури і варіант (спосіб) удобрювання. Число рівнів першого і другого факторів дорівнює відповідно числу засіяних сортів культури і числу можливих варіантів.

3.2 Однофакторний аналіз

Сформулюємо задачу однофакторного дисперсійного аналізу для випадку рівного числа вимірювань на кожному рівні фактору. Нехай розподілена за законом Гауса випадкова величина X вимірюється разів та нехай має місце рівнів досліджуваного фактора. На кожному рівні проводиться вимірювань (спостережень). Тоді можливі результати вимірювань

можна розбити на груп - теоретичних (випадкових) виборок

,

,

...........................

,

де 1-й індекс є номер спостереження, 2-й – номер виборки (рівня). Припускається, що кожна з цих виборок має рівні, але невідомі дисперсії та математичні сподівання .Перевіряється гіпотеза рівність середніх, зміст якої полягає у тому, що фактор не впливає на розподіл випадкових величин .

Позначимо через

(1)

середнє на -му рівні,

(2)

загальне вибіркове середнє.

Основна тотожність однофакториого дисперсійного аналізу має вигляд:

, (3)

або , де доданок є сумою квадратів різниць між середніми рівней та загальною середньою . Доданок називається сумою квадратів відхилень між групами та характеризує розбіжність між рівнями, вплив фактора.

Доданок - сума квадратів різниць між

окремими спостереженнями та середньою -го рівня називається сумою квадратів внутришньогрупових відхилень та характеризує розкид всередині груп.

Суму з лівої частини (3) називають загальною сумою вкадратів відхилень.

Знаючи суми квадратів відхилень, можна отримати оцінки відповідних дисперсій:

, (4)

які називаються факторною, залишковою та загальною дисперсією. В знаменниках формул (4) стоять числа ступенів свободи. Число ступенів свободи визначається, як загальне число спостережень мінус число рівнянь, яке їх пов’язує. Тому для число ступенів свободи , оскільки для його обчислення використовують групових середніх, пов’язаних між собою рівнянням (2). Для число ступенів свободи , оскільки для його обчислення використовують всі спостережень, пов’язаних між собою рівняннями (1)

Можна показати, що у випадку справедливості гіпотези (рівність середніх) статистики , , є спроможними, незсуненими оцінками невідомої дисперсії . Тому та

не відрізняються суттєво одна від іншої, а їх відношення

близьке до одиниці. Якщо гіпотеза невірна (значний вплив фактора), то факторна дисперсія значуще більша ніж залишкова дисперсія , а їх відношення суттєво більше одиниці, Таким чином: питання про справедливість гіпотези зводиться до питання про справедливість гіпотези про рівність залишкової і факторної дисперсій.

Для порівняння дисперсій (розділ 2.5) застосовують статистичний критерій Фішера

(5)

з та ступенями свободи.

Результати спостережень доцільно подати у вигляді таблиці1.

Таблиця 1.  

Номер вибірки

(рівень фактора)

Спостереження

Сума

Групова

середня

1

2

m

Всього

Обчислення зважених сум квадратів, що входять до s2, , зручно проводити за формулами:

, , ,

де , , .

Розрахунок оцінок дисперсій зручно оформити у вигляді таблиці 2, що називається таблицею дисперсійного аналізу.

Таблиця 2

Складові

Дисперсії

Зважена сума

Квадратів

Число cтупе-нів свободи

свободи

Оцінка

дисперсії

Міжгрупова

(факторна)

В–C

m1

Внутрішньогрупова

(залишкова)

АВ

m (n–1)

Повна

(загальна)

А–C

m n –1

s2

Приклад 1. Нехай є 4 партії сировини для текстильної промисловості. З кожної партії відібрано по 5 зразків та проведено випробування на визначення величини розривного навантаження. Результати випробувань наведені в таблиці. Перевірити при рівні значущості 0.1 гіпотезу про рівність середніх. Припускається, що вимірювана величина розподілена за законом Гауса.

Розв’язання. Заповнимо таблицю 3:

Таблиця 3.  

Рівень

фактора

Спостереження

Об’єм

вибірки

Сума

Групова

середня

1

200, 140, 170, 145, 165

5

T1=820

2

190, 150, 210, 150, 150

5

T2=850

3

230, 190, 200, 190,200

5

T3=1010

4

150, 170, 150, 170, 180

5

T4=820

Всього

mn=20

G=3500

Обчислимо суми квадратів спостережень:

  1. A=100[(202+142+172+14.52+16.52)+(192+152+212+152+152)+(232+192+202+192 +202)+(152+172+152+172+182)]=624750;

  2. B= =617480;

  3. C= =612500.

Тоді Q =B-C=4980, =7270, =12250.

Заповнимо тепер таблицю 4 дисперсійного аналізу.

Таблиця 4

Складові

дисперсії

Зважена сума

квадратів

Число ступенів

свободи

Оцінка

дисперсії

Міжгрупова

4980

3

1660

Внутрішньогрупова

7270

16

454.4

Повна

12250

19

644.7

Перевірка гіпотези : 1) =0.1. 2) =3, =16. За таблицею 4 визначаємо = (0.05, 3, 16) = 3.24, =(3.24; + ). 3) За формулою (5) = =1660/454.4=3.65. 4). гіпотеза відхиляється. Для різних партій сировини розривне

навантаження різне.

n

1

24

34

30

2

26

30

28

3

25

31

27

4

27

29

30

5

28

32

29

Приклад 2 Нехай 3 вибірки (рівня фактора) одержані з нормальних генеральних сукупностей з рівними дисперсіями. Перевірити гіпотезу про рівність середніх при рівні значущості =0.05.

Розв’язання. Заповнимо таблицю 3:

Таблиця 3.  

Рівень

фактора

Спостереження

Об’єм

вибірки

Сума

Групова

середня

1

24, 26, 25, 27, 28

5

T1=130

=26

2

34, 30, 31, 29, 32

5

T2=156

=31.2

3

30, 28, 27, 30,29

5

T3=144

=28.8

Всього

mn=15

G=430

=143.3

Обчислимо суми квадратів спостережень:

  1. A=(242+262+252+272+282)+(242+302+312+292+322)+(302+282+272+302 +292)=12426;

  2. B= =12394.4;

  3. C= =12326.7.

Тоді Q =B-C=33.9, =31.6, =99.3

Заповнимо тепер таблицю 4 дисперсійного аналізу.

Таблиця 4

Складові

дисперсії

Зважена сума

квадратів

Число ступенів

свободи

Оцінка

дисперсії

Міжгрупова

67.8

2

33.9

Внутрішньогрупова

31.6

12

2.6

Повна

99.3

14

7.1

Перевірка гіпотези : 1) =0.05. 2) =2, =12. За таблицею

4 визначаємо = (0.025, 2, 12) = 5.10, =(5.10; + ). 3) За формулою (5) = =33.9/2.6=13.04.

4). гіпотеза відхиляється.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]