- •Міністерство освіти і науки україни
- •Криворізький технічний університет
- •Кафедра моделювання та програмного забезпечення
- •Методичні вказівки
- •Укладач: о.В. Мовчан Редагували: є.О. Гуляєв, а.А. Козиков
- •Список лабораторних робіт
- •Лабораторна робота № 1.
- •Лабораторна робота № 2.
- •Лабораторна робота № 3.
- •Лабораторна робота № 4.
- •Лабораторна робота № 5.
- •Лабораторна робота № 6.
- •Лабораторна робота № 7.
- •Лабораторна робота № 8.
- •Лабораторна робота № 9.
- •Лабораторна робота № 10.
- •Список використаної літератури
Лабораторна робота № 5.
Тема: Однофакторний дисперсійний аналіз.
Завдання: скласти програму для однофакторного дисперсійного аналізу.
Доповнення: як невелике дослідження можна підготувати тестові дані для даної програми в одному з наступних напрямків: чи впливає колір очей на рівень успішності в інституті, чи впливають оцінки по точних науках у школі на успішність в інституті або наприклад зрівняти рівень інтелекту декількох студентів, об'єднаних у групи, попередньо провівши тест на рівень ІQ.
Теоретичні відомості
Дисперсійний аналіз є одним з методів факторного аналізу. Ціль факторного аналізу: при побудові опису і моделюванні випадкових процесів виділити фактори, які істотно впливають на результат процесу, і проігнорувати всі інші. У досить загальному виді завдання однофакторного дисперсійного аналізу можна поставити в такий спосіб: нехай ми спостерігаємо m незалежних нормально розподілених величин X1,X2,…,Xm, припускаючи, що всі вони мають одне й те саме середнє квадратичне відхилення σ. Центри розподілу цих величин v1,v2,…,vm, взагалі різні. Нехай над кожною змінною виробляється деяка серія з n спостережень . Дані і-ої серії нехай будуть:
Xi1,Xi2,…,Xin (i=1,2,…,m).
Опираючись на ці статистичні дані, ми бажаємо перевірити нульову гіпотезу, відповідно до якої v1=v2=…=vm. Якщо гіпотеза вірна, то зіставивши середні в кожній серії, ми не повинні одержати значимої розбіжності між ними.
Нехай, наприклад, при спільному аналізі точності групи вимірювальних приладів - подвійних мікроскопів - нас цікавить питання про те, чи можна вважати їхні систематичні помилки однаковими. Інакше кажучи, ми хочемо перевірити вплив одного фактора(систематичні помилки) - приладу на погрішність показань.
Нехай число приладів буде m і кожним приладом ми вимірюємо чистоту поверхні того самого зразка в певному місці n раз. Ці n вимірів ми розглядаємо як випадкову вибірку з генеральної сукупності показань кожного приладу. Усього ми маємо mхn вимірів, які позначимо через Xij, де i- є номер приладу і j- номер зробленого на ньому випробування, так що i змінюється від 1 до m, а j – від 1 до n.
Таблиця вимірів результатів буде мати наступний вигляд:
№ приладу |
№ виміру |
||||
1 |
2 |
3 |
… |
n |
|
1 |
X11 |
X12 |
X13 |
… |
X1n |
2 |
X21 |
X22 |
X23 |
… |
X2n |
3 |
X31 |
X32 |
X33 |
… |
X3n |
… |
… |
… |
… |
… |
… |
m |
Xm1 |
Xm2 |
Xm3 |
… |
Xmn |
В такий спосіб всі спостереження групуються. У кожній групі представлені спостереження отримані при певних значеннях у діапазоні значеннь досліджуваного фактору. Потім обчислюється міжгрупова і внутрішньогрупова дисперсія.
Розрахункові формули:
-
Міжгрупова дисперсія:
-
Внутрішньогрупова дисперсія:
, де m – кількість груп;
i – номер групи;
Ni – кількість спостережень в i-ій групі;
– середнє по i-ій групі;
– середнє значення по всій таблиці;
n – загальна кількість спостережень в таблиці;
j – номер стовпця в таблиці;
Xij – jе спостереження в iій групі
-
Обчислення критерія Фішера:
Обчислене значення порівнюється з табличним значенням. При цьому обчислюються ступені свободи k1,k2 :
k1=m-1; k2=n-m;
Результат:
Якщо F>Fтабл., то досліджуваний фактор істотно впливає на результат процесу, інакше досліджуваний фактор не впливає на результат процесу.
Застосовуючи зазначений спосіб аналізу, варто обережно ставитися до тлумачення остаточних результатів, пам'ятаючи, що вони спираються в істотній мері на допущення:
-
нормальності розподілу;
-
тотожності дисперсій.
Кожне із цих допущень вимагає перевірки, заснованої на ретельному аналізі зроблених експерементів, або якщо істотність розбіжностей між середніми не виявлена й нульова гіпотеза одержала підтвердження, варто пам'ятати, що це зроблено лише по наявному досвідченому матеріалі й, головне, при тім угрупованні матеріалу, якого ми дотримувалися в цьому випадку.
Тестовий приклад:
Припускаючи, що довговічність електричної лампи має нормальний розподіл і розходження в матеріалі або технології впливають на середні значення. Розглянемо дані, показані в таблиці, що представляють проби, узяті із чотирьох партій, виготовлених з різних матеріалів.
-
№ партії
Тривалість горіння в годинах
1
1600
1610
1650
1680
1700
1700
1800
2
1580
1640
1640
1700
1750
3
1460
1550
1600
1620
1640
1660
1740
1820
4
1510
1520
1530
1570
1600
1680
Кількість спостережень в таблиці = 26
Ступені свободи:
K1=3;
K2=22;
Міжгрупова дисперсія D1 = 2316,3432
Внутрішньогрупова дисперсія D2 = 6822,44
F=0,3395; Fтабл. = 4.87;
Висновок: F< Fтабл. тому можна зробити висновок, що досліджуваний фактор не впливає істотно на тривалість горіння ламп.