Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пiдручник3_prn.doc
Скачиваний:
205
Добавлен:
16.11.2019
Размер:
18.08 Mб
Скачать

5.13 Підготовка даних для статистичного аналізу

У період підготовки даних до статистичного аналізу проводять попередню їх обробку. Для отримання достатньо точних даних необхідно, щоб дослідні дані мали три значущі цифри.

Під час аналізу малих вибірок зустрічаються окремі значення варіюючої ознаки, які різко відрізняються від інших і викликають сумніви щодо належності їх до даної вибірки. Бракування сумнівних даних (дат) допускається за умови статистич­ного обґрунтування того, що відхилення, отримане в умовах, різко відмінних від умов проведення досліджень інших варіантів, що умови не суперечать меті досліду або є результатом грубої похибки. Бракування сумнівних даних (дат) можливе за проведення досліду не менш як у чотириразовій повторності і х1 х2, а хn-1≠хn.

Гіпотезу про належність сумнівних дат до даної сукупності у малих вибірках перевіряють за критерієм τ (табл. 5.10).

Таблиця 5.10 — Критичне значення критерію τ для 5%-го і 1%-го рівнів значущості

n

τ

n

τ

0,01

0,05

0,01

0,05

4

5

6

7

8

9

10

11

12

0,991

0,916

0,805

0,740

0,683

0,635

0,597

0,566

0,541

0,955

0,807

0,689

0,610

0,554

0,512

0,477

0,450

0,428

14

16

18

20

22

24

26

28

30

0,502

0,372

0,449

0,430

0,414

0,400

0,389

0,378

0,369

0,395

0,369

0,349

0,334

0,320

0,309

0,299

0,291

0,283

Критерій τ є відношенням різниці між сумнівною датою (х) і сусідньою з нею датою (хn) до розмаху варіювання з урахуванням 5%-го або 1%-го рівня значущості.

Критерій τ розраховують за формулою:

для х1: ;

для хn: .

Для розрахунку фактичного значення критерію τ варіанти розташовують у порядку збільшення х1, х2, …, хn-1, xn.Сумнівними звичайно бувають один або два крайні члени ряду, тобто х1 і xn, не викликають сумніву близькі до них варіанти х2 і xn-1. Із ними порівнюють х1 і xn. У наведених вище формулах різниці xn-1і xn2 характеризують розмах варіювання варіаційного ряду без крайніх значень, які викликають сумніви. Якщо τфакт ≥ τтеор, то варіанта відкидається, якщо τфакт < τтеор, то варіанта залишається і нульова гіпотеза про належність її до даної сукупності не відкидають.

Відновлення дат, які випали. Встановивши причини випадання дат (х), їх відновлюють за формулою: ,

де L – число варіантів; V – сума дат у варіанті, який випав; n – число повторень; p – сума дат у повторенні, де є випадання; Σх – сума дат в усьому досліді, за винятком дати, що випала.

Оброблені дані записують у таблиці і вибирають метод статистичного аналізу та комп’ютерну програму.

5.13.1. Дисперсійний аналіз

Під час планування досліджень, обробки й аналізу їх результатів застосовують дисперсійний аналіз. Слово «дисперсія» означає розсіювання даних досліду і розчленування загального варіювання результатів досліджень на складові. Основою дисперсійного аналізу є співвідношення двох дисперсій (дисперсії варіантів Sv2 і дисперсії похибки S2), яке дає критерій F (критерій Фішера) і дозволяє мати оцінку вірогідності різниць між середніми арифметичними або загальну оцінку вірогідності досліду.

Дисперсійний аналіз дає змогу виявити сумарну дію факторів, дію кожного фактора окремо, їх взаємодію, дати правильну, незміщену оцінку похибки експерименту. Він дозволяє оцінити методику і результати досліду в цілому, встановити різницю між варіантами і результатами дослідження у повтореннях.

За допомогою дисперсійного аналізу отримують:

1) дані, які характеризують загальне розсіювання або дисперсію;

2) факторіальну дисперсію;

3) залишкову дисперсію, яка пов’язана з невідомими експериментатору випадковими неорганізованими у даному експерименті факторами.

Дисперсійний аналіз дає можливість розділити загальне варіювання експериментальних даних на складові: дію варіантів (Сv), повторень (Cp) і випадкових (основних) або залишкових варіювань (Cz).

Метою дисперсійного аналізу є розкладання загальної суми квадратів відхилень загального числа ступенів свободи на частини – компоненти, які відповідають структурі експерименту, і оцінці значущості дії та взаємодії досліджуваних факторів за F-критерієм. Суму квадратів розкладають на три частини: варіювання повторень Cp, варіантів Сv і випадкове Cz. Загальну мінливість і загальне число ступенів свободи записують як:

;

.

При проведенні дисперсійного аналізу результатів досліду з L-варіантами, які розташовані рендомізовано, і n-повтореннями послідовно вираховують суми за повторенням Р і варіантам V, загальну суму всіх спостережень N=Ln, коригуючий фактор (поправка) Cy=(Σx)2:N, загальну суму квадратів Cy=Σx2-C, суму квадратів для повторень Cp=ΣP2:L-C, суму квадратів для варіантів Cv=ΣV2:n-C, суму квадратів для похибки (залишок) Cz=Cy-Cp-Cv. Суму квадратів Cv і Cz ділять на відповідні їм ступені свободи, внаслідок чого отримують два середніх квадрати (дисперсії) варіантів:

;

похибки: .

Після цього складають таблицю дисперсійного аналізу (табл. 5.11).

або - коригуючий фактор (поправка).

Таблиця 5.11 — Таблиця дисперсійного аналізу

Дисперсія

Сума квадратів

Ступінь свободи

Середній квадрат

Fфакт

Fтеор

Загальна Су

Варіантів CV

Залишок Cz (похибки)

Σх2

ΣV2:n-C

Cy-Cv

N-1

L-1

N-1

-

S2V

S2

-

Sv2:S2

-

-

За таблицею

-

Оцінку значущості досліджуваних факторів проводять порівнянням дисперсії варіантів з дисперсією похибки за критерієм . Якщо , то нульова гіпотеза Н0:d=0 не відкидається. Між усіма вибірковими середніми немає істотних різниць. Нульова гіпотеза відкидається, якщо . НІР обчислюють з урахуванням рівня значущості. Комп’ютерні програми полегшують і прискорюють проведення статистичної обробки результатів досліджень.

Обробка аналітичних даних. Для обробки аналітичних даних відбирають зразки у не менше, як чотириразовій повторності з кожного варіанта. Визначають середнє арифметичне і середнє квадратичне відхилення: ,

де а – величина відхилення від середнього, n – число аналізів; середня похибка аналізу ; коефіцієнт варіації (%) ; точність аналізу (%) .

Визначення точності двох паралельних аналізів. Встановлюють довірчу ймовірність (0,95) і обчислюють статистичні характеристики (середній результат двох визначень, дисперсію, стандартне відхилення окремого результату, стандартне відхилення середнього результату), за таблицею Стьюдента-Фішера знаходять критерій Стьюдента (вірогідність 0,95, K=n-1, t0.95=12,7); точність визначення (у відносних відсотках) .

Порівняння результатів двох різних методів аналізу. Під час порівняння двох методів використовують таку схему розрахунку: наводять результати визначень xij i yij (i=1,2,…,n; j=1,2,…,m) двома різними методами, n зразків, кожний з яких проаналізовано m раз. За цими даними обчислюють за формулами (1-8) такі показники: середні результати аналізів (1); їх стандартні відхилення (2); умовні середні вмісту за методом (3); середні стандартні відхилення за методом (4), за умови однорідності і дисперсій ; різниці між повторювальними парами результатів (5); середню різницю вибірки (6); похибку середньої різниці (7); і отримане значення - критерію (8).

(1); (2);

(3); (4);

(5); (6);

(7); (8);

, якщо

, якщо (9);

(10).

Значимі розходження між методами оцінюють, порівнюючи tфакт з табличним значенням Т-критичної точки t-розподілу Стьюдента за рівної значущості а=0,05 і числі ступенів свободи n-1. Якщо tфакт >T розходження між аналізами вважають значущими. Аналогічно співставляють стандартні відхилення, які характеризують співпадіння результатів методів, за значеннями F-критерію (9), яке порівнюють з табличним значенням критичної точки F-розподілу Фішера (рівень значущості=0,95).