Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Statistika_Husak_VL_DG_2015_16_06_2015.doc
Скачиваний:
5
Добавлен:
01.07.2025
Размер:
2.9 Mб
Скачать

3.3. Неузгодженості у записах при використанні стандартної похибки середнього

Дуже часто в статтях і дисертаціях зустрічається запис «M ± m», який, як припускається, пояснює тип представлення даних. Автори під M розуміють середню арифметичну величину, а під m – стандартну похибку середнього. Втім, якщо немає деталізації, то лишається не зрозумілим, що саме дослідник вкладає у символи M та m. Для того, щоб запис не залишав сумнівів, ми рекомендуємо в публікаціях давати повне пояснення на кшталт «Всі значення представлені у вигляді середньої ± стандартне відхилення» (у англомовній літературі Mean ± Standart Deviation (M ± S.D.)) чи «Вибіркові характеристики представлені у вигляді середньої ± помилка середньої». (у англомовній літетарурі Mean ± Standart Error of Mean (M ± S.E.M. або M ± S.E.)).

Розділ 4. Аналіз даних, які випадають в ході досліджень (промахи і систематичні похибки)

Значення, які потрапляють у вибірку, можуть дуже істотно відрізнятись за величиною (неоднорідні дані). Візьмемо наш приклад зі зростом 992 осіб. Вибірка може виглядати по-різному: може включати осіб зі зростом 145, 147, 154 та 199 см, або 145, 165, 181 та 193 см. Звичайно, що у першій вибірці значення 199 см виглядає сумнівним, але зрозуміло, що помилку у вимірюванні зросту важко допустити. В таких випадках кажуть, що вибірка не є репрезентативною, тобто якимось чином у неї потрапили тільки люди низького росту.

Коли дослідник отримує неоднорідні дані, то завжди перед ним стоїть питання: які ж дані слід брати до уваги – одні чи інші? В такому випадку часто самовільно викидаються ті дані, які дослідник вважає невдалими – занадто великими, чи занадто малими, тобто малоправдоподібними. Але такий підхід є неправильним і часто приводить до хибності отриманих результатів.

Щоб таких помилок не було треба скористатись статистичними критеріями. Розглянемо деякі із них.

4.1. Критерій Шовене

Цей критерій для виключення промахів є досить простим. Для його обчислення, крім значень і s, потрібно знайти величину коефіцієнта u (різниця між найбільшою (або найменшою) варіантою і середнім арифметичним, поділена на стандартне відхилення):

(18)

або

(19)

Після цього обчислення отриманий коефіцієнт співставляють з критичним значенням uкр для n значень. Якщо uuкр, то це значення виключають із подальших обрахунків. Величини uкр наведені в таблиці 2.

Таблиця 2. Величини коефіцієнта uкр

n

uкр

n

uкр

n

uкр

3

1,61

10

1,96

17

2,19

4

1,64

11

2,00

18

2,20

5

1,68

12

2,03

20

2,24

6

1,73

13

2,07

22

2,28

7

1,79

14

2,10

24

2,31

8

1,86

15

2,13

26

2,36

9

1,92

16

2,16

30

2,39

Якщо у варіаційному ряді є декілька величин, що різко відрізняються від інших, то можна застосовувати інший підхід. За наведеною вище таблицею залежно від числа варіант визначають uкр і обчислюють та . Якщо значення, яке вважають ймовірним промахом, не входить в інтервал цих обчислень, воно дійсно є промахом і відкидається.

Приклад 13. Використавши критерій Шовене, перевіримо наступні дані: 14,8; 14,2; 14,8; 33,6; 14,1 на наявність промахів.

і s для цієї вибірки будуть дорівнювати, відповідно, 18,3 і 8,6.

Оскільки кількість варіант дорівнює 5, то, використовуючи таблицю 2, отримаємо uкр = 1,68. Далі обчислюємо:

= 18,3+8,6×1,68=32,7

Оскільки 33,6>32,7, то значення варіанти 33,6 є промахом його виключається з наступних обчислень. Тобто, заново обчислюють і s і в кінцевому варіанті як характеристики вибірки використовують обчислені заново параметри.

4.2. Q-критерій Діксона

При його використанні отримані результати вимірювань записують у варіаційний ряд за збільшенням:

(x1<x2<…<xn)

Даний критерій визначається як:

(для мінімального значення) (20)

або (для максимального значення) (21).

Проте розрахунок за цими формулами буде коректним тільки для n=3-7. При n=8-10 в знаменнику повинна стояти різниця між вірогідним промахом і значенням, найближчим до максимального (або мінімального) значення:

(для мінімального значення) (22);

(для максимального значення) (23).

Значення Q порівнюють з критичним значенням критерію, наведеним у таблиці 3. Якщо критичне значення менше дослідного, то вірогідний промах є істинним. При цьому як рівень статистичної значущості p беруть 0,10, а не 0,05. Зазвичай на промахи перевіряють мінімальне і максимальне значення. Після відкидання промахів знову повторюють обчислення.

Таблиця 3. Критичні значення Qкр при різних рівнях статистичної значущості p і числі вимірювань n

n

Рівень статистичної значущості p

0,10

0,05

0,01

3

0,941

0,970

0,994

4

0,765

0,829

0,926

5

0,642

0,710

0,821

6

0,560

0,625

0,740

7

0,507

0,568

0,680

8

0,468

0,526

0,634

9

0,437

0,493

0,598

10

0,412

0,466

0,568

Приклад 14. Використавши критерій Діксона, перевіримо на наявність промахів наступні дані: 14,8; 14,2; 14,8; 33,6; 14,1. і s для цієї вибірки будуть дорівнювати, відповідно, 18,3 і 8,6.

1) із поданих даних формуємо варіаційний ряд:

14,1; 14,2; 14,8; 14,8; 33,6

2) за формулою (23) обчислюємо Q:

Порівнюючи Q, яке ми отримали в результаті обчислень (0,964), з критичним значенням Qкр (0,642) при n=5 і рівні статистичної значущості p<0,10 (таблиця 3), значення 33,6 є промахом.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]