Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Донецкий национальный университет экономики и торговли им. М. Туган-Барановского

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Topolnik_V.G._MATEMATIKO-STATISTICHNI_METODI_DO...doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

3.49 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 308 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

2.3.1. Відсів грубих похибок

Часто побіжний попередній перегляд (візуальний або автоматизований) початкових даних може викликати у дослідника сумніви в істинності (чи правомірності) окремих спостережень, які занадто різко виділяються на загальному фоні. У таких випадках виникає питання: чи маємо ми право пояснити різкі відхили в початкових даних (аномальні викиди) лише звичайними випадковими коливаннями вибірки, які зумовлені природою генеральної сукупності, що аналізується, чи тут справа в суттєвих викривленнях стандартних умов збору статистичних даних, а можливо, і в прямих помилках реєстрації (запису)? В останніх двох випадках "підозрілі" спостереження, очевидно, слід виключити з подальшого розгляду.

В загальному випадку, коли ми хочемо порівняти результати будь-яких вимірів (виміряється одна й та ж величина), ми можемо утворити їх різницю і порівняти її з очікуваною відповіддю_,що ця різниця дорівнює нулю.

Для цього визначається кількість стандартних відхилень у цій різниці

. (2.1)

Потім за таблицями інтеграла нормальних помилок можна знайти ймовірність одержання результату, який відрізняється від х_іна τ чи більше стандартних відхилень.

Ця ймовірність α (зовні τ×σ) = 1-α (у межах τ×σ).

Якщо ця ймовірність велика, то різниця цілком розумна і результат цілком прийнятний; якщо ж ймовірність "недопустимо мала", то різницю слід розглядати як значну (тобто неприйнятну) і х_і повинно бути відкинуте, а ( ) повинно бути перераховане.

Відкидання даних - суперечне питання, щодо якого у спеціалістів немає єдиної думки. Рішення відкинути якісь дані в кінцевому рахунку завжди суб'єктивне, і вченого, який прийняв таке рішення, його колеги можуть осудити за таку "підгонку" даних. Однак ситуація ускладнюється, якщо врахувати ймовірність того, що аномальний результат може відбивати деякі важливі ефекти. Так, багато важливих наукових відкриттів спочатку мали вигляд аномальних результатів вимірів, які походили скоріше на помилки. Єдина чесна реакція на неймовірні (аномальні) дані - повторити виміри багато разів. Однак у більшості випадків непрактично повторювати виміри багато разів, якщо тільки результат буде здаватись підозрілим.

Якщо у розпорядженні експериментатора є вибірка невеликого обсягу п ≤ 25, то можна скористатись методом обліку максимального відхилення [15].

Якщо , то спостереження відкидають як грубу похибку. Тут х_і - найбільший або найменший елемент вибірки, по якій підраховувались та ; - табличне значення статистики, яка розрахована за певної ймовірності Р = 1-α.

Якщо розрахована величина менша ніж для цієї ж кількості п за заданої надійності Р, то цей вимір, що різко виділяється, є наслідком статистичного розкиду і немає підстав вважати його промахом.

Використовуючи результати обробки експериментальних даних, що приведені у прикладі 2.1, перевіримо результати вимірів на наявність грубих похибок.

= 1,5 відповідає даним за номером 6.

Табличне значення квантилю розподілу максимального відхилення τ_1-α за певної ймовірності 0,95 (рівень значущості 0,05) при п=15 дорівнює 2,49 (додаток 3).

Оскільки τ_р < τ_1-α , груба похибка відсутня.

Відсів грубих похибок можна провести і для великих вибірок. Для практичних цілей краще за все використовувати таблиці розподілу Стьюдента. Цей метод виключення аномальних значень для вибірок великого обсягу відрізняється простотою, а таблиці розподілу Стьюдента є практично в будь-якій книжці з математичної статистики. Розподіл Стьюдента належить до категорії розподілів_,пов'язаних з нормальним розподілом.

Процедура відсіву грубих похибок вимірів полягає в наступному:

1) з таблиці обробки експериментальних даних вибирають спостереження, яке має найбільше відхилення (наприклад, найбільше значення виміряної величини х_найб. = 189,00; обчислені статистичні ознаки при п = 56 : = 175,66; = 5,55);

2) по формулі (2.1) обчислюють τ :

τ = (189,00-175,66) / 5,55 = 13,34 / 5,55 = 2,40 ;

3) по таблиці процентних співвідношень розподілу Стьюдента (додаток 2) знаходять процентні точки t - розподілу Стьюдента t_(α,
п-2) , для ймовірності Р = 0,95 і Р = 0,90, а саме: t_(5%,
п-2) і t_(0,1%,
п-2);

t_(5%,
54) =1,6736 і t_(0,1%,
54) = 3,2572 ;

по формулі

(2.2)

обчислюють відповідне значення квантилю розподілу максимального відхилення

τ_(5%,
56) = 1,6736× ∕ =12,412 ∕ 7,537 = 1,647 ;

τ_(0,1%,
56) = 3,2572× ∕ = 24,156 ∕ 8,038 = 3,005 ;

5) порівнюють результати обчислень по п. 2 та п. 4 і приймають кінцеве рішення про відсів грубих похибок.

Як видно, значення τ = 2,40 знаходиться між двома критичними значеннями τ_(5%) та τ_(0,1%) :

1,647 < 2,40 < 3,005.

У цьому випадку відсів потрібно проводити з великою обережністю, а краще всього – від нього відмовитись_.

Максимальні відносні відхилення в процесі обчислення можуть бути поділені на три групи: 1) τ ≤ τ_(5%,
п) ; 2) τ_(5%,
п₎ < τ < τ_(0,1%,
п) ; 3) τ ≥ τ_(0,1%,
п₎ .

Спостереження, які потрапили до першої групи, неможна відсіювати ні в якому випадку.

Спостереження, які потрапили до другої групи, можна відсіяти_,якщо на користь цієї процедури є ще й інші міркування експериментатора (наприклад, висновки, що зроблені на основі вивчення фізичних, хімічних та інших властивостей явища, яке досліджується). Так, якщо вивчаються властивості кулінарної продукції, пов'язані з її хімічним складом, коливання якого доходять до 12% [4], то спостереження, для яких τ > τ_(5%,
п) , можна відкинути.

Спостереження, що потрапили до третьої групи, відсіюються завжди. Для фізико-хімічних показників харчових продуктів, у тому числі кулінарної продукції, при значенні τ > 3 спостереження відкидається як груба помилка.

Після виключення того чи іншого спостереження або декількох спостережень характеристики емпіричного (вибіркового) розподілу ( , ) повинні бути перераховані за даними скороченої вибірки (п-1).

Процедуру відсіву можна повторити і для наступного по абсолютній величині максимального відносного відхилення τ .

Можна використати критерій Шовене для виключення з вибірки підозрілого результату [26]. Критерій Шовене в його звичайному розумінні стверджує, що, якщо очікувана кількість вимірів, настільки ж поганих, як і підозрілий результат, менша, ніж 1/2, то підозрілий результат слід виключити_.

Приклад 2.2. Нехай зроблено п вимірів однієї й тієї ж величини:

0,36; 0,83; 0,89; 0,84; 0,37; 0,82; 0,95; 0,83; 0,88; 0,85 (п₁ = 10); 0,852; 0,039.
7; 3; 9; 3; 6; 9; 8; 7; 12; 5; 9; 9; 3 (п₂ = 14);

7,0; 2,72.

Якщо один з результатів вимірів відрізняється від настільки, що уявляється підозрілим (х_під.), то обчислюємо кількість стандартних відхилень, на яку х_під. відрізняється від _.

= (0,95-0,86)/0,04 = 2,3;

= (12 – 7) / 2,72 = 1,84.

Потім знаходимо ймовірність α (зовні ) того, що нормальний вимір буде відрізнятися відх на t чи більше стандартних відхилень (додаток 5).

α (зовні ) = 1 – α (у межах ).

При t_α =2,3 Р = 0,9786; при t_α = 1,84 Р = 0,9342.

α₁ = 1-Р = 1-0,9786 = 0,0214; α₂= 1-0,9342 = 0,0658.

Одержане значення помножується на повну кількість вимірів п, щоб одержати N – кількість очікуваних вимірів, яка дає настільки ж погані результати, як х_під. .

N =п×α (зовні ) :

N₁ = 10×0,0214 = 0,214; N₂ =14×0,0658 = 0,92.

Якщо N менше 1/2, то х_під. не задовольняє критерію Шовене і підозрілі значення відкидаються, в противному разі - залишаються у виборці.

N₁ = 0,214 < 0,5 ; N₂ = 0,92 > 0,5 .

Отже, у першій виборці підозріле значення 0,95 виключається з вибірки, а значення 12 в другій виборці не виключається з неї.

Після того, як результат, який не задовольняє критерію Шовене, відкинуто, потрібно перерахувати та за даними, що залишились. У цьому випадку виходить значення , яке буде менше ніж первісне, і може, статись так, що з новим значенням деякі інші результати вимірів не будуть задовольняти критерію Шовене. Однак більшість авторитетних фахівців вважає, що критерій Шовене не повинен застосовуватись другий раз із використанням перерахованих та .

Багато вчених вважають, що відкидання даних не може бути виправдане, поки не знайдеться зовнішнє свідотство того, що підозрілі дані невірні. Може бути, більш помірна позиція полягає в тому, що критерій Шовене слід використовувати для знайдення даних, які могли б при наймі розглядатись як кандидати для відкидання.

<<< < Предыдущая 1 2 3 4 5 6 78 / 308 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
21.02.2016463.36 Кб119Tolstih_A.S.Gragdanskaya_oborona._metod._ukaz..doc
#
21.02.20161.09 Mб200Tolstih_A.S._TSIVILNIY_ZAHIST_2012.doc
#
23.08.20192.06 Mб6Tolstih_A.S._Vasilev_O.O.BEZPEKA_GITTEDIYALNOST...doc
#
21.02.20162.2 Mб17Tolstih_A_S_Vasilev_O_O_BEZPEKA_GITTEDIYALNOST.doc
#
21.02.2016234.5 Кб27Tolstih_A_S_Vasilev_O_O_BEZPEKA_GITTEDIYALNOST.doc
#
01.07.20253.49 Mб3Topolnik_V.G._MATEMATIKO-STATISTICHNI_METODI_DO...doc
#
01.09.2019755.2 Кб21Topolnik_V.G._Upravlenie_kachestvom_produktsii_...doc
#
22.02.2016630.28 Кб12tovary_2013_2_3.pdf
#
31.08.201995.23 Кб14Translation_transportation.doc
#
20.09.2019807.94 Кб37TSibulnik_L.V..Certifikatsiya_prodovolstvennih_...doc
#
21.02.20161.26 Mб45uchebnoe-posobie-makroe-konomika.doc