- •31. Класичне, статистичне та геометричне означення ймовірності.
- •32. Емпірична функція розподілу, її властивості та графік.
- •33.Різновиди випадкових подій
- •34. Точкові оцінки.
- •35. Перестановки, сполучення, комбінації : формули для обчислення.
- •36. Інтервальні оцінки
- •37. Перестановки, сполучення, комбінації : формули для обчислення.
- •38. Статистична перевірка гіпотез
- •39. Дії над множинами
- •40. Похибки перевірка гіпотез
40. Похибки перевірка гіпотез
Похибки першого
роду
і похибки
другого роду
в математичній статистиці — це ключові
поняття завдань перевірки статистичних
гіпотез. Проте, дані поняття часто
використовуються і в інших областях,
коли йдеться про ухвалення «бінарного»
рішення (так/ні) на основі якогось
критерію (тесту, перевірки, вимірювання),
який з деякою вірогідністю може давати
помилковий результат. Нехай дано
вибірку
з
невідомого розподілу
,
и постовлена бінарна задача перевірки
статистичних гіпотез:
де H0 —
нульова гіпотеза, а H1 —
альтернативна гіпотеза. Припустимо, що
заданий статистичний критерій
,що
зіставляє кожній реалізації вибірки
одну
з гіпотез, які маємо. Тоді можливі чотири
ситуації:1Розподіл
вибірки
відповідає
гіпотезі H0,
і вона точно визначена статистичним
критерієм, тобто
.2Розподіл
вибірки
відповідає
гіпотезі H0,
але вона невірно знехтувана статистичним
критерієм, тобто
.3Розподіл
вибірки
відповідає
гіпотезі H1,
і вона точно визначена статистичним
критерієм, тобто
.4Розподіл
вибірки
відповідає
гіпотезі H1,
але вона невірно знехтувана статистичним
критерієм, тобто
.У
другому і четвертому випадку говорять,
що відбулася статистична помилка, і її
називають похибкою
першого і другого роду відповідно.
Ймовірність похибки першого роду при
перевірці статистичних гіпотез називають
рівнем значущості і зазвичай позначають
грецькою буквою α (звідси
назва α-errors).
Ймовірність похибки другого роду не має якоїсь особливої загальноприйнятої назви, на папері позначається грецькою буквою β (звідси β-errors). Проте з цією величиною тісно зв'язана інша, що має велике статистичне значення — потужність критерію. Вона обчислюється за формулою (1 − β). Таким чином, чим вище потужність, тим менше вірогідність зробити похибку другого роду.Обидві ці характеристики зазвичай обчислюються за допомогою так званої функції потужності критерію. Зокрема, ймовірність похибки першого роду є функцією потужності, обчисленою при нульовій гіпотезі. Для критеріїв, заснованих на вибірці фіксованого обсягу, ймовірність похибки другого роду є одиниця мінус функція потужності, обчислена в припущенні, що розподіл спостережень відповідає альтернативній гіпотезі. Для послідовних критеріїв це також вірно, якщо критерій зупиняється з ймовірністю одиниця (при даному розподілі з альтернативи).У статистичних тестах зазвичай доводиться йти на компроміс між прийнятним рівнем похибок першого і другого роду. Часто для ухвалення рішення використовується порогове значення, яке може варіюватися з метою зробити тест строгішим або, навпаки, м'якшим. Цим пороговим значенням є рівень значущості, яким задаються при перевірці статистичних гіпотез. Наприклад, у разі металлодетектора підвищення чутливості приладу приведе до збільшення ризику похибки першого роду (помилкова тривога), а пониження чутливості — до збільшення ризику похибки другого роду (пропуск забороненого предмету).
