
- •Збірник задач
- •З теорії ймовірностей та математичної статистики
- •Навчальний посібник
- •Рекомендовано
- •Міністерством освіти України
- •Рецензенти: член-кореспондент нан України, доктор фізико-математичних наук
- •Передмова
- •Розділ 1. Елементи комбінаторики
- •Приклади розв’язання задач
- •Розділ 2. Простір елементарних подій, випадкові події та операції над ними
- •Правило де Моргана: Приклад розв’язання задачі
- •Розділ 3. Ймовірності у дискретних просторах елементарних подій. Класичне означення ймовірності
- •Приклад розв’язання задачі
- •Розділ 4. Геометричні ймовірності.
- •Приклад розв’язання задачі
- •Розділ 5. Аксіоми теорії ймовірностей
- •Приклад розв’язання задачі
- •Розділ 6. Умовні ймовірності.
- •Приклад розв’язання задачі
- •Розділ 7. Формула повної ймовірності. Формула Байєса
- •Приклад розв’язання задачі
- •Розділ 8. Дискретні випадкові величини. Числові характеристики дискретних випадкових величин
- •Приклад розв’язання задачі
- •Дисперсія d
- •Розділ 9. Схема Бернуллі. Класичні дискретні розподіли
- •Приклад розв’язання задачі
- •Розділ 10. Неперервні випадкові величини
- •Приклад розв’язання задач
- •Розділ 11. Закон великих чисел. Центральна гранична теорема
- •Наслідок 2. Якщо для послідовності {n, n1} виконується умова Ляпунова, то справджується і центральна гранична теорема. Приклад розв’язання задач
- •Розділ 12. Вибірка та її основні характеристики. Емпірична функція розподілу, гістограма
- •Приклад розв’язання задачі
- •Розділ 13. Оцінювання невідомих параметрів розподілів. Класифікація оцінок. Вибіркове середнє та дисперсія, мода, медіана
- •Приклад розв’язання задачі
- •Розділ 14. Ефективні оцінки. Достатні статистики
- •Приклади розв’язання задач
- •Розділ 15. Метод моментів та метод максимальної правдоподібності
- •Приклади розв’язання задач
- •Розділ 16. Надійні інтервали
- •Приклад розв'язання задачі
- •Розділ 17. Перевірка статистичних гіпотез. Критерії згоди
- •Приклади розв’язання задач
- •Розділ 18. Перевірка гіпотез про рівність математичних сподівань та дисперсій для нормальних сукупностей
- •Приклади розв’язання задач
- •Розділ 19. Лінійна регресія
- •Приклади розв’язання задач
- •Розділ 20. Елементи дисперсійного аналізу
- •Приклад розв’язання задачі
- •Розділ 21. Елементи аналізу часових рядів. Виділення тренду, згладжування, прогноз
- •Приклад розв’язання задачі
- •Розділ 22. Задачі для контрольних робіт Контрольна робота №1 “Теорія ймовірностей”
- •Контрольна робота №2 “Теорія ймовірностей”
- •Контрольна робота №3 “Математична статистика”
- •Розділ 4
- •Розділ 5
- •Розділ 6
- •Розділ 7
- •Розділ 8
- •Розділ 9
- •Розділ 10
- •Розділ 11
- •Розділ 18
- •Розділ 19
- •Розділ 20
- •Розділ 21
- •Додатки
- •Література Підручники, навчальні посібники та монографії
- •Збірники задач
- •Для нотаток:
Розділ 17. Перевірка статистичних гіпотез. Критерії згоди
Статистичною гіпотезою називається будь-яке твердження про вигляд або властивості розподілу випадкових величин, що спостерігаються в експерименті. Правило, згідно з яким гіпотеза H0, що перевіряється, приймається чи відхиляється, називається статистичним критерієм для перевірки гіпотези H0. Наведемо декілька прикладів статистичних гіпотез.
1.
Гіпотеза про вигляд розподілу.
Нехай =(1,
2,
…, n)
— вибірка з генеральної сукупності з
невідомою функцією розподілу
Тоді
де
повністю задана, або
де
— задане сімейство функцій розподілу.
2.
Гіпотеза однорідності.
Нехай маємо k
вибірок =(1,
2,
…, n),
з генеральних сукупностей з функціями
розподілу
Потрібно перевірити гіпотезу про те,
що це спостереження над однією і тією
ж випадковою величиною, тобто
3.
Гіпотеза незалежності.
Одночасно спостерігаються дві випадкові
величини
та ,
— невідома їхня сумісна функція
розподілу. Потрібно перевірити гіпотезу
про те, що
та
— незалежні випадкові величини, тобто
Розглянемо
методи перевірки гіпотез описаних вище
типів. У всіх випадках формулювалася
лише одна гіпотеза H0,
і необхідно перевірити, чи узгоджуються
статистичні дані з цією гіпотезою, чи
ні. Відповідні критерії називаються
критеріями згоди.
Якщо гіпотеза H0
однозначно фіксує розподіл спостережень,
то гіпотеза називається простою,
у протилежному випадку — складною.
У наведених вище прикладах лише гіпотеза
є простою.
Опишемо
основний процес, який використовується
при побудові критерію згоди. Вибирається
деяка статистика
яка є мірою розбіжності статистичного
й теоретичного законів розподілу і
називається статистикою
критеріїв або критерієм.
Далі знаходиться розподіл критерію T
в припущенні, що розподіл спостережень
збігається з гіпотетичним. Визначимо
тепер таке число
щоб
де
— достатньо мале число. Число
називається рівнем
значущості критерію.
Якщо значення міри розбіжності
обчислене за спостереженнями, більше
або рівне
тоді
відхилення від теоретичного закону
вважається значущим, і гіпотеза
відхиляється. Якщо ж
то відхилення не вважається значущим,
тобто дані експерименту не суперечать
гіпотезі.
Критерій Колмогорова про вигляд розподілу. Критерій Колмогорова застосовується в тих випадках, коли F(x) — неперервна функція. Статистикою критерію вибирається величина
де — емпірична функція розподілу. За заданим рівнем значущості знайдемо таке число , що
У таблиці
8
додатка наведено значення
для різних .
Отже, одержимо таке правило перевірки
гіпотези H0.
Нехай
— величина
обчислена за реалізацєю вибірки
Якщо
то
гіпотеза H0
відхиляється, а при
—
приймається.
Критерій
згоди
про вигляд розподілу. Цей
критерій можна використовувати для
будь-яких розподілів. Розіб’ємо множину
всіх можливих значень спостережуваної
випадкової величини
на r
інтервалів
,
що не перетинаються. Якщо спостерігається
дискретна випадкова величина, то
—
це різні значення цієї величини. Нехай
—
число елементів вибірки, що потрапили
в інтервал
.
Статистикою критерію
вибирається величина
Критерій
перевірки гіпотези H0
будується таким чином. Обчисливши
значення
і вибравши рівень значущості ,
за таблицею
-розподілу
(таблиця 5 додатка) визначимо величину
Якщо
то гіпотеза H0
відхиляється, якщо ж
то гіпотеза приймається.
Критерій
можна використовувати для перевірки
складних гіпотез. Нехай за вибіркою
=(1,
2,
…, n)
потрібно перевірити гіпотезу
де
— задане сімейство розподілу. Невідомий
параметр
оцінюється за вибіркою і в статистику
підставляються
ймовірності
підраховані через
де
— оцінка .
Тоді граничний розподіл
буде
-розподіл
з
степенями
свободи, де
— розмірність параметра .
Далі критерії перевірки гіпотези
будуються аналогічно наведеному
критерію. Якщо
то гіпотеза H0
відхиляється, якщо ж
то гіпотеза приймається.
Нехай
=(1,
2,
…, n)
і =(1,
2,
…, n)
— дві вибірки з генеральних сукупностей
з невідомими функціями розподілу
та
відповідно. Потрібно перевірити гіпотезу
про те, що це спостереження над однією
і тією ж випадковою величиною, тобто
Критерій
однорідності Смирнова—Колмогорова.
Цей критерій
використовується лише для неперервних
розподілів. За міру розбіжності
приймається величина
де
—
емпіричні функції розподілу, побудовані
за першою і другою вибірками. При
розподіл випадкової величини
збігається до розподілу Колмогорова.
Далі критерії будуються аналогічно
критерію Колмогорова. За заданим рівнем
значущості
знайдемо табличне число
(таблиця 8
додатка). Якщо
то
гіпотеза H0
відхиляється, а при
—
приймається.
Критерій
однорідності
Цей критерій можна
використовувати для перевірки даних,
які мають дискретну структуру. Окрім
того, за допомогою цього критерію можна
перевіряти однорідність будь-якого
скінченного числа вибірок (за критерєм
Смирнова—Колмогорова можна порівнювати
лише дві вибірки). Нехай проведено k
послідовних серій незалежних спостережень,
які складаються з n1,
n2,
…nk
спостережень. При цьому в кожному
експерименті може виникнути один з
наслідків, ij
— число виникнень
i-го
наслідку в j-й
серії.
— загальна кількість об’єм спостережень.
Потрібно перевірити гіпотезу H0
про те, що всі спостереження проводилися
над однією і тією ж величиною. Статистикою
критерію є величина
У таблиці
-розподілу
(таблиця 5 додатка) за заданим
і числом степенів свободи
знаходимо число
Якщо
то гіпотеза H0
відхиляється, якщо ж
то гіпотеза приймається.
Критерій незалежності Критерій дає змогу перевіряти також гіпотезу про незалежність двох випадкових величин та . Статистикою критерію є величина
де vij — число випадків, коли одночасно спостерігалися =xi та =yj (для неперервних випадкових величин i та j — номери відповідних інтервалів),
і
— число значень, яких набувають випадкові
величини
та ;
—
обсяг вибірки. Вибір табличного значення
і прийняття рішення проводиться
аналогічно описаній вище процедурі для
критерію однорідності