
- •Елементи теорії ймовірностей
- •§1. Означення ймовірності
- •Простіші властивості ймовірності
- •Класичне означення ймовірності
- •VII. Геометрична ймовірність.
- •VIII. Умовна ймовірність. Формула Байєса.
- •§2. Послідовності незалежних випробувань
- •I. Послідовність незалежних випробувань.
- •II. Схема Бернуллі
- •Iіi. Граничні теореми у схемі Бернуллі
- •§3. Випадкові величини
- •II. Дискретна випадкова величина
- •III. Неперервна випадкова величина
- •§4. Нормальний розподіл та його властивості
- •§5. Кореляція
- •V. Кореляційний момент:
- •Vі. Коефіцієнт кореляції
- •Vіі. Лінійна регресія -
- •Елементи математичної статистики
- •§1 Вибірка та її характеристики
- •Варіаційний ряд.
- •Емпірична (вибіркова) функція розподілу
- •Полігон частот
- •Гістограма
- •§2 Задача перевірки статистичних гіпотез
- •Гіпотеза про параметри нормального розподілу : .
- •Гіпотеза про параметри нормального розподілу : .
- •Гіпотеза про закон розподілу. Критерій Колмогорова.
- •§3. Довірчі інтервали
- •§4. Вибіркова кореляція
- •§5. Значущість вибіркового коефіцієнту кореляції
- •§6. Критерій , як критерій незалежності ознак
§2 Задача перевірки статистичних гіпотез
-
Постановка задачі
Припустимо,
що маємо вибірку
об’єму
.
Закон розподілу відповідної випадкової
величини невідомий. Висувається основна
гіпотеза
:
випадкова величина розподілена за
вказаним законом
,
та низка альтернативних
гіпотез
:
випадкова величина розподілена за
іншими законами:
тощо.
У простішому випадку:
:
випадкова величина розподілена за
законом
,
:
випадкова величина не
розподілена за законом
.
Припустимо, що ми маємо певний спосіб перевірки гіпотез (критерій). Тоді можливий один з 4 випадків:
-
Гіпотеза
вірна, але відхиляється за критерієм (тобто приймається альтернативна гіпотеза
);
-
Гіпотеза
вірна та приймається;
-
Гіпотеза
невірна та відхиляється;
-
Гіпотеза
невірна, але приймається.
Як бачимо, у випадках 2) та 3) критерій спрацював правильно, а випадки 1) та 4) треба розглядати, як помилки.
Помилка
1 - гіпотеза
вірна, але відхиляється –
називається помилкою
першого роду.
Помилка 4 - гіпотеза
невірна, але приймається –
називається помилкою
другого роду.
Як правило, за помилку першого роду беруть ту помилку, ціна якої більше. Виходячи з цього, відповідна гіпотеза вибирається за основну. Наприклад, нові ліки перевіряються на токсичність. Очевидно, за основну гіпотезу краще прийняти гіпотезу «препарат є токсичним». Дійсно, помилкою першого роду в цьому випадку буде класифікувати токсичний препарат, як нетоксичний. Ціною цього буде погіршення стану хворих, судові процеси, скандал, антиреклама і під кінець - можливе банкрутство. У випадку же помилки другого роду нетоксичний препарат буде прийнятий за токсичний, і в найгіршому випадку прийдеться починати все з початку, а то й лише відправити препарат на доопрацювання. Ціною будуть певні фінансові втрати, значно менші у порівнянні з втратами від помилки 1 роду.
Ймовірність
помилки1 роду, тобто прийняття
альтернативної гіпотези
при тому, що вірною є основна гіпотеза
)
позначається
.
Ймовірність помилки 2 роду -
.
Ясно, що ймовірність
мусить бути малою. Зазвичай розглядають
,
де
- рівень
значущості критерію.
Чим важливішими є наслідки помилки 1
роду – тим меншим беруть
.
Зазвичай розглядають
тощо. Однак не треба зловживати зменшенням
.
Справа у тому, що у випадку завищеного
рівня значущості критерій почне приймати
без розбору велику кількість різноманітних
нульових гіпотез, серед яких буде багато
невірних – тобто зросте ймовірність
помилки 2 роду, чого теж треба уникати.
-
Гіпотеза про параметри нормального розподілу : .
Припустимо,
що маємо вибірку
об’єму
.
Закон розподілу відповідної випадкової
величини вважаємо нормальним, тобто
функція розподілу має вигляд
,
де
- математичне сподівання, и
- дисперсія – невідомі. (Зазвичай в силу
так званої центральної
граничної теореми
припущення про нормальність розподілу
наприклад, результатів вимірювання при
великій їх кількості, справджуються)
а)
Висуваємо основну гіпотезу
:
математичне сподівання випадкової
величини дорівнює даному числу (
).
Альтернативна гіпотеза
:
.
Застосовуємо критерій
Стьюдента.
За вибіркою обчислюємо середнє
і незміщену дисперсію
.
Позначимо
.
Виберемо
значення
.
Тоді
при
гіпотеза
відхиляється на рівні значущості
;
при
гіпотеза
приймається.
При
цьому ймовірність помилки 1 роду не
більше
:
.
Тут
через
позначено так звану
-границю
розподілу Стьюдента
з
степенями вільності.
Значення її можна знайти за таблицею
(див. Додаток).
б)
Висуваємо
:
.
Нехай
:
(одностороння
альтернатива). Застосовуємо критерій
Стьюдента.
Позначимо
.
Виберемо
значення
.
Тоді
при
гіпотеза
відхиляється на рівні значущості
;
при
гіпотеза
приймається.
При цьому
.
Приклад.
Вибірка:
.
Об’єм
.
Варіаційний
ряд:
.
Висуваємо гіпотезу
,
що відповідна випадкова величина
розподілена нормально с параметром
.
За альтернативну гіпотезу візьмемо
припущення
.
Таким чином,
.
Відомо , що (см. вище)
обчислені
за вибіркою середнє
і незміщена дисперсія
Обчислимо
.
Виберемо
рівень значущості
(двостороння альтернатива) тоді
.
Порівняємо обчислене відхилення
та знайдену за таблицею розподілу
Стьюдента
величиною
.
Маємо
.
Гіпотеза приймається.