
- •Київський національний університет технологій та дизайну
- •Статистичний аналіз даних
- •Критерії якості точкових статистичних оцінок
- •Оцінка математичного сподівання
- •Оцінка дисперсії та середнього квадратичного відхилення
- •4) Оцінка моди
- •Симетричність вибірки
- •Загальна схема перевірки гіпотез
- •Основна ідея перевірки статистичних гіпотез
- •Прості і складені гіпотези.
- •Нормальний закон розподілу імовірностей.
- •Візуальний аналіз графічного зображення вибірки
- •Порівняння вибіркових та очікуваних частот.
- •Додатки до методичних вказівок
- •Додаток 2. Вибіркові дані для оцінювання параметрів нормального розподілу
- •Додаток 3.
Прості і складені гіпотези.
Коли ми висуваємо гіпотезу про теоретичний закон розподілу, якому гіпотетично повинні відповідати елементи даної вибірки, то необхідно розрізняти прості і складені гіпотези про цей закон, а саме:
проста гіпотеза повністю визначає теоретичну функцію розподілу імовірностей, згідно з якою виникли вибіркові значення;
складена гіпотеза вказує не на єдиний розподіл, а на деяку їх множину (наприклад, на параметричну сім’ю).
У випадку простої гіпотези стає у нагоді критерій узгодженості, який базується на наступній теоремі.
Теорема
К. Пірсона.
Нехай n
- число незалежних спостережень деякого
досліду з повною групою попарно несумісних
подій А1,
... , Аr,
ймовірність яких р1,
... , рr,
причому р1
+
... + рr
= 1. Позначимо через m1,
… , mr
кількість спостережень, що мають
відповідно результати А1,
... , Аr.
Введемо випадкову величину
.
Тоді при n→∞
випадкова величина χ2
асимптотично підлягає розподілу χ2
з (r-1)
ступенями свободи.
Теорема використовується для перевірки гіпотези про те, що імовірності р1, ... , рr прийняли певні значення р10, ... , рr0. Запишемо власне гіпотезу Н:
Н: р1 = р10, р2 = р20, . . . , pr = pr0.
Статистикою
хі-квадрат Пірсона для простої гіпотези
називається статистика
.
Значення цієї статистики порівнюється із значенням квантиля рівня 1-α розподілу χ2 з r-1 ступенем свободи.
Для перевірки складених гіпотез може бути використаний критерій узгодженості хі-квадрат Фішера, який базується на наступній теоремі.
Теорема
Фішера.
Нехай n
- число незалежних спостережень деякого
досліду з повною групою попарно несумісних
подій А1,
... , Аr
, імовірності яких відомі з точністю
до деякого невизначеного k-вимірного
параметра θ
=
(θ1,
... , θk).
Припустимо, що імовірності є заданими
диференційовними функціями від θ:
P(Ai)
= pi(θ),
крім того
для будь-якого θ.
Розглянемо статистику
, де
– оцінка максимальної правдоподібності
для параметра θ, що одержана за частотами
m1,
… , mr.
Вказана статистика є асимптотично
розподіленою за законом χ2
з r
–
k
-
1
ступенями свободи. Ця статистика
називається статистикою хі-квадрат
Фішера для складеної гіпотези. Дана
статистика і використовується в якості
статистики вищеназваного критеріюузгодженості
Фішера. Процедура перевірки здійснюється
так
як і у випадку простої гіпотези, а саме:
треба обчислити значення
Х2
і
порівняти його з критичними значеннями
розподілу
χ2
з
числом ступенів свободи
( r
–
k
-
1).
Зауважимо, що число спостережень повинно
бути досить великим, щоб очікувані
частоти не були малими. Конкретніше,
вважається, що даний критерій можна
використовувати, коли n
≥
50,
а всі частоти mi
більші або рівні 7-8.
Нормальний закон розподілу імовірностей.
Випадкова
величина має нормальний розподіл
(позначення
N(μ,),
якщо її щільність розподілу
визначається за формулою:
,
де μ, - деякі числа. Імовірнісний зміст параметрів μ , :
μ – математичне сподівання випадкової величини ,
- середнє квадратичне відхилення випадкової величини .
Графік щільності розподілу випадкової величини має дзвіноподібну форму і є симетричним відносно прямої х= μ (див. рис.8.1)
Рис.8.1
Припустимо, що є заданою вибірка значень x1, x2, … , xn випадкової величини , отримана при тих чи інших спостереженнях. Треба вирішити, чи можна на підставі наявних даних зробити обґрунтоване припущення про нормальність розподілу величини (інакше – про нормальність теоретичного розподілу імовірностей). Таким чином, мова йде про перевірку гіпотези Н0={теоретичний розподіл імовірностей є нормальним}, або скорочено: H0 = { N( · , · ) } (позначення N( · , · ) замість N( μ, σ ) вживається, коли мова йде про нормальність розподілу взагалі, без припущень щодо конкретних значень параметрів цього розподілу).
З багатьох відомих критеріїв узгодження емпіричних даних з гіпотезою про нормальність теоретичного розподілу в даній роботі треба використати лише два. Основні принципи, на яких базуються вказані критерії і відповідні дії, що потрібно виконати, формулюються нижче.