
- •Критерій узгодженості Колмогорова-Смирнова
- •Перевірка гіпотез про узгодженність
- •Перевірка простої гіпотези
- •Критерій Колмогорова при простій гіпотезі
- •Критерій Смирнова при простій гіпотезі
- •Перевірка складної гіпотези
- •Критерій Колмогорова при складній гіпотезі
- •Критерій Смирнова при складній гіпотезі
- •Вплив обсягу вибірки на розподіл при складних і простих гіпотезах
- •Приклади
- •Висновок
Критерій Колмогорова при складній гіпотезі
а)
Оцінку скалярного або векторного
параметра розподілу F (x, θ) можна
обчислювати методом максимальної
правдоподібності на підставі формули
.
б) Значення статистики Колмогорова SK або її мінімума розраховують по формулі Sk = на підставі формул Dn = max( ), при та .
в) Розподіл G(SK½H0) вибирають з таблиці А.7. Критичні значення критерію Sα при заданому α можуть бути взяті з таблиці А.8.
д) Гіпотезу про узгодженість не відкидають, якщо P {S > S*K} = 1 - G (SK ½ H0) > α (або S*K < Sα)
Критерій Смирнова при складній гіпотезі
Особливості застосування критерію типу Смирнова наступні.
а) Оцінку скалярного або векторного параметра розподілу F (x, θ) обчислюють методом максимальної правдоподібності
б) Значення статистики Смирнова Sm обчислюють за формулою Sm = на підставі формул та .
в) Розподіл G(Sm½H0) вибирають з таблиці А.11. Критичні значення критерію Sα при заданому α можуть бути взяті з таблиці А.12.
г) Гіпотезу про згоду не відкидають, P {S > S*m} = 1 - G (Sm ½ H0) > α (або S*m < Sα).
Вплив обсягу вибірки на розподіл при складних і простих гіпотезах
У разі перевірки простих гіпотез граничними розподілами статистик критеріїв Колмогорова і Смирнова можна користуватися при n > 20. Дослідження методами статистичного моделювання залежності розподілів статистик всіх розглянутих тут непараметричних критеріїв від обсягу вибірки при перевірці різних як простих, так і складних гіпотез показує, що це справедливо у всіх випадках.
Наприклад, малюнок 1 іллюструє, як при збільшенні обсягу вибірки (n = 5, 10, 20) міняється розподіл G(Sn½H0) статистики Колмогорова Sk в разі перевірки простої гіпотези про приналежність вибірки нормальному закону. На цьому малюнку відображено також граничний розподіл статистики - функція розподілу Колмогорова K(S). Емпіричні розподіли G(Sn½H0) при великих n практично зливаються з K(S), і на малюнку вони не показані. Як видно, при малих n розподіл істотно відрізняється від граничного, але вже при n ≥ 15 - 20 помилка при обчисленні ймовірності узгодження P {S > S*} виявляється досить малою.
Малюнок 1 - Залежність від n розподілів G(Sn½H0) статистики SK Колмогорова при простій гіпотезі (H0 - нормальний розподіл): n = 5, 10, 20. K(S) - функція граничного розподілу Колмогорова
Та ж сама картина спостерігається у випадку перевірки складних гіпотез про згоду. На малюнку 2, при n = 5, 10, 20, 1000 представлені розподіли G(Sn½H0) статистики SK в разі перевірки аналогічною, але вже складною, гіпотезою про нормальність.
Малюнок 2 - Залежність від n розподілів G(Sn½H0) статистики SK Колмогорова при складній гіпотезі ; n = 5, 10, 20, 1000
Малюнок 3 - Залежність від n розподілів G(Sn½H1) статистики Sm Смирнова при складній гіпотезі (H0 - нормальний розподіл; H1 - логістичний); n = 20, 100, 500, 1000
Малюнок 4 - Функції розподілу нормального і логістичного законів
При малих n найбільші відхилення від граничних розподілів спостерігаються на «хвостах». І при простих, і при складних гіпотезах із зростанням n розподілу G(Sn½H0) рівномірно сходяться до граничного. Але якщо у випадку простих гіпотез із зростанням n збільшується ймовірність великих значень статистик, то у випадку складних зростають ймовірності і великих, і малих значень статистик.
Таким чином, розподілу G(Sn½H0) статистик непараметричних критеріїв при простих та складних гіпотезах із зростанням n дуже швидко сходяться до граничних, і вже при n ≥ 15 - 20 можна, не побоюючись великих помилок, користуватися цими граничними законами при аналізі даних.
Для надійного розрізнення близьких законів розподілу, зокрема за допомогою критерію згоди Колмогорова, може знадобитися вибірка досить великого обсягу.