
22.3 Критерій хі-квадрат однорідності
При
застосуванні критерія
узгодження теоретичні значення
ймовірностей
подій
відомі точно.
Часто
виникає ситуація, коли необхідно на
основі даних двох незалежних серий
випробувань преревірити, що кожна з
серій є реалізацією однієї випадкової
величини з невідомими ймовірностями
,
тобто, чи не змінився закон розподілу
ймовірностей при переході від першої
до другої серії випробувань.
Нехай
здійснено
послідовних незалежних серій випробувань
з
випробувань відповідно.
Нехай,
крім того, у кожному окремому випробуванні
серії з номером
подія
може
реалізуватися з (невідомою) ймовірністю
.
Для поясненя критерія розташуємо частоти зустрічаємості подій у кожній серіі випробовувань в окремий стовбчик таблиці (таб. 22.1).
Елемент
таблиці дорівнюї кількості спостережень
події
у серії випробовувань з номером
Покладемо
і введемо традиційне позначення
.
Таблиця 22.1 Розташування частот зустрічаємості випробовувань
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
стовб- чиках |
|
|
|
|
|
|
Необхідно
перевірити гіпотезу
,
за якою
.
Виявляється,
що це можна зробити за статистикою
,
яка
асимптотично має розподіл
,
.
22.4 Універсальний статистичний тест Маурера
Для
даного тесту
-
це припущення, що двійкова послідовність
є чисто випадковою.
Нехай
відрізок
сгенерованої двійкової послідовності
представлено у пам’яті комп’ютера як
послідовність фрагментів
по
бітів на фрагмент. Наприклад, при
,
фрагменти являються байтами. Рекомендовано
вибирати
від 8 до 16.
Накладемо
деяки умови на
.
А саме, припустимо, що
дозволяє розбити послідовність
за допомогою індекса
на дві частини
,
де
,
- параметри теста:
-кількість початкових даних теста, а
- кількість кроків алгоритму обчислення
вибіркових даних. Рекомендовано вибирати
,
.
Для
кожного з фрагментів
послідовно знайдемо значення деякої
відповідної випадкової величини
.
Неформально,
,
де
відстань у послідовності
між фрагментом
та його найближчим повторенням зліва
(якщо таке існує). У випадку, коли
повторення не існює, покладаємо
.
Наприклад,
,
якщо послідовнність
має наступні особливості:
.
Таким
чином, для
,
,
за умови, що відповідне
існує. Інакше,
.
Тест
Маурера оснований на статистиці виду
.
Для
критерія необхідно знати математичне
сподівання
та дисперсію
при істинній
і
.
;
,
де
-
,
а для
існує апроксимація:
.
Гіпотеза
оцінюється на рівні значимості
нормального розподілу
,
залежно від значень
,
та інтервалу
виду
,
.
Тут
,
- квантіль нормального розподілу.
Якщо
,
то
приймається, інакше, приймається
.