- •Критерий хи-квадрат проверки гипотез
- •1. Проверка простой гипотезы о вероятностях
- •2. Проверка сложной гипотезы о вероятностях
- •3. Проверка гипотезы о типе распределения
- •Проверка гипотезы о независимости признаков (таблица сопряженности признаков)
- •Проверка гипотезы об однородности выборок
- •Задания
Проверка гипотезы об однородности выборок
Пусть имеется mвыборок объемамиn1,..., nm, извлеченных из различных совокупностей. Измеряемая величина в каждой из выборок может иметьkуровнейB1, ...,Bk. Требуется проверить гипотезу о том, что исходные совокупности распределены одинаково. Обозначимij- число наблюдений вi-й выборке, имеющих уровеньBj, . Имеем таблицуmkнаблюдений аналогично предыдущему пункту 5. Можно показать, что для проверки гипотезы справедлива процедура (11) - (12).
Пример 5. Имеются данные [3] о наличии примесей серы в углеродистой стали, выплавляемой двумя заводами (см. таблицу 6).
Таблица 6. Число плавок
|
Содержание серы, 10-2% | ||||
|
02 |
24 |
46 |
68 |
Сумма |
Завод 1 Завод 2 |
82 63 |
535 429 |
1173 995 |
1714 1307 |
3504 2794 |
Сумма |
145 |
964 |
2168 |
3021 |
|
Проверим гипотезу о том, что распределения содержания серы (нежелательный фактор) одинаковы на этих заводах.
По (11) находим: = 3.39. Число степеней свободы f = (2-1)(4-1) = 3; квантиль уровня 0.95
h = Q(0.95, 3) = 7.8.
Полученное нами из опыта значение 3.39 лежит в области допустимых значений, и потому у нас нет оснований считать, что содержание серы в стали этих заводов имеют различные распределения.
Выполнение
В таблице Results of Fitting... в последней строке столбцаPerson Chi-Squполучаем Х2= 3.59, число степеней свободыDegrs of Freedom f= 3, и уровень значимостиProbab. p= 0.31.поскольку эта вероятность не мала (не является значимой), гипотезу об одинаковом распределении содержания серы в металле на двух заводах можно принять (вернее, наблюдения этому не противоречат).
Задания
Проверить гипотезу о типе распределения на основе сгенерированной по заданному в таблице 7 закону выборке объема n. Проверить три гипотезы: о нормальности, о равномерности и о показательности.
Таблица 7. Исходные данные
№ варианта |
3 |
Распределение Объем |
E(3) 150 |
Гипотеза о нормальности:
Р2 730.995=р= 0.0000626.
Вероятность мала, гипотезу отклоняем.
Гипотеза о равномерности
Р2 21358.760=р≈ 0.0.
Вероятность мала, гипотезу отклоняем.
Гипотеза о показательности:
Р2 8 7.185=р= 0.516.
Вероятность не мала, гипотезу принимаем.
Проверить гипотезу об однородности трех выборок.
Сгенерировать три выборки объемами n1= 180,n2= 100,n3= 120 для заданного в таблице 8 распределения. Провести их группирование на 8 - 10 интервалах. Сделать все для 2-х вариантов:
а) параметры одинаковы;
б) параметры различны.
N |
Тип |
вариант 1 |
вариант 2 | ||
|
|
a1=a2=a3 |
a1 |
a2 |
a3 |
3 |
Po(a) |
10 |
9.5 |
10 |
11.5 |
выполнение в пакете STATISTICA
Группирование провести процедурой Frequency tables, и из трех таблиц сформировать одну. Гипотезу об однородности проверить аналогично п.6.
Сгенерируем три выборки объемами n1= 180,n2= 100,n3= 120 для заданного в таблице 8 распределения. Проведем их группирование на 8 - 10 интервалах. Сделаем все для 2-х вариантов:
а) параметры одинаковы
Создадим таблицу, куда занесем результат сгруппированных выборок:
Произведем анализ:
В качестве результата анализа получаем высокую вероятность того, что выборки однородны:
б) параметры различны
Создадим таблицу, куда занесем результат сгруппированных выборок:
Полученный результат (0.002) говорит о том, что, скорее всего выборки неоднородны.