- •1.Основные понятия
- •2. Компьютерное исследование точности
- •3.Исследование датчиков псевдослучайных чисел
- •3.1 Генерация псевдослучайных чисел
- •3.1.1 Генерация равномерных чисел
- •3.1.2 Генерация случайных чисел,
- •3.2 Тестирование датчиков
- •3.2.1.Проверка на соответствие заданному закону
- •3.2.2. Проверка независимости и некоррелированности
- •3.3. Наиболее часто встречающиеся законы распределения
- •3.4. Контрольные вопросы
- •4. Оценка параметров распределения
- •4.1. Вычисление точечных оценок
- •4.2. Вычисление интервальных оценок
- •4.2.1.Интервальная оценка дисперсии
- •4.2.2.Интервальная оценка математического ожидания
- •4.3. Точность оценивания параметров
- •4.4.Контрольные вопросы
- •5.1. Проверка гипотезы о математическом ожидании
- •5.2. Проверка гипотезы о дисперсии нормально распределенной
- •5.3. Проверка гипотезы о параметре экспоненциального
- •5.4. Точность проверки
- •5.5. Контрольные вопросы
- •6. Проверка статистических гипотез по критериям значимости (согласия)
- •6.1. Критерий значимости (согласия)
- •6.2. Проверка гипотез о параметрах нормально распределенной случайной величины
- •6.4. Точность проверки гипотез по критериям значимости
- •6.5. Контрольные вопросы
- •7.1.2.Проверка гипотезы по критерию Вилкоксона
- •7.2. Проверка гипотезы о наличии статистической независимости
- •7.2.1 Коэффициент ранговой корреляции Спирмена
- •7.2.2. Коэффициент ранговой корреляции Кендалла
- •7.3. Исследование точности ранговых критериев
- •7.4. Контрольные вопросы
6.4. Точность проверки гипотез по критериям значимости
и согласия
Как следует из описания методов проверки статистических гипотез с множеством альтернатив, все они опираются на известность распределения критерия значимости или критерия согласия. Большинство этих распределений имеют предельный характер (за исключением лишь проверки гипотез о параметрах нормального распределения). Это означает, что распределение критерия, строго говоря, зависит от объема выборки п и лишь при больших значениях п его, в зависимости от метода, можно считать или нормальным, или колмогоровским, или
χ2-распределенным и т.п.
На этом основании можно сделать вывод: описанные методы проверки гипотез вполне корректны, если они используются при наличии выборок большого объема. Если выборка невелика, то распределение критерия может отличаться от заложенного в методе, и это отличие будет снижать надежность статистических выводов. В любом случае влияние ограниченности выборки на результаты проверки гипотез надо исследовать. Это нетрудно сделать, используя описанный подход с использованием компьютерного моделирования случайных выборок. При этом возможен следующий алгоритм.
1.Задаемся законом распределения наблюдаемой величины.
2.Выбираем метод проверки гипотезы (критерий значимости или согласия).
3.Формулируем статистическую гипотезу.
4.Генерируем случайную выборку объема п (п — невелико).
5.По данным выборки
вычисляем значение критерий
(п
).
6.Повторяем N раз (N≥500) при разных стартовых числах пп. 4 и 5, в результате чего получаем представительную выборку, характеризующую распределение критерия (п ).
7. С целью наглядности строим на одном графике гистограмму
и
предельное распределение критерия
.
8.Сопоставляя и , анализируем допустимость применения предельного распределения в случае проверки гипотез по выборкам ограниченного объема.
9.Повторяем пп. 4, 5, 6, 7, 8 для различных п и делаем выводы о влиянии объема выборки на точность статистических выводов в задачах проверки гипотез.
При рассмотрении п. 8 целесообразно оценить вероятность правильного вывода (так как исследуемое распределение известно) для случаев ограниченного и неограниченно большого объема выборки.
Изменяя распределение наблюдаемой величины (п. 1), можно исследовать влияние вида распределения на точность решения задачи проверки гипотез.
При описании алгоритма исследования точности не указывалось, какой именно критерий проверки исследуется, так как в этом нет необходимости. Алгоритм инвариантен по отношению к критерию (ξ, λ, χ2 и т.п.).
6.5. Контрольные вопросы
1.Что такое простые и сложные статистические гипотезы?
2.Как производится разбиение области значений критерия на допустимую и критическую?
3.Что такое уровень значимости?
4.Каков содержательный смысл критерия значимости и критериев согласия?
5.Что означает односторонний и двусторонний критерии значимости?
6.Почему критерии, имеющие нормальное распределение и распределение Стьюдента, двусторонние, а критерий, имеющий χ2- распределение — односторонний?
7.Почему описанные в разд. 6.2.1, 6.2.2 и 6.2.3 процедуры проверки гипотез о значении МО и дисперсии ограничены случаем нормально распределенной наблюдаемой величины?
8.Чем ограничено применение критерия согласия λ-Колмогорова?
9.Расскажите процедуру использования критерия согласия λ- Колмогорова.
10.Как учитывается при пользовании критерием согласия χ2- Пирсона факт назначения параметров по данным выборки?
11.Как производится разбиение области возможных значений на разряды? На что это влияет?
12.Опишите процедуру пользования критерием согласия χ2- Пирсона.
13.Что такое эмпирическая функция распределения и как она вычисляется по данным выборки?
14.Что такое гистограмма распределения и как она вычисляется по данным выборки?
15.Объясните содержательный смысл критерия χ2 -Пирсона как меры близости эмпирического и гипотетического распределений.
16.Почему при попадании критерия значимости (согласия) в критическую область гипотезу следует отбросить? Какова при этом вероятность ошибки первого рода?
Примечание. Так как xi и yi обычно округленные величины, то некоторые разности xi - yi на практике могут обращаться в нуль. Эти случаи при подсчете числа k следует отбросить.
