- •Практикум по теории вероятностей и математической статистике
- •Содержание
- •1. Теория вероятностей и математическая статистика
- •1. Краткие сведения из комбинаторики
- •2. Классическое определение вероятности события
- •3. Геометрические вероятности события
- •4. Основные теоремы теории вероятностей
- •5. Формула полной вероятности
- •6. Формулы Бейеса
- •7. Повторение испытаний
- •Основные формулы
- •8. Случайные величины: дискретные и непрерывные
- •Основные формулы для вычисления числовых характеристик
- •I. Примеры некоторых распределений дискретных случайных величин
- •II. Примеры некоторых распределений непрерывных случайных величин
- •9. Элементы математической статистики. Методы статистического описания результатов наблюдений
- •9.1. Основные задачи математической статистики
- •9.2. Выборка, способы её представления.
- •9.3. Функция распределения.
- •9.4. Гистограмма и полигон.
- •9.6. Числовые характеристики выборочного распределения.
- •9.7. Выборочные коэффициенты асимметрии, эксцесса. Квантиль.
- •9.8. Двумерный случайный вектор, его статистическое описание
- •9.9. Корреляционная таблица
- •10 .Статистическое оценивание характеристик распределения генеральной совокупности по выборке
- •10.1. Точечные оценки и их свойства. Метод подстановки.
- •10.2. Метод максимального правдоподобия
- •10.3. Метод моментов
- •10.4. Распределения χ2, Стьюдента и Фишера.
- •11. Интервальные оценки
- •11.1. Доверительные интервалы и доверительная вероятность.
- •11.2. Доверительные интервалы для вероятности успеха в схеме Бернулли
- •11.3. Доверительные интервалы для коэффициента корреляции ρ.
- •11.4. Примеры доверительных интервалов.
- •12. Проверка статистических гипотез
- •12.1. Основные понятия. Проверка гипотез о параметрах
- •12.2. Ошибки первого и второго рода
- •12.3. Критерии значимости для проверки гипотез
- •12.4. Проверка гипотез о параметре р биномиального распределения
- •12.6. Определение наилучшей критической области для проверки простых гипотез.
- •12.7. Критерий χ2 и его применение
- •12.8. Методика вычисления теоретических частот нормального распределения
- •12.9. Модель применения критериев
- •13. Рекомендации представления результатов статистической обработки для различных критериев и методов анализа «Метода проверки гипотез или статистических критериев»
- •14. Элементы теории корреляции
- •15. Дополнительные задачи по математической статистике
- •II. Задания для типовых расчетов
- •2.1. Элементы теории вероятностей
- •2.2. Элементы математической статистики и теории корреляции
- •Варианты: 2.1. -2.5.
- •Варианты: 2.6. -2.10.
- •Варианты: 2.11. -2.15.
- •Варианты: 2.16. -2.20.
- •Варианты: 2.21. -2.25.
- •Варианты: 2.26. -2.30.
12.2. Ошибки первого и второго рода
Следует помнить, что статистическое решение может быть ошибочным. При этом различают ошибки первого и второго рода.
Ошибкой первого рода называют ошибку, состоящую в том, что гипотеза Н0 отклоняется, в то время как она верна. Вероятность ошибки первого рода равна вероятности попадания статистики критерия в критическую область при условии, что верна гипотеза Н0, т. е. равна уровню значимости α: P[Z VK/ Н0]= α.
В рассмотренном выше примере 50 вероятность ошибки первого рода равна 0,05.
Ошибка второго рода происходит в том случае, если гипотеза Н0 принимается, но в действительности верна альтернативная гипотеза Н1. Вероятность ошибки второго рода β можно вычислить (при простой альтернативной гипотезе Н1) по формуле β = P[ZV\VK/H1].
Пример 51. В условиях примера 50 предполагаем, что наряду с гипотезой Н0: т = 10 л рассматривается альтернативная гипотеза Н1: т = 9л. В качестве статистики критерия снова возьмем выборочное среднее . Предположим, что критическая область задана следующим неравенством < 9,44 л . Найти вероятности ошибок первого и второго рода для критерия с такой критической областью.
Решение.
Найдем вероятность ошибки первого рода.
Статистика
критерия при условии, что верна гипотеза
Н0:
т =
10, имеет нормальное распределение
.
Используя таблицу приложений (П1),
находим
.
Полученный результат означает, что принятый критерий классифицирует ~8% автомобилей, имеющих расход 10 л на 100 км пробега, как автомобили, имеющие меньший расход топлива.
При
условии, что верна гипотеза Н1:
т = 9, статистика
X
имеет
нормальное распределение
.
Вероятность ошибки второго рода в этом
случае равна
.
Рис. 16.
Итак, в соответствии с принятым критерием 13,6% автомобилей, имеющих расход топлива 9 л на 100 км пробега, классифицируются как автомобили, имеющие расход 10 л. Вероятности ошибок первого и второго рода показаны в виде заштрихованных площадей под кривыми плотностей распределения статистики критерия на рис. 16.
При заданной вероятности α ошибки первого рода вероятность ошибки второго рода может быть уменьшена путем увеличения объема выборки. Если при этом вероятность ошибки второго рода не должна превышать заданного значения β, то минимальный объем выборки п можно найти из решения системы P[z<=VK/H0] = α, P=P[ZV\VK/ Н1]≤β.
Аналитическое решение такой системы возможно в простейших случаях.
Пример 52. Какой минимальный объем выборки п следует взять в условиях примера 50, чтобы при проверке гипотезы Н0: т = 10 л против альтернативной гипотезы Н1: т = 9 л ошибка первого рода была равна α = 0,01, а ошибка второго рода не превышала 0,1? Какова критическая область в этом случае?
Решение. Так как в альтернативной гипотезе Н1 предполагается меньшее значение параметра т, то критическая область VK определяется неравенством < . По условию задачи имеем
,
.
Запишем систему следующим образом:
,
.
Исключая
,
получим, что n
≥ 53. Подставляя
наименьшее значение п
в первое
уравнение системы, найдем границу
критической области:
.
Следовательно, критическая область VK определяется неравенством < 9,361.
Проверка статистических гипотез с использованием критериев значимости может быть проведена на основе доверительных интервалов. При этом одностороннему критерию значимости соответствует односторонний доверительный интервал, а двустороннему критерию значимости - двусторонний доверительный интервал. Гипотеза Н0 принимается, если значение θ0 накрывается соответствующим доверительным интервалом; в противном случае гипотеза Н0 отклоняется.
Если
проверяется гипотеза Н0:
θ1=
θ2,
то
рассматривается доверительный интервал
для разности θ1-
θ2.
Гипотеза Н0
принимается, если доверительный
интервал для разности параметров θ1-
θ2
накрывает
нулевое значение. Исключение составляет
проверка гипотезы о равенстве
дисперсий Н0:
так как
доверительный интервал строится для
отношения дисперсий, то гипотеза Н0
в этом случае принимается, если
доверительный интервал накрывает
значение, равное единице.
Пример 53. В условиях примера 50 проверить гипотезу Н0: т = 10 л при альтернативной гипотезе Н1: т < 10 л на уровне значимости α = 0,05, используя доверительный интервал для параметра т.
Решение.
Найдем
границу т2
левостороннего
доверительного интервала (-∞,т2)
для параметра т
при
доверительной вероятности 1-α
= 0,95. Используя
выборочное среднее
= 9,3 и начение
квантили u0,95
= 1,645 , получим
.
Так как значение т = 10 не накрывается интервалом (-∞;9,958), то гипотезу Н0 следует отклонить, что совпадает с результатом, полученным при решении примера 50.
