
- •Математическая статистика
- •1. Первичная обработка результатов измерений
- •1.1. Выборка и её вариационный ряд. Статистический ряд результатов измерений
- •1.2. Гистограмма и полигон частот
- •1.3. Статистическая функция распределения
- •2. Точечные оценки параметров
- •2.1. Понятие о точечных оценках параметров и их свойствах
- •2.2. Точечные оценки математического ожидания, дисперсии и среднего квадратического отклонения
- •2.3. Получение точечных оценок методом максимального правдоподобия. Оценки параметров распределения Пуассона и нормального распределения
- •3. Интервальные оценки параметров
- •3.1. Понятие об интервальном оценивании параметров
- •3.2. Построение доверительных интервалов для математического ожидания и дисперсии нормально распределённой св
- •4. Проверка статистических гипотез
- •4.1. Основные определения и общая схема проверки
- •4.2. Критерий согласия Пирсона
- •4.3. Критерий согласия Колмогорова
- •4.4. Критерий однородности Смирнова
- •4.5. Проверка гипотезы о независимости двух случайных величин
- •4.6. Проверка гипотезы о равенстве математических ожиданий и дисперсий двух нормально распределённых св
3.2. Построение доверительных интервалов для математического ожидания и дисперсии нормально распределённой св
Пусть – случайная выборка объёма n из генеральной совокупности Х, имеющей нормальное распределение с неизвестными параметрами m и . Будем считать, что в качестве точечных оценок этих параметров используются СВ и . Требуется при заданной доверительной вероятности построить доверительные интервалы для математического ожидания и дисперсии СВ Х.
Доказывается, что при нормальном
распределении СВ Х величина
является дробью Стьюдента с
степенями свободы. Пользуясь таблицей,
по известным n и
найдём значение
из условия
.
(1)
Учитывая равенства
,
получим доверительный интервал для математического ожидания в виде
,
где определяется
из условия (1). Реализация этого интервала
имеет вид
.
Доказывается, что при нормальном
распределении СВ Х величина
имеет распределение “хи-квадрат” с
степенями свободы. Пользуясь таблицей,
по известным n и
найдём
и
из условий
и
.
(2)
Тогда
.
Учитывая равенства
,
получим доверительный интервал для дисперсии в виде
,
где
и
определяются из условий (2). Реализация
этого интервала имеет вид
.
Изложенный метод построения доверительных интервалов для математического ожидания и дисперсии нормально распределённой СВ может применяться как при большом, так и при малом объёме выборки. С увеличением объёма выборки n при неизменной доверительной вероятности средняя длина интервала уменьшается, а значит, растёт точность интервального оценивания.
4. Проверка статистических гипотез
4.1. Основные определения и общая схема проверки
Под статистической гипотезой понимается любое предположение о законах или параметрах распределения одной или нескольких СВ. Примеры статистических гипотез: наблюдаемая СВ имеет распределение Пуассона (нормальное распределение); две наблюдаемые СВ имеют одинаковое распределение; две наблюдаемые СВ являются независимыми; математическое ожидание (дисперсия) нормально распределённой СВ равно заданному числу; математические ожидания (дисперсии) двух нормально распределённых СВ равны между собой.
Для проверки истинности подобных предположений по данным выборок измерений рассматриваемых СВ разработаны специальные правила, называемые критериями. В результате проверки могут быть допущены ошибки двух видов. Ошибка первого рода – это отклонение гипотезы, которая в действительности является верной. Ошибка второго рода – это принятие гипотезы, которая в действительности не является верной. Вероятность ошибки первого рода называется уровнем значимости критерия. Вероятность отклонения гипотезы, которая в действительности не является верной, называется мощностью критерия.
Уровень значимости
при проверке гипотезы задаётся настолько
малым, чтобы отклонение верной гипотезы
можно было считать практически невозможным
событием. Уменьшение вероятности ошибки
первого рода ведёт, однако, к увеличению
вероятности ошибки
второго рода, а значит, к уменьшению
мощности критерия
.
В связи с этим уровень значимости следует
выбирать в зависимости от потерь,
вызываемых ошибками этих двух видов.
Единственным способом одновременного
уменьшения вероятностей ошибок первого
и второго рода является увеличение
объёмов выборок измеряемых СВ, поскольку
при их стремлении к бесконечности
значения и
стремятся к нулю.
Если вид законов распределения СВ известен и выдвинуто предположение о значениях их параметров, то гипотеза называется параметрической. Если же выдвинуто предположение о законах распределения (о виде закона распределения СВ, об одинаковом распределении двух СВ, о независимости двух СВ), то гипотеза называется непараметрической.
Для проверки гипотезы вводится в рассмотрение некоторая вспомогательная СВ К, называемая статистикой критерия. Значение статистики К вычисляется по данным выборок измерений рассматриваемых СВ. Если выдвинута параметрическая гипотеза, то предполагается, что в случае её истинности закон распределения К при любых фиксированных (или при неограниченно больших) объёмах выборок является известным. Если же выдвинута непараметрическая гипотеза, то предполагается, что в случае её истинности закон распределения К при неограниченном увеличении объёмов выборок перестаёт зависеть от законов распределения СВ, относительно которых выдвинута гипотеза, и также является известным.
Множество возможных значений статистики
критерия, при которых гипотеза принимается
(отклоняется), называется допустимой
(критичес-кой) областью. Критическая
область обычно строится правосторонней
или двусторонней. Правосторонняя область
задаётся неравенством вида
,
где
– значение статистики, которое при
заданном уровне значимости
определяется из условия
.
Двусторонняя область задаётся двумя
неравенствами вида
и
,
где
и
– значения статистики, которые при
заданном определяются
из условия
.
Общая схема проверки статистической гипотезы с помощью выбранного критерия может быть представлена так:
1) формируются выборки измерений СВ, относительно которых выдвинута гипотеза;
2) по данным выборок вычисляется значение статистики К, используемой для проверки выдвинутой гипотезы;
3) по заданному уровню значимости с помощью таблицы распределения статистики К определяются допустимая и критическая области;
4) если вычисленное значение статистики К принадлежит допустимой области, то гипотеза принимается (считается, что данные имеющихся выборок не противоречат выдвинутому предположению о законах или параметрах распределения), если критической – отклоняется (считается, что данные выборок противоречат предположению).