Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МС_2011-090100.doc
Скачиваний:
9
Добавлен:
21.09.2019
Размер:
926.72 Кб
Скачать

3.2. Построение доверительных интервалов для математического ожидания и дисперсии нормально распределённой св

Пусть – случайная выборка объёма n из генеральной совокупности Х, имеющей нормальное распределение с неизвестными параметрами m и . Будем считать, что в качестве точечных оценок этих параметров используются СВ и . Требуется при заданной доверительной вероятности  построить доверительные интервалы для математического ожидания и дисперсии СВ Х.

Доказывается, что при нормальном распределении СВ Х величина является дробью Стьюдента с степенями свободы. Пользуясь таблицей, по известным n и  найдём значение  из условия

. (1)

Учитывая равенства

,

получим доверительный интервал для математического ожидания в виде

,

где  определяется из условия (1). Реализация этого интервала имеет вид .

Доказывается, что при нормальном распределении СВ Х величина имеет распределение “хи-квадрат” с степенями свободы. Пользуясь таблицей, по известным n и  найдём и из условий

и . (2)

Тогда

.

Учитывая равенства

,

получим доверительный интервал для дисперсии в виде

,

где и определяются из условий (2). Реализация этого интервала имеет вид .

Изложенный метод построения доверительных интервалов для математического ожидания и дисперсии нормально распределённой СВ может применяться как при большом, так и при малом объёме выборки. С увеличением объёма выборки n при неизменной доверительной вероятности  средняя длина интервала уменьшается, а значит, растёт точность интервального оценивания.

4. Проверка статистических гипотез

4.1. Основные определения и общая схема проверки

Под статистической гипотезой понимается любое предположение о законах или параметрах распределения одной или нескольких СВ. Примеры статистических гипотез: наблюдаемая СВ имеет распределение Пуассона (нормальное распределение); две наблюдаемые СВ имеют одинаковое распределение; две наблюдаемые СВ являются независимыми; математическое ожидание (дисперсия) нормально распределённой СВ равно заданному числу; математические ожидания (дисперсии) двух нормально распределённых СВ равны между собой.

Для проверки истинности подобных предположений по данным выборок измерений рассматриваемых СВ разработаны специальные правила, называемые критериями. В результате проверки могут быть допущены ошибки двух видов. Ошибка первого рода – это отклонение гипотезы, которая в действительности является верной. Ошибка второго рода – это принятие гипотезы, которая в действительности не является верной. Вероятность ошибки первого рода называется уровнем значимости критерия. Вероятность отклонения гипотезы, которая в действительности не является верной, называется мощностью критерия.

Уровень значимости  при проверке гипотезы задаётся настолько малым, чтобы отклонение верной гипотезы можно было считать практически невозможным событием. Уменьшение вероятности ошибки первого рода ведёт, однако, к увеличению вероятности  ошибки второго рода, а значит, к уменьшению мощности критерия . В связи с этим уровень значимости следует выбирать в зависимости от потерь, вызываемых ошибками этих двух видов. Единственным способом одновременного уменьшения вероятностей ошибок первого и второго рода является увеличение объёмов выборок измеряемых СВ, поскольку при их стремлении к бесконечности значения  и  стремятся к нулю.

Если вид законов распределения СВ известен и выдвинуто предположение о значениях их параметров, то гипотеза называется параметрической. Если же выдвинуто предположение о законах распределения (о виде закона распределения СВ, об одинаковом распределении двух СВ, о независимости двух СВ), то гипотеза называется непараметрической.

Для проверки гипотезы вводится в рассмотрение некоторая вспомогательная СВ К, называемая статистикой критерия. Значение статистики К вычисляется по данным выборок измерений рассматриваемых СВ. Если выдвинута параметрическая гипотеза, то предполагается, что в случае её истинности закон распределения К при любых фиксированных (или при неограниченно больших) объёмах выборок является известным. Если же выдвинута непараметрическая гипотеза, то предполагается, что в случае её истинности закон распределения К при неограниченном увеличении объёмов выборок перестаёт зависеть от законов распределения СВ, относительно которых выдвинута гипотеза, и также является известным.

Множество возможных значений статистики критерия, при которых гипотеза принимается (отклоняется), называется допустимой (критичес-кой) областью. Критическая область обычно строится правосторонней или двусторонней. Правосторонняя область задаётся неравенством вида , где – значение статистики, которое при заданном уровне значимости  определяется из условия . Двусторонняя область задаётся двумя неравенствами вида и , где и – значения статистики, которые при заданном  определяются из условия

.

Общая схема проверки статистической гипотезы с помощью выбранного критерия может быть представлена так:

1) формируются выборки измерений СВ, относительно которых выдвинута гипотеза;

2) по данным выборок вычисляется значение статистики К, используемой для проверки выдвинутой гипотезы;

3) по заданному уровню значимости  с помощью таблицы распределения статистики К определяются допустимая и критическая области;

4) если вычисленное значение статистики К принадлежит допустимой области, то гипотеза принимается (считается, что данные имеющихся выборок не противоречат выдвинутому предположению о законах или параметрах распределения), если критической – отклоняется (считается, что данные выборок противоречат предположению).