Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
111
Добавлен:
11.04.2015
Размер:
1.55 Mб
Скачать

Глава III Проверка статистических гипотез.

§1 Основные понятия и терминологии.

Многие задачи и проблемы реальной жизни могут быть сформулированы как гипотезы.

Например:до нового года курс доллара достигнет 40 рублей; работа за компьютером более 5 часов в день приводит к близорукости через 2 года.

Многие гипотезы такого типа проверяются по экспериментальным данным, базируясь на методах математической статистики и теории вероятности.

Однако математическая статистика изучает не вообще всякие гипотезы, а только те которые могут быть сформулированы как предположение о параметрах законов распределения, в том числе и многомерных (включая предположение, взаимной зависимости случайных величин).

В математической статистике гипотеза обычно обозначается как: H0,H1,H2

Например:

H0= {доля студентов ни разу не пересдававших экзамен на курсе не меньше}

H1= {рост студентов подчиняется нормальному распределению}

H2= {чемпион мира по шахматам будет Каспаров}

H0- можно точно сказать, что статистическая

H1- можно уточнить

H2- не статистическая

Определение.Статистическая гипотеза называется простой, если она касается только одного параметра, а все остальные параметры распределения неизвестны. В противном случае гипотеза называется сложной.

Пример:

H0= доля студентов, посвящающих лекции по математике = 0, 9

H1= время работы телевизора подчиняется экспоненциальному распределению сλ= 1/4

H2= вес студентов 2-ого курса подчиняется нормальному распределению ≈ 70 кг

Решение:

H0- при небольшом уточнении может рассматриваться как простая, при условии, что второй параметр - число студентов на потоке - известен

H1- простая, потому что всего один параметр

H2- сложная гипотеза, т. к. у нормального распределения 2 параметра и о значении 2-го ничего не известно.

Статистическая гипотеза проверяется по выборочным данным, которые обозначаются через x1,x2, …,xn.

При проверке статистических гипотез обычно используется следующая схема: рассматривают 2 гипотезы H0иH1, взаимно исключающие друг друга, причемH0=(H1=). Одна из гипотез обычно обозначаемая черезH0называетсяосновной, а другая называетсяальтернативной. По результатам наблюдений, т.е. по выборке надо принять одно из двух решений:

1) гипотеза H0принимается (H1- отвергаются)

2) гипотеза H0отвергается в пользуH1.

Например:

гипотеза H0= {доля студентов, которые за 5 лет не пересдавали экзамены > 0, 6},H1= {…<=0,6}

При проверке статистических гипотез возможны ошибки двух типов:

Ошибка первого рода:

выполняется гипотеза H0, а на основе данных принята гипотезаH1.

Ошибка второго рода:

выполняется гипотеза H1, а на основе данных принята гипотезаH0.

Схематический пример:

Пациент пришел на прием к врачу. H0= {пациент здоров},H1= {пациент болен}. Ошибка первого рода происходит, если здорового приняли за больного, ошибка второго рода - если на оборот.

Сама процедура проверки гипотез по выборочным данным называется статистическим критерием, при этом всем множество возможных (выборочных) значений разбивается на две части

при этом S0∩S1= иS0US1= множество всех возможных значений.

Если (x1,x2, …,xn) єS0, то принимаемH0

Если (x1,x2, …,xn) єS1, то отвергаем в пользуH1, эта схема проверки статистических гипотез

Само правило называется статистическим критерием.

Конечно, хотелось бы сделать вероятность обеих ошибок (1-го и 2-го рода) маленькой. Однако это не всегда возможно, что определяется сутью дела. Потому что при малых объемах выборки мы имеем мало информации по изучаемой случайной величине.

В математической статистике принята следующая схема:

1) Вероятность ошибки первого рода обычно заранее фиксируется, как правило, она обозначается через α и называется уровнем значимости критерия.

Другими словами:

(1)α =P{x1,x2, …,xn}єS1{H0- истина}

2) Величина ошибки второго рода обозначается через β:

(2)β =P{x1,x2, …,xn}єS0{H1- истина}

величина (1 - β) - мощность критерия

В математической статистике стараются находить критерии, которые при фиксированном α обладают > мощностью (т.е. ошибка 1-го рода фиксирована,. а величина ошибки 2-го - наименьшая).

Обычно уровень значимости α= 0,05; 0,01 или 0,005 (или меньше), причем его величина зависит от важности задачи; в медицине маленький, в экономике и технике 0,05.