Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
111
Добавлен:
11.04.2015
Размер:
1.55 Mб
Скачать

§5 Проверка гипотеза о достоверности различий средних значений.

Во многих практических ситуациях возникает задача определения (сравнения) характеристики двух генеральных совокупностей, для решения которых используются выборочные данные.

Например:Пусть оказалось, что средний рост 100 студентов в Новосибирске 180 см, а в Норильске - 177 можно ли это объяснить случайными причинами или нет.

Задачи такого типа называются: “проверка гипотез о достоверности разности средних”

1. Проверка гипотезы о различии средних значений двух случайных величинξиηв случае, когда дисперсииξиηизвестны. Точнее даны две случайные величины, подчиняющееся нормальному распределению. ДисперсияDξ x2,Dηy2а генеральное среднееaxиay- не известны.

Надо проверить гипотезу.

H0= {ax=ay} противH1= {ax≠ay}

при этом имеется две выборки

x1,x2, … ,xn- значение случайной величиныξиy1,y2, …,ym - значение случайной величиныη.

Утверждение 1. Случайная величина:

(*)

приближенно подчиняется стандартному нормальному распределению

Из рисунка видно, что вероятность:

(**)

Из (*)и(**)получаем критерий:

если, то гипотезаH0= {ax=ay} принимается.

Если (1)не выполняется, то гипотезаH0отвергается в пользуH1.

Здесь α- уровень значимости критерия.

2Проверка гипотезы о равенстве генеральных средних в случае, когда дисперсии не известны.

Даны две случайные величины ξиη, генеральные средние у нихaxиay, генеральные дисперсииδx2иδy2. Все характеристики неизвестны. Надо проверитьH0 противH1.

Критерий основан на следующем факте:

Утвеждение!Случайная величина

(2)приближенно подчиняется распределению Стьюдента с (n+m- 2) степенями свободы, при растущихmиn:ξ~tn + m - 2

Совершенно аналогично предыдущему случаю получаем критерий:

(3) если

то гипотеза H0= {ax=ay} принимаются, иначеH0отвергается в пользуH1.

Здесь - выборочное среднее

α - уровень значимости

- квантиль распределения Стьюдента.

- выборочные дисперсии случайных величинξиη

Задача:При статистическом обследовании 100 случайно выбранных студентов 2-го курса в городе их рост ≈ 180 см, а при обследовании 70 студентов из Норильска их рост ≈ 177 см, по выборочным данным также посчитали, что:

проверить по этим данным: можно ли считать различие в росте случайным.

Решение:

сформулируем H0= {ax=ay} против альтернативыH1= {ax≠ay}.

Возьмем α = 0,05 и используем критерий (3):

4,6 > 1,97

Следовательно, различия нельзя считать случайными, и они вызваны некоторым факторами.

Замечание (о распределении Стьюдента):

Мы знаем, что распределение Стьюдента асимптотически -> к стандартному нормальному при увеличении n, поэтому при большомn, в таблицах смотреть про нормальное стандартное распределение.

§6 Критерий к. Пирсона. Хи-квадрат для проверки гипотез о законе распределения.

Во многих ситуациях необходимо проверять гипотезы не о значениях распределения, а о законе распределения в целом, для этого и используется критерий хи-квадрат. Перейдем к точной постановке:

дана некоторая случайная величина ξ, закон распределения которой точно не известен и выборка x1,x2…xn, состоящая изnнезависимых реализаций этой случайной величины. Необходимо проверить гипотезуH0= {ξподчиняется распределению сF(x,θ12, …,θk},

где θ12, …,θkнеизвестные параметры, против альтернативной гипотезы

H1= {ξне подчиняется распределению сF(x,θ12, …,θk}

К. Пирсон предложил статистический критерий для проверки H0противH1.

1) шаг(может отсутствовать) оцениваем методом maxправдоподобия неизвестные параметрыθ12, …,θk, и полученные оценки обозначимθ1*2*, …,θk*

2) шаг разбиваем область значений параметра на Rинтервалов следующим образом:

y0 = -∞yr= ∞ Интервалы [y0,y1], (y1,y2] … (yr – 1,yr] должны не пересекаться и должны содержать всю область возможных значенийξ

3) шаг: вычисляем так называемые теоретические вероятности

(1) Pi=P{ξє (yi – 1,yi]} вероятность того, что случайная величина попала вi-ый интервал.

для неправильных случайных величин можно использовать равенство:

(2) Pi=F(yi1*2*, …,θk*) -F(yi - 11*2*, …,θk*)F(B) –F(A)

4) шаг: (укрупнение частот) Проверяем для вычислимых теоретических вероятностей:

(3)nPi>= 5

Если при каком-то i(3)не выполняется, то этот класс присоединяется к одному из последних, и соответствующий интервал (yi – 1,yi] объединяется с соответствующим соседним.

5) шаг:

- вычисляем эмпирические частотыследующим образом:

(4)ν = {число элементов в выборке попавших в интервал (yi – 1,yi]}

6)шаг: вычисляем

(5)и проверяем гипотезу:

если, x22rk – 1; 1 -α, то принимается гипотезаH0, иначеH0отвергается в пользуH1.

Здесь χ2rk – 1; 1 -α- квантиль распределения хи-квадрат с (r–k– 1) числом степеней свободы.

α- уровень значимости критерия

Данный критерий основывается на следующем:

Теорема:величинаx2, вычисленная по(5)ассимтотически, при большихn, подчиняется распределениюχ2с (r–k– 1) степенями свободы (без доказательства).

На этой теореме основан критерий.

Если гипотеза H0не выполнена то, хотя бы при некоторыхi,νiдолжно сильно отличаться отnPi, и величинаx2 будет принимать большое значение:

Если H0выполнена, тоM(νi) =nPiи величинаx2 должна быть относительно не большой, т.е еслиx2 в(5)принимает относительно небольшие значения, то надо приниматьH0, в противном случае, когдаx2принимает большие значения,H0отклоняется, это и показано на рисунке.

Замечание!(5)и число классов подсчитываются после укрупнения интервалов на четвертом шаге.

Замечание!!В некоторых учебниках вместо(3)приводят неравенствоn*pi> 3 и т. п.

Пример:В комнате общежития живут четыре студента. Они решили проводить уборку по жребию, причем жеребьевку всегда проводил студент после 40 - жеребьевок студент подсчитал чтоA– 2 р. Б – 12р. В – 16р. Г – 10р.

Надо проверить по этим данным, что жеребьевка проводилась честно.

Сформулируем гипотезу точно:

H0 = {PA=PБ=PВ =PГ= ¼}, где

PS- вероятность дежурства студентаS, противH1=. Выборка из 40 элементов

Даны четыре класса (шаг 1 отстутсвует)

Третий шаг:-PA= ¼ =PБ=PВ =PГ

Четвертый шаг- проверим неравенство(3):

P*Pi= 40 * ¼ = 10 > 5

укрупнять интервалы не требуется.

Пятый шаг- дано, чтоνА= 2,νБ=12,νВ= 16, νГ= 10

Шестой шаг- вычисляемx2

Так как этот вопрос связан с честью студента, то мы берем высокий уровень значимости 0,01.

χ24 – 0 – 1; 0,99 ≈ 7,815, т.к

10,4 >> 7,815 Мы отвергаем гипотезу, что жеребьевка проводилась честно.