Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ст. и пл.doc
Скачиваний:
32
Добавлен:
11.11.2019
Размер:
4.35 Mб
Скачать

2. Проверка гипотезы о равенстве дисперсий двух нормально распределенных случайных величин.

Определение. Случайная величина Fmn называется распределенной по закону Фишера со степенями свободы m и n, если она представляется в виде

,

где и – независимые случайные величины, распределенные по закону 2 с m и n степенями свободы соответственно.

Рассмотрим две независимые случайные величины  и , распределенные по нормальному закону с дисперсиями и , которые предполагаются неизвестными. Пусть в результате наблюдений получены выборка значений x и выборка значений , и – исправленные выборочные дисперсии, соответствующие этим выборкам. Обозначим

и , (1)

тогда и – случайные величины, распределенные по закону 2 со степенями свободы соответственно m – 1 и n – 1 (см. § 2, п. 3 (в)). Из независимости  и  следует, что случайные величины (1) также независимы. В соответствии с определением случайная величина

(2)

распределена по закону Фишера со степенями свободы m – 1 и n – 1.

Теперь мы можем построить критерий для проверки гипотезы H0: .

Если эта гипотеза верна, то из (2) получаем

. (3)

Случайную величину (3) и используют в качестве критерия для проверки гипотезы H0. Рассмотрим

Случай 1: и заметно различаются и при этом  >  . В этом случае используется альтернативная гипотеза HА: . Вычисляют , затем по таблице критических точек распределения Фишера по уровню значимости  и числам степеней свободы m – 1 и n – 1 отыскивается критическая точка Fкр(, m – 1, n – 1).

Если Fнабл < Fкр, то основную гипотезу принимают; если же Fнабл > Fкр, то основную гипотезу отвергают.

Если  <  , то можно аналогично использовать левостороннюю критическую область, но обычно, поскольку таблица не содержит соответствующих критических точек, снова используют правостороннюю критическую область, взяв в качестве критерия обратное отношение .

Случай 2: и различаются мало, тогда в качестве альтернативной берется гипотеза HА: . По уровню значимости /2 и числам степеней свободы m – 1 и n – 1 (m – 1 – число степеней свободы распределения с бóльшей выборочной дисперсией) ищут ( / 2, m – 1, n – 1), а затем .

Если < Fнабл < , основную гипотезу принимают, а при Fнабл < или Fнабл > ее отвергают.

Пример 1. Получены выборки значений двух независимых случайных величин, распределенных по нормальному закону. Объемы выборок m  11 и n  14, исправленные выборочные дисперсии и . Требуется проверить при уровне значимости   0,05 гипотезу H0: D  D при альтернативной гипотезе HA: D  D.

Здесь . По таблице критических точек распределения Фишера находим (0,025; 10; 13)  3,25, откуда . Так как < Fнабл < , то нет оснований отвергать гипотезу о равенстве дисперсий. Другими словами, выборочные дисперсии различаются незначимо.

Пример 2. По двум выборкам, объемы которых m  10 и n  18, найдены исправленные выборочные дисперсии и . При уровне значимости   0,05 требуется проверить гипотезу H0: D  D, взяв в качестве альтернативной гипотезу HA: D > D.

Здесь критическая область является правосторонней. По таблице критических точек распределения Фишера находим критическую точку: (0,05; 9; 17)  2,50. Поскольку  > , выборочные дисперсии различаются значимо. Гипотеза о равенстве дисперсий отвергается.

3. Проверка гипотезы о равенстве математических ожиданий двух нормально распределенных случайных величин с равными неизвестными дисперсиями. Пусть нормально распределенные случайные величины  и  независимы и их дисперсии неизвестны. По выборкам малого объема (меньше 30) нельзя получить хорошие оценки дисперсий. Но если предположить, что D  D, то оказывается, что можно построить критерий Стьюдента для сравнения математических ожиданий. (Если нет уверенности, что дисперсии одинаковы, то, прежде чем сравнивать математические ожидания, следует с помощью критерия Фишера предварительно проверить гипотезу о равенстве дисперсий.)

Обозначим D  D  2, M  a, M  b. Пусть получены выборки и значений соответственно x и , и – определяемые этими выборками эмпирические математические ожидания, и – исправленные эмпирические дисперсии. Так как случайные величины x и  независимы, то и также являются независимыми случайными величинами и притом распределенными по нормальному закону. Отсюда следует, что разность распределена по нормальному закону. При этом имеем , , поэтому случайная величина распределена по нормальному закону, причем M0  0, D0  1.

Из независимости x и  следует независимость случайных величин и , которые распределены по закону 2 со степенями свободы соответственно m – 1 и n – 1 (см. § 2, п. 3 (в)). Следовательно, случайная величина распределена по закону с m  n – 2 степенями свободы (§ 2, п. 3 (б)). Но тогда случайная величина

(4)

распределена по закону Стьюдента с m  n – 2 степенями свободы.

Теперь построим критерий для проверки гипотезы H0: M  M, т. е. ab.

Если эта гипотеза верна, то (4) приводится к равенству

. (5)

Случайная величина (5) и является критерием для проверки гипотезы H0.

Случай 1: альтернативная гипотеза ab. В этом случае строится двусторонняя критическая область такая, чтобы вероятность попадания значения t в эту область в случае справедливости основной гипотезы была равна принятому уровню значимости .

Поскольку плотность вероятностей распределения Стью­дента – четная функция (см. § 2, п. 3), критические точки симметричны относительно нуля. Поэтому достаточно найти правую критическую точку. Ее находят по таблице критических точек распределения Стьюдента по уровню значимости  / 2 и k  m + n – 2 ( ).

Если , то основную гипотезу принимают.

Если , то основную гипотезу отвергают.

Случай 2: альтернативная гипотеза a > b. Строится правосторонняя критическая область. Единственную критическую точку находят по уровню значимости  и числу степеней свободы n + m – 2 в таблице критических точек распределения Стьюдента: .

Если , то основная гипотеза принимается.

Если , то основную гипотезу отвергают.

Случай 3: альтернативная гипотеза a < b. В этом случае строится левосторонняя критическая область. Критическая точка .

Если , то основная гипотеза принимается.

Если , то основную гипотезу отвергают.

Пример. В ряде экспериментов исследовалось влияние CaO как активатора расширения ангидритовых растворов. Было изготовлено две серии пробных образцов по 6 штук каждая. Серия 0 (нулевая проба) не содержала CaO; серия 1 содержала 1% CaO. По результатам исследований получено: ; ; , т. е. имеются точечные оценки параметров двух случайных величин: 0 – расширения раствора, не содержащего CaO, и 1 – расширения раствора, содержащего CaO.

Выясним, значимо ли различие между обоими средними. Для этого проверим гипотезу M0  M1 при уровне значимости   0,05 и альтернативной гипотезе M0  M1.

Так как обе выборки имеют малый объем, то сначала нужно проверить гипотезу о равенстве их дисперсий. В этом случае воспользуемся односторонним критерием, так что конкурирующая гипотеза будет иметь вид: D > D По таблице критических точек распределения Фишера по уровню значимости   0,05 и числам степеней свободы находим . Так как , то исправленные выборочные дисперсии отличаются незначимо. Далее вычисляем и по таблице критических точек распределения Стьюдента по уровню значимости a / 2  0,025 и числу степеней свободы получаем . Так как , то основная гипотеза отвергается, другими словами, различие между средними значимо. Таким образом, влияние CaO как активатора расширения ангидритовых растворов существенно.

4. Эмпирические и теоретические кратности. Пусть имеются основания предполагать, что случайная величина  распределена по некоторому определенному закону. Это предположение можно проверить, сравнивая эмпирические и теоретические кратности. Рассмотрим

Случай 1: предполагаемое распределение дискретно. Пусть в результате n испытаний случайная величина  приняла nj раз значение zj ( j  1, 2, ..., m; n1 + n2 + ... + + nm  n). Найдем вероятности pj значений zj, считая, что  имеет предполагаемое распределение, и положим ( j  1, 2, ..., m). Числа назовем теоретическими кратностями значений zj в выборке объема n. Сравнение теоретических кратностей с эмпирическими (наблюдаемыми) кратностями nj дает возможность принять или отвергнуть гипотезу о распределении случайной величины  по предполагаемому закону.

Случай 2: предполагаемое распределение является непрерывным. Тогда вероятности отдельных значений x равны нулю. В этом случае промежуток, содержащий все значения , разбивают на m непересекающихся промежутков одной той же длины h и вычисляют вероятности pj попадания значения  в j-й промежуток, а затем, как и в случае дискретного распределения, сравнивают теоретические кратности с наблюдаемыми кратностями nj.

В частности, если случайная величина  имеет непрерывную плотность вероятностей f, то, обозначая через yj и yj + h концы j-го промежутка, получаем , откуда следует .

Близость теоретических кратностей к наблюдаемым подтверждает гипотезу о предполагаемом распределении случайной величины .

5. Проверка гипотезы о нормальном распределении. Критерий согласия Пирсона. Критерий для проверки гипотезы о предполагаемом законе неизвестного распределения называют критерием согласия. Одним из критериев согласия является критерий Пирсона, который можно применять для проверки различных гипотез о законе распределения случайной величины. Для построения критерия числовая прямая разбивается на несколько промежутков и устанавливается наблюдаемое и теоретическое число значений случайной величины, попадающее в каждый промежуток. Обычно они различаются. Это различие может быть случайным (незначимым) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Может оказаться, что это различие не случайно (значимо) и объясняется тем, что теоретические кратности вычислены исходя из неверной гипотезы.

Здесь будет рассмотрено применение критерия Пирсона для проверки гипотезы о нормальном распределении.

Пусть имеется выборка значений случайной величины  объема n. Отрезок, концами которого являются наименьшая и наибольшая варианты, содержит все числа этой выборки. Разобьем этот отрезок на m частичных промежутков одинаковой длины:

[ y1; y2), [ y2; y3), [ y3; y4), ..., [ ym–1; ym), [ ym; ym+1] (6)

(общие концы двух соседних промежутков отнесены к правому промежутку). Обозначим через nj – число элементов выборки, попавших в j-й промежуток (n1 + n2 + ... + nmn). Поскольку y1 и ym+1 – наименьшая и наибольшая варианты, то крайние промежутки последовательности (6) можно заменить промежутками (–; y2) и [ym; ), не меняя значений n1 и nm. Таким образом, мы получаем последовательность промежутков

(–; y2), [ y2; y3), [ y3; y4), ..., [ym–1; ym), [ym; ), (7)

объединение которых – вся числовая прямая. При этом n1, n2, ..., nm являются количествами чисел имеющейся выборки, попавшими в эти промежутки. Наряду с этими наблюдаемыми количествами можно построить теоретические в предположении, что случайная величина  распределена по нормальному закону. Для этого введем в рассмотрение числа (середины промежутков последовательности (6)). Эти числа называют равноотстоящими вариантами, полученными группировкой выборки. Приписывая им в качестве кратностей числа nj, получим следующий закон распределения

...

...


Математическим ожиданием и дисперсией этого распределения являются числа

,

, (8)

которые называют выборочными математическим ожиданием и дисперсией, полученными группировкой выборки. При большом n эти числа мало отличаются от и .

Рассматривая числа и как приближенные значения математического ожидания и квадратичного отклонения случайной величины  и предполагая, что эта случайная величина распределена по нормальному закону, найдем вероятности того, что ее значения попадают в промежутки (7). По формуле (5) из § 2 Введения получаем

;

при j  2, 3, ..., m – 1;

,

где ; .

Теоретические кратности находят по формуле: .

Рассмотрим теперь случайную величину

,

которая, как доказал Пирсон, распределена по закону 2 c m – 3 степенями свободы.

Ясно, что, чем меньше различаются числа nj и nj, тем меньше наблюдаемое значение этой случайной величины. Поэтому ее можно использовать для проверки гипотезы о нормальном распределении данной случайной величины .

Построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания значения критерия в эту область в предположении справедливости основной гипотезы равнялась принятому уровню значимости . Критическая точка удовлетворяет условию и находится по таблице критических точек распределения 2.

Если , то основную гипотезу принимают.

Если , то нулевую гипотезу отвергают.

Пример. Получена выборка значений случайной величины  объема n  190. Найденные значения распределены по промежуткам следующим образом.

Промежуток

[4; 6)

[6; 8)

[8; 10)

[10; 12)

[12; 14)

Количество

n1  15

n2  26

n3  25

n4  30

n5  26

Промежуток

[14; 16)

[16; 18)

[18; 20)

[20; 22]

Количество

n6  14

n7  16

n8  18

n9  20

Проверим гипотезу о нормальном распределении .

Находим равноотстоящие варианты:

, , , , , , , , .

По формулам (8) получаем  12,6,  4,93.

Вычисление чисел проведено с помощью расчетной таблицы, приведенной на стр. 72.

j

yj

(zj)

pj

(zj+1) – (zj)

 190pj

1

–

–

–0,5

0,0901

17,119

2

6

– 1,34

–0,4099

0,0861

16,359

3

8

– 0,93

–0,3238

0,1219

23,161

4

10

– 0,53

–0,2019

0,1541

29,279

5

12

– 0,12

–0,0478

0,1581

30,039

6

14

0,28

0,1103

0,1446

27,474

7

16

0,69

0,2549

0,1094

20,786

8

18

1,10

0,3643

0,0689

13,091

9

20

1,50

0,4332

0,0668

12,692

10





0,5

Контроль:

Отсюда следует  20,41, а по таблице критических точек распределения 2 (табл. 3) находим . Так как , гипотеза о нормальном распределении  отвергается.

При использовании критерия Пирсона объем выборки должен быть не менее 50 и каждая группа должна содержать не менее пяти чисел выборки.