- •С. Б. Волкова математическая статистика и планирование эксперимента
- •§ 2. Интервальные оценки . . . . . . . . . . . . . . . . . . . . . . . . . 50
- •§ 3. Проверка статистических гипотез . . . . . . . . . . . . . . . . 58
- •§ 2. Доверительные интервалы для параметров
- •§ 3. Полные факторные эксперименты типа 2k.
- •§ 4. Оптимизация планов. Поиск экстремума
- •Предисловие
- •Введение
- •§ 1. Математическая модель статистического эксперимента
- •§ 2. Случайные величины
- •Глава 1. Элементы математической статистики
- •§ 1. Выборочный метод. Точечные оценки
- •§ 2. Интервальные оценки
- •§ 3. Проверка статистических гипотез
- •2. Проверка гипотезы о равенстве дисперсий двух нормально распределенных случайных величин.
- •§ 4. Однофакторный дисперсионный анализ
- •§ 5. Элементы теории корреляции
- •Глава 2. Планирование эксперимента
- •§ 1. Пассивный эксперимент
- •7. Оценивание функции отклика и ее параметров.
- •§ 2. Доверительные интервалы для параметров функции отклика и гипотеза адекватности
- •§ 3. Полные факторные эксперименты типа 2k . Анализ факторных экспериментов
- •4. Насыщенное и ненасыщенное планирование.
- •§ 4. Оптимизация планов. Поиск экстремума функции отклика
- •Для распределения 2 с n степенями свободы
- •Критические точки критерия 2:
- •Критические точки критерия 2:
- •Литература для дополнительного чтения
- •Светлана Борисовна Волкова математическая статистика и планирование эксперимента
- •162600, Г. Череповец, пр. Луначарского, 5.
2. Проверка гипотезы о равенстве дисперсий двух нормально распределенных случайных величин.
Определение. Случайная величина Fmn называется распределенной по закону Фишера со степенями свободы m и n, если она представляется в виде
,
где и – независимые случайные величины, распределенные по закону 2 с m и n степенями свободы соответственно.
Рассмотрим две независимые случайные величины и , распределенные по нормальному закону с дисперсиями и , которые предполагаются неизвестными. Пусть в результате наблюдений получены выборка значений x и выборка значений , и – исправленные выборочные дисперсии, соответствующие этим выборкам. Обозначим
и , (1)
тогда и – случайные величины, распределенные по закону 2 со степенями свободы соответственно m – 1 и n – 1 (см. § 2, п. 3 (в)). Из независимости и следует, что случайные величины (1) также независимы. В соответствии с определением случайная величина
(2)
распределена по закону Фишера со степенями свободы m – 1 и n – 1.
Теперь мы можем построить критерий для проверки гипотезы H0: .
Если эта гипотеза верна, то из (2) получаем
. (3)
Случайную величину (3) и используют в качестве критерия для проверки гипотезы H0. Рассмотрим
Случай 1: и заметно различаются и при этом > . В этом случае используется альтернативная гипотеза HА: . Вычисляют , затем по таблице критических точек распределения Фишера по уровню значимости и числам степеней свободы m – 1 и n – 1 отыскивается критическая точка Fкр(, m – 1, n – 1).
Если Fнабл < Fкр, то основную гипотезу принимают; если же Fнабл > Fкр, то основную гипотезу отвергают.
Если < , то можно аналогично использовать левостороннюю критическую область, но обычно, поскольку таблица не содержит соответствующих критических точек, снова используют правостороннюю критическую область, взяв в качестве критерия обратное отношение .
Случай 2: и различаются мало, тогда в качестве альтернативной берется гипотеза HА: . По уровню значимости /2 и числам степеней свободы m – 1 и n – 1 (m – 1 – число степеней свободы распределения с бóльшей выборочной дисперсией) ищут ( / 2, m – 1, n – 1), а затем .
Если < Fнабл < , основную гипотезу принимают, а при Fнабл < или Fнабл > ее отвергают.
Пример 1. Получены выборки значений двух независимых случайных величин, распределенных по нормальному закону. Объемы выборок m 11 и n 14, исправленные выборочные дисперсии и . Требуется проверить при уровне значимости 0,05 гипотезу H0: D D при альтернативной гипотезе HA: D D.
Здесь . По таблице критических точек распределения Фишера находим (0,025; 10; 13) 3,25, откуда . Так как < Fнабл < , то нет оснований отвергать гипотезу о равенстве дисперсий. Другими словами, выборочные дисперсии различаются незначимо.
Пример 2. По двум выборкам, объемы которых m 10 и n 18, найдены исправленные выборочные дисперсии и . При уровне значимости 0,05 требуется проверить гипотезу H0: D D, взяв в качестве альтернативной гипотезу HA: D > D.
Здесь критическая область является правосторонней. По таблице критических точек распределения Фишера находим критическую точку: (0,05; 9; 17) 2,50. Поскольку > , выборочные дисперсии различаются значимо. Гипотеза о равенстве дисперсий отвергается.
3. Проверка гипотезы о равенстве математических ожиданий двух нормально распределенных случайных величин с равными неизвестными дисперсиями. Пусть нормально распределенные случайные величины и независимы и их дисперсии неизвестны. По выборкам малого объема (меньше 30) нельзя получить хорошие оценки дисперсий. Но если предположить, что D D, то оказывается, что можно построить критерий Стьюдента для сравнения математических ожиданий. (Если нет уверенности, что дисперсии одинаковы, то, прежде чем сравнивать математические ожидания, следует с помощью критерия Фишера предварительно проверить гипотезу о равенстве дисперсий.)
Обозначим D D 2, M a, M b. Пусть получены выборки и значений соответственно x и , и – определяемые этими выборками эмпирические математические ожидания, и – исправленные эмпирические дисперсии. Так как случайные величины x и независимы, то и также являются независимыми случайными величинами и притом распределенными по нормальному закону. Отсюда следует, что разность распределена по нормальному закону. При этом имеем , , поэтому случайная величина распределена по нормальному закону, причем M0 0, D0 1.
Из независимости x и следует независимость случайных величин и , которые распределены по закону 2 со степенями свободы соответственно m – 1 и n – 1 (см. § 2, п. 3 (в)). Следовательно, случайная величина распределена по закону с m n – 2 степенями свободы (§ 2, п. 3 (б)). Но тогда случайная величина
(4)
распределена по закону Стьюдента с m n – 2 степенями свободы.
Теперь построим критерий для проверки гипотезы H0: M M, т. е. a b.
Если эта гипотеза верна, то (4) приводится к равенству
. (5)
Случайная величина (5) и является критерием для проверки гипотезы H0.
Случай 1: альтернативная гипотеза a b. В этом случае строится двусторонняя критическая область такая, чтобы вероятность попадания значения t в эту область в случае справедливости основной гипотезы была равна принятому уровню значимости .
Поскольку плотность вероятностей распределения Стьюдента – четная функция (см. § 2, п. 3), критические точки симметричны относительно нуля. Поэтому достаточно найти правую критическую точку. Ее находят по таблице критических точек распределения Стьюдента по уровню значимости / 2 и k m + n – 2 ( ).
Если , то основную гипотезу принимают.
Если , то основную гипотезу отвергают.
Случай 2: альтернативная гипотеза a > b. Строится правосторонняя критическая область. Единственную критическую точку находят по уровню значимости и числу степеней свободы n + m – 2 в таблице критических точек распределения Стьюдента: .
Если , то основная гипотеза принимается.
Если , то основную гипотезу отвергают.
Случай 3: альтернативная гипотеза a < b. В этом случае строится левосторонняя критическая область. Критическая точка .
Если , то основная гипотеза принимается.
Если , то основную гипотезу отвергают.
Пример. В ряде экспериментов исследовалось влияние CaO как активатора расширения ангидритовых растворов. Было изготовлено две серии пробных образцов по 6 штук каждая. Серия 0 (нулевая проба) не содержала CaO; серия 1 содержала 1% CaO. По результатам исследований получено: ; ; , т. е. имеются точечные оценки параметров двух случайных величин: 0 – расширения раствора, не содержащего CaO, и 1 – расширения раствора, содержащего CaO.
Выясним, значимо ли различие между обоими средними. Для этого проверим гипотезу M0 M1 при уровне значимости 0,05 и альтернативной гипотезе M0 M1.
Так как обе выборки имеют малый объем, то сначала нужно проверить гипотезу о равенстве их дисперсий. В этом случае воспользуемся односторонним критерием, так что конкурирующая гипотеза будет иметь вид: D > D По таблице критических точек распределения Фишера по уровню значимости 0,05 и числам степеней свободы находим . Так как , то исправленные выборочные дисперсии отличаются незначимо. Далее вычисляем и по таблице критических точек распределения Стьюдента по уровню значимости a / 2 0,025 и числу степеней свободы получаем . Так как , то основная гипотеза отвергается, другими словами, различие между средними значимо. Таким образом, влияние CaO как активатора расширения ангидритовых растворов существенно.
4. Эмпирические и теоретические кратности. Пусть имеются основания предполагать, что случайная величина распределена по некоторому определенному закону. Это предположение можно проверить, сравнивая эмпирические и теоретические кратности. Рассмотрим
Случай 1: предполагаемое распределение дискретно. Пусть в результате n испытаний случайная величина приняла nj раз значение zj ( j 1, 2, ..., m; n1 + n2 + ... + + nm n). Найдем вероятности pj значений zj, считая, что имеет предполагаемое распределение, и положим ( j 1, 2, ..., m). Числа назовем теоретическими кратностями значений zj в выборке объема n. Сравнение теоретических кратностей с эмпирическими (наблюдаемыми) кратностями nj дает возможность принять или отвергнуть гипотезу о распределении случайной величины по предполагаемому закону.
Случай 2: предполагаемое распределение является непрерывным. Тогда вероятности отдельных значений x равны нулю. В этом случае промежуток, содержащий все значения , разбивают на m непересекающихся промежутков одной той же длины h и вычисляют вероятности pj попадания значения в j-й промежуток, а затем, как и в случае дискретного распределения, сравнивают теоретические кратности с наблюдаемыми кратностями nj.
В частности, если случайная величина имеет непрерывную плотность вероятностей f, то, обозначая через yj и yj + h концы j-го промежутка, получаем , откуда следует .
Близость теоретических кратностей к наблюдаемым подтверждает гипотезу о предполагаемом распределении случайной величины .
5. Проверка гипотезы о нормальном распределении. Критерий согласия Пирсона. Критерий для проверки гипотезы о предполагаемом законе неизвестного распределения называют критерием согласия. Одним из критериев согласия является критерий Пирсона, который можно применять для проверки различных гипотез о законе распределения случайной величины. Для построения критерия числовая прямая разбивается на несколько промежутков и устанавливается наблюдаемое и теоретическое число значений случайной величины, попадающее в каждый промежуток. Обычно они различаются. Это различие может быть случайным (незначимым) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Может оказаться, что это различие не случайно (значимо) и объясняется тем, что теоретические кратности вычислены исходя из неверной гипотезы.
Здесь будет рассмотрено применение критерия Пирсона для проверки гипотезы о нормальном распределении.
Пусть имеется выборка значений случайной величины объема n. Отрезок, концами которого являются наименьшая и наибольшая варианты, содержит все числа этой выборки. Разобьем этот отрезок на m частичных промежутков одинаковой длины:
[ y1; y2), [ y2; y3), [ y3; y4), ..., [ ym–1; ym), [ ym; ym+1] (6)
(общие концы двух соседних промежутков отнесены к правому промежутку). Обозначим через nj – число элементов выборки, попавших в j-й промежуток (n1 + n2 + ... + nm n). Поскольку y1 и ym+1 – наименьшая и наибольшая варианты, то крайние промежутки последовательности (6) можно заменить промежутками (–; y2) и [ym; ), не меняя значений n1 и nm. Таким образом, мы получаем последовательность промежутков
(–; y2), [ y2; y3), [ y3; y4), ..., [ym–1; ym), [ym; ), (7)
объединение которых – вся числовая прямая. При этом n1, n2, ..., nm являются количествами чисел имеющейся выборки, попавшими в эти промежутки. Наряду с этими наблюдаемыми количествами можно построить теоретические в предположении, что случайная величина распределена по нормальному закону. Для этого введем в рассмотрение числа (середины промежутков последовательности (6)). Эти числа называют равноотстоящими вариантами, полученными группировкой выборки. Приписывая им в качестве кратностей числа nj, получим следующий закон распределения
|
|
... |
|
|
|
... |
|
Математическим ожиданием и дисперсией этого распределения являются числа
,
, (8)
которые называют выборочными математическим ожиданием и дисперсией, полученными группировкой выборки. При большом n эти числа мало отличаются от и .
Рассматривая числа и как приближенные значения математического ожидания и квадратичного отклонения случайной величины и предполагая, что эта случайная величина распределена по нормальному закону, найдем вероятности того, что ее значения попадают в промежутки (7). По формуле (5) из § 2 Введения получаем
;
при j 2, 3, ..., m – 1;
,
где ; .
Теоретические кратности находят по формуле: .
Рассмотрим теперь случайную величину
,
которая, как доказал Пирсон, распределена по закону 2 c m – 3 степенями свободы.
Ясно, что, чем меньше различаются числа nj и nj, тем меньше наблюдаемое значение этой случайной величины. Поэтому ее можно использовать для проверки гипотезы о нормальном распределении данной случайной величины .
Построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания значения критерия в эту область в предположении справедливости основной гипотезы равнялась принятому уровню значимости . Критическая точка удовлетворяет условию и находится по таблице критических точек распределения 2.
Если , то основную гипотезу принимают.
Если , то нулевую гипотезу отвергают.
Пример. Получена выборка значений случайной величины объема n 190. Найденные значения распределены по промежуткам следующим образом.
Промежуток |
[4; 6) |
[6; 8) |
[8; 10) |
[10; 12) |
[12; 14) |
Количество |
n1 15 |
n2 26 |
n3 25 |
n4 30 |
n5 26 |
Промежуток |
[14; 16) |
[16; 18) |
[18; 20) |
[20; 22] |
Количество |
n6 14 |
n7 16 |
n8 18 |
n9 20 |
Проверим гипотезу о нормальном распределении .
Находим равноотстоящие варианты:
, , , , , , , , .
По формулам (8) получаем 12,6, 4,93.
Вычисление чисел проведено с помощью расчетной таблицы, приведенной на стр. 72.
j |
yj |
|
(zj) |
pj (zj+1) – (zj) |
190pj |
1 |
– |
– |
–0,5 |
0,0901 |
17,119 |
2 |
6 |
– 1,34 |
–0,4099 |
0,0861 |
16,359 |
3 |
8 |
– 0,93 |
–0,3238 |
0,1219 |
23,161 |
4 |
10 |
– 0,53 |
–0,2019 |
0,1541 |
29,279 |
5 |
12 |
– 0,12 |
–0,0478 |
0,1581 |
30,039 |
6 |
14 |
0,28 |
0,1103 |
0,1446 |
27,474 |
7 |
16 |
0,69 |
0,2549 |
0,1094 |
20,786 |
8 |
18 |
1,10 |
0,3643 |
0,0689 |
13,091 |
9 |
20 |
1,50 |
0,4332 |
0,0668 |
12,692 |
10 |
|
|
0,5 |
|
|
|
|
Контроль: |
|
|
Отсюда следует 20,41, а по таблице критических точек распределения 2 (табл. 3) находим . Так как , гипотеза о нормальном распределении отвергается.
При использовании критерия Пирсона объем выборки должен быть не менее 50 и каждая группа должна содержать не менее пяти чисел выборки.