Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект по ТВиМС.pdf
Скачиваний:
397
Добавлен:
29.02.2016
Размер:
774.54 Кб
Скачать

По таблице находим квантиль распределения Стьюдента t1−α/2(m + n − 2) = t0,975(28) = 2, 048. Сравниваем |TB| и t0,975(28): |TB| < 2, 048. Следовательно, расхождение между x¯ и y¯ не значимо. Гипотеза H0 принимается.

Пример. Цех в среднем выпускает n = 100 штук продукции в месяц. Затраты металла на 1 кг изготовленной продукции равны x¯ = 2, 47 кг. При этом σX = 1, 2 кг. После усовершенствований в технологическом процессе в следующем месяце оказалось y¯ = 2, 03 кг; σY = 1, 05 кг. Здесь X, Y - случайные величины, равные весу металла, затрачиваемого на изготовление одного килограмма одной штуки продукции в рассматриваемых месяцах. Требуется установить, привели ли усовершенствования к уменьшению затрат металла или различия объясняются естественным разбросом показателей.

Сначала проверяем гипотезу о равенстве дисперсий. Находим выборочное значение

статистики Фишера FB =

sX

=

1, 2

 

= 1, 14. Берем уровень значимости α = 0, 05 и

 

 

 

 

 

sY

1, 05

 

по таблице находим квантиль F1−α(k1, k2) = F0,95(100, 100) = 1, 4 распределения Фишера (интерполируем соседние значения таблицы). Сравниваем FB и 1.4: FB < 1, 4. Гипотеза о равенстве дисперсий принимается. Теперь проверяем гипотезу о равенстве математических ожиданий mX и mY . Вычисляем TB:

 

 

 

 

 

 

X2 + nσY2

r

m + n

 

 

 

 

 

 

 

 

 

TB =

p

− y¯

 

 

 

mn(m + n − 2)

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100 · (1, 22

+ 1, 052)r

 

 

 

 

 

 

 

 

 

 

 

 

 

·

 

100· + 100

 

 

 

 

 

=

 

2, 47 −

2, 03

100

 

100 (100 + 100

 

 

2)

= 2, 75.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По таблице

находим квантиль

t1−α/2(m+n−2) = t0,975(198) = 1, 96

распределения Стьюден-

 

p

 

 

 

 

та. Так как TB > 1, 96, то гипотеза H0 о равенстве математических ожиданий отвергается. Усовершенствования действительно привели к уменьшению затрат металла.

12.6Проверка гипотезы о законе распределения генеральной совокупности

12.6.1Общие вопросы

Закон распределения случайной величины является ее полной вероятностной характеристикой. Естественно стремление исследователей построить этот закон приближенно на основе статистических данных.

Сначала выдвигается гипотеза о виде закона распределения, который может быть в одномерном случае нормальным, показательным, Пуассона и т.д. Такая гипотеза может возникнуть из теоретических соображений (например, на основе центральной предельной теоремы), на основе анализа гистограммы, на основе статистической практики.

После того, как выбран вид закона распределения, возникает задача оценивания его параметров и проверки закона в целом.

Критериев проверки существует много. Мы рассмотрим наиболее обоснованный и наиболее часто используемый в практике - критерий χ2 (хи-квадрат), введенный английским математиком К.Пирсоном (1900г.) для случая, когда параметры закона известны. Этот критерий был существенно уточнен английским математиком Р.Фишером (1924г.), когда

88

1, . . . ,

параметры распределения оцениваются методом максимума правдоподобия по выборке, используемой для проверки.

Ограничимся случаем одномерного распределения.

Итак, выдвинута гипотеза H0 о генеральном законе распределения с функцией распределения F (x). Конкурирующей гипотезой является гипотеза о справедливости одного из конкурирующих распределений.

Рассмотрим два различных случая.

12.6.2Параметры проверяемого закона полностью известны

Эти параметры могут быть оценены по независимой выборке.

Разобьем генеральную совокупность, т.е. множество значений изучаемой случайной ве-

личины X, на k непересекающихся промежутков 1, 2, . . . , k. Пусть pi = P (X

i),i =

1, . . . , k. Если генеральная совокупность - вся вещественная ось, то подмножества

i =

[ai−1, ai) - полуоткрытые промежутки, i = 2, . . . , k − 1. Крайние промежутки будут полубесконечными: 1 = (−∞, a1), k = [ak, +∞).

k

X

Отметим, что pi = 1. Будем предполагать, что все pi > 0(i = 1, . . . , k).

i=1

Пусть далее n1, n2, . . . , nk - частоты попадания выборочных элементов в промежутки 1, 2, . . . , k соответственно. В случае справедливости гипотезы H0 относительные частоты ni/n при большом n должны быть близки к вероятностям pi(i = 1, . . . , k), поэтому за меру отклонения выборочного распределения от гипотетического с функцией F (x) естественно выбрать величину

k

n

− pi

2

 

i=1 ci ni

,

X

 

 

 

где ci - какие-нибудь положительные числа (веса). К.Пирсоном в качестве весов выбраны числа ci = n/pi(i = 1, . . . , k). Тогда получается статистика критерия хи-квадрат К.Пирсона

k

n ni

 

 

 

2

k

(ni − npi)

2

 

χ2 =

 

 

 

 

 

 

p

 

=

 

 

,

i=1

pi n

 

i

 

i=1

npi

 

 

X

 

 

 

 

 

 

 

X

 

 

которая обозначена тем же символом, что и закон распределения хи-квадрат. К.Пирсоном доказана теорема об асимптотическом поведении статистики χ2 при объ-

еме выборки n, стремящемся к бесконечности, которая указывает путь ее применения. Теорема К.Пирсона. Статистика критерия χ2 асимптотически при n → ∞ распреде-

лена по закону χ2 с k − 1 степенями свободы.

Замечание. Выбор подмножеств 1, . . . , k и их числа k в принципе ничем не регламентируется, так как n → ∞. Но так как число n хотя и очень большое, но конечное, то k и n должны быть согласованы. Обычно его берут таким же, как и для построения гистограммы, т.е. можно использовать специальные формулы. При этом, если k - промежутки, то их длины удобно сделать равными, за исключением крайних - полубесконечных.

Замечание. Числом степеней свободы функции называется число ее независимых аргументов. Аргументами статистики χ2 являются частоты n1, . . . , nk. Эти частоты связаны одним равенством n1 + . . . + nk = n, а в остальном независимы в силу независимости элементов выборки. Таким образом, функция χ2 имеет k − 1 независимых аргументов: число

89

частот минус одна связь. В силу теоремы Пирсона число степеней свободы статистики χ2 отражается на виде асимптотической плотности f(x).

Рассмотрим теперь второй наиболее важный в практическом отношении случай.

12.6.3Параметры проверяемого закона неизвестны

Неизвестные параметры оцениваются по той же выборке, которая используется для проверки гипотезы о законе распределения. Если оценка произведена по методу максимума правдоподобия, то справедлива теорема Р.Фишера, уточняющая теорему К. Пирсона.

Теорема Р.Фишера. Статистика критерия χ2 асимптотически при n → ∞ распределена по закону χ2 с числом степеней свободы, равным

r = k − l − 1,

где l - число параметров, оцененных по выборке.

Заключение теоремы Фишера объясняется тем, что оценивание параметров накладывает дополнительные связи на частоты n1, . . . , nk и поэтому уменьшает число степеней свободы статистики χ2.

Критерий проверки гипотезы сформулируем на основе теоремы Фишера.

Критерий проверки.

1.Выбираем уровень значимости α.

2.С помощью гипотетической функции распределения F (x) с l оцененными парамет-

2

 

 

i)(i = 1, 2, . . . , k).

рами вычисляем оценки вероятностей pˆi

= P (X

 

3. По таблице находим квантиль χ1−α(r) распределения хи-квадрат с r = k − l − 1 степенями свободы порядка 1 − α.

4. Находим частоты ni попадания элементов выборки в подмножества i(i = 1, 2, . . . , k) и вычисляем выборочное значение статистики критерия хи-квадрат:

χ2

=

n

(ni − npˆi)2

.

B

 

 

npˆi

 

 

=1

 

 

Xi

5. Сравниваем χ2B и квантиль χ21−α(r).

5.1Если χ2B < χ21−α(r), то гипотеза H0 принимается.

5.2Если χ2B ≥ χ21−α(r), то гипотеза H0 отвергается. Выбирается одно из альтернативных определений, и процедура проверки повторяется.

Отметим, что кроме критерия хи-квадрат, применяются критерии А.Н.Колмогорова, Н.В.Смирнова, Р.Мизеса и др.

Подробно рассмотрим использование критерия Колмогорова.

12.6.4 Критерий Колмогорова

На практике кроме критерия χ2 часто используется критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривают максимальное значение абсолютной величины разности между эмпирической функцией распределения Fn(x) и соответствующей теоретической функцией распределения

D = max |Fn(x) − F (x)|,

90

называемое статистикой критерия Колмогорова.

Доказано, что какова ни была бы функция распределения F (x) непрерывной случайной величины X, принеограниченном увеличении числа наблюдений (n → ∞) вероятность неравенства P (D n ≥ λ) стремится к пределу

+∞

P (λ) = 1 − X (−1)ke−2k2λ2 .

k=−∞

Задавая уровень значимости α, из соотношения

P (λα) = α

можно найти соответствующее критическое значение λα. В таблице приведены критические значения λα критерия Колмогорова для некоторых α.

Уровень значимости α

0,40

0,30

0,20

0,10

0,05

0,025

0,01

0,005

0,001

0,0005

Критическое значение λα

0,89

0,97

1,07

1,22

1,36

1,48

1,63

1,73

1,95

2,03

Схема применения критерия Колмогорова следующая:

1.Строятся эмпирическая функция распределения Fn(x) и предполагаемая теоретическая функция распределения F (x).

2.Определяется мера расхождения между теоретическим и эмпирическим распределением D по формуле и вычисляется величина

λ= D n.

3.Если вычисленное значение λ окажется больше критического λα, определенного на уровне значимости α, то нулевая гипотеза H0 о том, что случайная величина X имеет заданный закон распределения, отвергается. Если λ ≤ λα, то считают, что гипотеза H0 не противоречит опытным данным.

Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение возможно лишь тогда, когда теоретическая функция распределения F (x) задана полностью. Но такой случай на практике встречается весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия χ2 это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода поправок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв зв значения параметров их оценки, то получим завышенное значение вероятности P (λ), а значит, большее критическое значение λα. В результате есть риск в ряде случаев принять нулевую гипотезу H0 о законе распределения случайной величины как правдоподобную,

вто время как на самом деле она противоречит опытным данным.

91