Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

KursLektcijTeoriiVeroyat

.pdf
Скачиваний:
24
Добавлен:
16.04.2015
Размер:
443.56 Кб
Скачать

xi σm =Ui

Величина Ui является случайной величиной с параметрами (0;1).

χ2 = nS*2

=

n

Ui2

σ 2

 

 

 

 

i=1

 

Случайная величина представляющая собой сумму квадратов n независимых случайных величин, каждая из которых подчиняется нормальному закону распределения с параметрами (0;1) и независимых случайных величин с распределением χ2 с к = n – степенями свободы.

Сама функция плотности вероятности f(χ2) имеет вид: f (χ2 )= Ln χn2eχ 2 2

Эта функция зависит только от объёма выборки и не зависит ни от математического ожидания, ни от дисперсии, ни от х.

Имеются таблицы распределения χ2 позволяющие вычислить вероятность события(χ2 > χк2,α )

P(χ2 , χк2,α ),

где: к – число степеней свободы;

α– доверительная вероятность, которая задаётся самим исследователем.

2)Математическое ожидание неизвестно.

Когда случайная величина Х с параметрами (m, σ2) – неизвестны.

Для оценки дисперсии генеральной совокупности используется величина:

S~2 =

1

 

n (x

 

)2

 

X

 

 

n +1

i

 

 

 

i=1

 

 

 

~2

Случайная величина nσS2 имеет распределение χ2 с к = n – 1 степенями свободы.

Уменьшение степени свободы использована для получения среднего выборочного.

Доверительный интервал.

Рассмотренные ранее оценки получили название точечных оценок. На практике широко используются интервальные оценки, для получения которых используется метод доверительных интервалов.

В методе доверительных интервалов указывает не одно(точечное) значение интересующего нас параметра, а целый интервал. Он строится на основе неравенства Чебышева:

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

Д

 

 

 

 

p(1p)

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

P

 

n

p

ε 1

 

 

 

=1

 

 

=1

 

 

 

 

 

 

 

 

ε2

 

ε2

 

ε2

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

4n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задаётся некоторое число 0 < α < 1 близкое к нулю, которое называется уровень

значимости.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Параметр ε находится из неравенства:

 

 

 

 

 

 

 

 

 

 

 

1

1

=1α

ε =

1

, тогда:

 

 

 

 

 

 

 

 

 

 

 

 

4nε2

 

2

nα

 

 

 

 

 

 

 

 

 

 

 

 

 

21

m

 

 

1

 

 

 

 

 

 

 

 

 

 

 

P n

p

n

α

 

1

α;

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

m

 

 

1

 

 

 

 

 

 

 

 

 

 

 

P n

p >

 

α

 

<α;

 

 

 

 

 

 

 

 

2

n

 

 

 

 

 

 

 

 

 

 

m

 

1

 

 

 

 

m

 

 

1

 

 

 

 

P n

α

p

n

+

2

n

α

 

1α

 

2

n

 

 

 

 

 

 

 

 

 

 

 

 

 

*

)

m

 

1

,

m

+

Интервал (P*, P

 

=

2

nα

n

 

 

 

 

 

 

n

 

 

2

1 называется доверительным интервалом с nα

уровнем значимости α.

Доверяясь расчёту мы утверждаем, что неизвестная вероятность принадлежит указанному интервалу, а вероятность возможной ошибки имеющей место тогда, когда этот интервал не накрывает истинное значение α не превосходит уровня значимости α.

n = 1000, m/n = 0,6

При α = 0,1

(0,550; 0,650)

При α = 0,01

(0,442; 0,758)

Истинное значение вероятности Р мы незнаем, но можем утверждать, что первый интервал накрывает это значение с вероятностью не менее чем 0,9 , а второй – 0,99.

Пример. Имеется некоторое предположение, гипотеза, о том, что неизвестная вероятность Р равна заданному число Р0:

Н0: р = р0; (Р0 = 0,5).

Эту гипотезу можно принять, а можно и отклонить посчитав её противоречащей известным статистическим данным.

Для принятия решения(проверки гипотезы) мы проделаем следующую процедуру: Если Р0 *, Р*) с α, то гипотезу принимаем(возможно здесь и ошибка, мы можем принять

ложную гипотезу – такая ошибка первого рода).

Если Р0 *, Р*) с α, то гипотеза отвергается(здесь тоже можем совершить ошибку отклонить верную гипотезу – такая ошибка второго рода, вероятность такой ошибки заранее задаётся нами при построении доверительного интервала).

При наших предположениях, когда уровень значимости равен 0,1 в общем мы имеем Р0 (0,550; 0,650). Эта гипотеза отвергается, при этом мы ошибаемся не более чем в 1 случае из 10.

Построение доверительного интервала для математического ожидания.

Случайная величина Х распределённая с параметрами (m, σ2).

Математическое ожидание неизвестно и требуется построить для него доверительный интервал.

1.Известно σ2.

2.Неизвестно σ2.

1. σ2 известно.

Проводится выборка из генеральной совокупности и в качестве несмещённой, состоятельной

и эффективной оценки математического ожидания выбирается X . Оно тоже подчиняется нормальному закону с параметрами:

 

2

m,σ

, где: n – объём выборки.

 

n

Нормированная величина:

X m

σ

n

22

подчиняется нормальному закону распределения с параметрами (0; 1), тогда вероятность:

 

X m

 

=Ф(Z p )= P =1α

 

 

P

 

< Z p

σ

 

 

 

 

n

 

 

Вероятность задаётся уровнем α, величина Р – доверительная вероятность. По таблице находим величину Zp.

При известном Zp получим:

 

σ

< m < X + Z p

σ

=1α

P X Z p

n

 

 

 

n

 

Интервал для математического ожидания (m*; m*) получим:

доверительный интервал для математического ожидания с уровнем значимости α.

2. σ2 неизвестно.

Точно так же проводится выборка объёмом n, формируется случайная величина t

t =

X m

n

~

 

S

 

Случайная величина t имеет распределение Стьюдента.

Зная объём выборки n, задаваясь уровнем значимости α или задаваясь доверительной вероятностью р=1-α.

По распределению Стьюдента находим tn,p – максимальное отклонение m и X .

 

X m

 

 

 

 

 

 

 

 

 

= P

=1α

P

 

~

 

n < tn, p

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где: Р – доверительная вероятность.

 

 

 

 

 

 

 

 

Отсюда легко строится доверительный интервал.

 

 

 

 

 

~

 

~

 

 

 

 

tn, p S

 

< m < X +

tn, p S

=1

α

P X

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

~

(m*;m* )=

 

 

 

X tn, p S ; X + tn, p S

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

Несмотря на кажущиеся совпадения двух формул они существенно отличаются друг от

друга.

Во втором случае величина доверительного интервала зависит не только от доверительной вероятности, но и от объёма выборки.

Это различие наиболее существенно проявляется при малых выборках.

Построение доверительного интервала для дисперсии.

Случайная величина Х распределена по нормальному закону с параметрами (m, σ2).

Требуется построить доверительный интервал для дисперсии по выборочным дисперсия.

S 2

или S~

2

{*

{

A

Б

 

 

 

Построение доверительного интервала для дисперсии основывается на том, что случайные величины:

2

~2

 

 

nS*

,

nS

 

– имеют распределение χ2 с

σ 2

σ 2

 

 

к = n, к = n – 1

– степенями свободы.

23

При заданной доверительной вероятности 1 – α мы записываем:

f(χ2)

 

 

 

~2

 

 

 

2

 

nS

2

 

 

P χ1

<

 

< χ2

 

=1α

 

σ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По таблице распределения χ2 мы

α/2

 

 

 

 

 

 

 

 

 

 

 

 

 

α/2

 

 

 

 

 

 

 

должны выбрать такие два числа χ12 и χ22 ,

 

 

 

1 - α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чтобы площадь заштрихованная была равна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1-α.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ12

 

 

 

χ22

 

 

 

 

 

 

 

 

 

χ2

 

 

 

 

 

 

 

 

 

 

 

 

таким образом, чтобы выполнялось неравенство:

 

 

 

 

 

Обычно величины χ12 и χ22 выбирают

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(χ2 < χ12 )= P(χ2 > χ22 )=α

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~2

 

 

 

 

 

 

 

 

α

 

 

 

 

α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6472 48

6472 48

 

 

 

 

 

 

 

 

 

 

 

 

 

 

< nS

< χ2

 

 

 

P(χ2

< χ2 )P(χ2 > χ

2 )

 

 

 

 

 

 

 

 

 

 

P χ

2

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

1

 

σ 2

2

 

 

 

 

 

 

 

 

1

 

 

 

 

 

2

 

В таблице распределения χ2 имеется только вероятность вида:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(χ2 > χк2,α )

 

 

 

 

 

 

 

Тогда:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(χ2 < χ12 )=1P(χ2 > χ22 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= P(χ2 > χ12 )P(χ2 > χ22 )=1α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P χ12 < nS

 

< χ22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Преобразуя это неравенство получим:

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

~2

 

 

2

 

 

~2

 

 

 

2

 

 

1

 

 

σ

2

 

 

 

1

 

 

2

 

2

 

 

 

 

 

nS

 

 

 

 

 

 

 

 

 

 

nS

 

 

 

nS

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P χ1

<

 

σ

2

< χ2

 

=

2 <

~2

 

<

 

2

= P

2 <σ <

2

=1α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ2

 

nS

 

 

χ1

 

χ2

 

 

χ1

 

2 *2

 

 

 

 

 

~

2

 

~

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nS

 

nS

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(σ* ,σ )=

 

2 ;

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ2

χ1

 

 

 

- доверительный интервал с уровнем значимости α.

 

 

 

 

 

 

 

~2

 

 

 

~2

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nS

 

 

 

nS

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(σ*,σ )

 

 

 

 

 

2 ;

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ2

 

 

 

χ1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка статистических гипотез.

Наряду с оценкой параметров распределения по выборочным данным большой интерес представляет вид (закон) распределения неизвестный на практике. Такие задачи решаются методами статических гипотез.

Относительно неизвестного теоретического распределения формируется некоторое предположение, которое формируется в виде гипотез.

Например, теоретическое распределение подчиняется нормальному, экспоненциальному закону.

При проверки гипотез используется принцип значимости основывающийся на принципе практической невозможности.

Согласно принципу практической невозможности события с очень малыми вероятностями в практических приложениях считаются невозможными.

Максимум таких вероятностей определяет уровень значимости α, который задаётся. В свою очередь согласно принципу значимости отвергается случайность появления

практически невозможного события.

24

Поскольку теоретическое распределение задано гипотезой, то легко рассчитать вероятность появления некоторого события при проведении испытаний или взятии выборки и пусть такая расчётная вероятность не превышает ε, т.е. событие является практически невозможным.

Если же такое событие происходит, то возникает противоречие между выдвинутой гипотезой и выборкой. Гипотезу следует отвергнуть в этом и заключается содержание принципа значимости.

Проверяемая гипотеза называется нулевой или основной Н0.

Если гипотеза отвергается, то принимается противопоставляемая ей гипотеза Н1, которая называется конкурирующей ил альтернативной.

Про проверки гипотезы Н0 возможны ошибки.

Можно отвергнуть гипотезу Н0 в условиях когда она верна и совершить ошибку I-го рода и можно принять гипотезу, когда она не верна и совершить ошибку II-го рода.

Решение поставленной задачи по сути дела состоит в разделении всего множества выборочных данных на 2-а не пересекающихся подмножества О и W. Таких, что решение принимается в пользу гипотезы Н0, если выборка принадлежит области О и в пользу гипотезы Н1, если выборка принадлежит подмножеству W. Область W называется критической областью выборочного пространства. Здесь гипотеза Н0 отвергается, а область О является областью допустимых значений. Здесь гипотеза Н0 принимается.

Проверка гипотезы о равенстве центров распределения математического ожидания 2-х нормальных генеральных совокупностей.

Задача имеет большой практический интерес. Достаточно часто наблюдается такая ситуация, что средний результат в одной серии эксперимента отличается от среднего результата в другой серии эксперимента.

Возникает вопрос: можно ли объяснить отличительное расхождение случайными ошибками эксперимента и относительно малыми объёмами выборки или это отклонение вызвано какимилибо неизвестными, незамеченными закономерностями.

Имеется две случайных величин Х и Y с нормальным законом распределения. Получим 2-е независимых выборки объёмом n1 и n2 из указанных генеральных

совокупностей.

Необходимо проверить: Н0: М(X) = М(Y)

H1: |M(X) – M(Y)| > 0

Рассмотрим два случая:

1. – известны дисперсия генеральной совокупности σX2 ; 2. – дисперсия неизвестна σX2 .

1 - σX2 ,σY2 M(X) и M(Y) - неизвестны, для их оценки мы используем средние выборочные

X иY .

Относительно X иY известно, что они подчиняются нормальному закону распределения с параметрами:

 

 

 

2

 

X m

 

,σx

 

 

 

X

 

n1

 

 

 

2

 

Y m

X

,σ y

 

 

 

 

 

 

 

 

n2

Рассмотрим случайную величину X Y . В силу независимости выборок эта случайная величина подчиняется нормальному закону распределения.

Её дисперсия:

D(

 

 

 

)= D(

 

)+ D(Y

)=

σx2

+

σ y2

X

Y

X

 

n

 

 

 

 

 

 

 

 

 

n

 

 

2

 

 

 

 

 

 

 

 

1

 

 

 

Если гипотез Н0 верна(справедлива), то тогда: M (X Y )= 0 . Величина:

25

z =

 

 

 

 

 

 

 

X

Y

 

 

с параметрами (0, 1)

σx2

+

σ y2

 

n

 

 

n

2

 

1

 

 

 

 

 

 

Выбирая уровень значимости α или доверительную вероятность Р = 1- α можем записать:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z

 

 

t

2

 

 

 

X Y

 

 

= P =1α = Ф(ZP ); Ф(Z )=

2

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

ZP

e

 

2 dt ;

σ 2

 

σ

 

 

 

2

 

 

2π

 

 

 

 

 

 

 

nx

+

 

y

 

 

 

0

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

Выбирая по величине интеграла вероятности значения ZP мы тем самым делим выборочных данных на область допустимых значений и критическую область.

Для области, где выполняется неравенство |Z| ≤ ZP – область допустимых значений(ОДЗ) Н0

– принимается.

А, если |Z| > ZP – критическая область(КО) Н0 – отвергается, Н1 – принимается.

Чем меньше α, тем меньше вероятность отклонить проверяемую гипотезе, если она верна. Но в этом случае увеличивается вероятность совершения ошибки II-го рода.

Чем меньше α, тем больше ОДЗ и тем больше вероятность принять проверяемую гипотезу, если она не верна, т.е. совершить ошибку II-го рода.

Методы проверки гипотез позволяют только отвергнуть проверяемую гипотезу, но они не могут доказать её справедливость.

2 -Дисперсия неизвестна.

Есть 2-е случайных величины X и Y, (mx ,σx2 )(my ,σ y2 ).

σx2 =σ y2 =σ 2 = ? mx и my

неизвестны берутся независимые выборки (n1;n2) и

рассматривается гипотеза: Н0: M(X) = M(Y)

H1: |M(X) – M(Y)| > 0.

Для оценки математического ожидания M(X) и M(Y) используем среднее выборочное X ,Y . Для оценки дисперсий используем:

~2

 

 

 

1

 

 

n1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

SX

=

 

 

 

(xi X )

n 1

 

 

1

 

 

i =1

 

 

 

 

- несмещённые, состоятельные оценки дисперсии.

~2

 

 

 

1

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

SY

=

 

 

 

 

 

i =1

(yi Y )

n2

1

 

 

 

 

 

 

 

Поскольку генеральные совокупности X и Y имеют одинаковые дисперсии, то для оценки

дисперсии σ 2 целесообразно использовать результаты обеих выборок.

Наиболее целесообразной оценкой дисперсии является средняя взвешенная этих двух

оценок.

~

2

(n

 

 

~2

(n

 

1)

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

X

1)+ S

Y

 

 

 

 

 

 

 

 

 

 

 

 

S 2 =

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 + n2 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если гипотеза Н0 справедлива,

 

 

то

тогда

 

случайная величина

 

 

 

 

 

подчиняется

 

 

 

 

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

1

1

 

нормальному закону распределения с M (X Y )= 0 и с дисперсией σ

 

 

 

 

 

 

 

 

 

+ n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

2

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mX Y

 

 

= 0;σ

 

n

+ n

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

26

~

 

 

 

~2

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

SX Y

= S

n

+ n

2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

~2

 

1 1

 

 

 

 

 

2

1 1

 

 

 

M S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ n

 

 

 

 

+ n

 

 

 

 

n

 

 

 

 

 

 

n

2

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

2

 

 

 

 

 

 

1

 

 

 

 

 

 

 

Если построить случайную величину:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

 

 

)~M (

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

t =

 

X

Y

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, то она будет подчиняться нормальному закону с параметрами (0; 1).

Т.к. σ 2 неизвестна, то такая

 

 

величина

 

подчиняется

 

t-распределению Стьюдента(со

степенями свободы n1 + n2 – 2).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для α(Р = 1– α) подсчитывается критическое значение tn +n

2

2,α

 

 

 

 

 

 

 

 

P(

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,α )=α

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

t

 

> tn +n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

> tn +n

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если вычисленные значения

 

 

 

 

2,α , то гипотеза Н0 отвергается и наоборот:

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

tn +n

 

 

 

2,α Н0 принимается.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка гипотезы о совпадении 2-х дисперсий.

Задача имеет важное практическое значение. Возникает при наладке какого-либо оборудования при сравнении точности приборов, инструментов, методов измерений.

По 2-м независимым выборкам вычислены оценки дисперсий:

 

 

S y2

 

 

и

Sy2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

Н

0

:σ

2

=σ 2

 

 

 

 

 

 

 

 

 

 

 

 

y1

y2

 

 

 

 

 

 

 

 

Н :

 

σ 2

σ 2

2

 

> 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

y1

y

 

 

 

 

 

 

 

 

 

Для проверки гипотезы Н0 используется критерий Фишера(F–критерий,

F–распределение).

 

Вычисляется коэффициент:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F =

S 2

 

, S 2

> S 2

 

 

 

 

 

 

 

 

 

 

 

y2

 

 

 

 

 

 

 

 

 

 

 

 

н

 

2

y

2

 

y

 

 

Число степеней свободы

 

 

 

 

 

 

 

 

 

 

Sy

 

 

1

 

ν2

большей дисперсии

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

Вычисляется критическое значение Fкр(α (или Р =

ν1

 

1 - α))

 

 

 

 

ν2 = n2 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

степенейЧисло меньшейсвободы

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсии

 

 

 

 

 

 

 

 

 

 

ν1 = n1 1

 

 

 

,где: ν – число степеней свободы числителя и знаменателя.

Если Fн > Fкр, то Н0 отвергается,

Fн < Fкр, то Н0 принимается.

Анализ однородности дисперсий.

Понятие однородности является обобщением понятия равенства дисперсий в случае, если число выборок превосходит 2(N > 2).

Для проверки гипотезы H0:

27

Н0: σ y21 =σ y22 = ... =σ y2N

Н1: дисперсия неоднородна.

Объёмы выборок n1,n2, … ,nN различны.

Когда объёмы выборок различны для решения задачи является χ2 с (N-1) степенями свободы. На практике наиболее частым является когда объёмы выборок одинаковы.

При равных объёмах выборок используется критерий Кохрана для проверки Н0. Есть соответствующее распределение, но оно громоздко.

В начале вычисляется фактическое значение критерия:

S 2

Gн = N ymax ;

Sy2i

i =1

Отношение максимальной оценки дисперсии к сумме всех оценок дисперсий вычисленных по табличным данным.

Для Р = 1 – α вычисляется критическое значение критерия Кохрана Gкр. При Gн ≤ Gкр - H0 принимается;

Gн > Gкр - H0 отвергается.

Проверка гипотез о законе распределения.

Имеется случайная величина Х, требуется проверить гипотезу Н0:

Н0: эта случайная величина подчиняется некоторому закону распределения F(x).

Для проверки гипотезы делается выборка состоящая из n независимых наблюдений над случайной величиной Х. По выборке строится эмпирическая функция распределения F*(x). Сравнивая эти распределения с помощью некоторого критерия(критерий согласия) делается вывод о том, что эти два распределения согласуются, т.е. Н0 – принимается.

Существует несколько критериев согласия: χ2 Пирсона, критерий Колмогорова и т.д.

Критерий согласия χ2 Пирсона.

Имеется случайная величина Х, выдвигается гипотеза Н0: F(x), делается выборка. Диапазон Хmin – Хmax разбивается на ℓ интервалов. Размер интервала определяется по

правилу Старджесса.

1; 2; 3;…; .

 

 

 

 

 

 

Интервал

i

1

2

3

 

Эмпирическая частота mi

m1

m2

m3

m

 

Теоретическая частота npi

np1

np2

np2

np

l

mi = n;

i =1

mi > 3(в среднем 5 - 7).

При mi < 3 укрупнить интервал.

Находим частоту попадания случайной величины внутрь каждого интервала. Поскольку теоретическое распределение задано в гипотезе Н0 всегда можно найти

вероятность pi попадания случайной величины внутрь каждого интервала.

l

pi =1;

i=1

χ2 Пирсона предполагает, что надо построить:

χ2 = l (mi npi )2

i=1 npi

(имеет распределение χ2 только при относительно больших n (n > 50)).

Порядок применения χ2 Пирсона:

28

1.Рассчитывается эмпирическое значение критерия χ2;

2.Выбирается уровень значимости α (при Р = 1 - α);

3.По таблице подсчитывается χк2,α ,

где: α – уровень значимости;

к– число степеней свободы.

Вобщем случае к = ℓ - r – 1,

 

где: ℓ - количество интервалов разбиения;

 

 

r – количество параметров распределения подсчитанных по выборке;

Здесь к = r – 1.

 

 

Если

χ2

> χк2,α

гипотеза Н0

отвергается

χ2

< χк2,α

гипотеза Н0

принимается

Критерий Колмогорова.

По результатам выборки объёмом n строится эмпирическая функция распределения F(х). Принимается гипотеза Н0: случайная величина Х подчиняется распределению описанному функцией F(x).

За меру расхождения функций принимается величина:

 

D = max F* (x)F(x)

F(x),F*(x)

Существуют таблицы распределения Колмогорова

 

F(x)

в которых можно найти:

 

o

D

Dn - критическое значение. Оно зависит от уровня

значимости α(Р = 1 - α), величины D и величины выборки

 

 

n.

 

Если полученные из опыта значения коэффициента D

o

оказывается больше критического Dn , то Н0 отвергается.

o

Если D > Dn гипотеза Н0 отвергается

o

D < Dn гипотеза Н0 принимается

o

С помощью величины Dn можно построить доверительные границы для неизвестной функции

F(x):

F* (x)D

o

o

n

< F(x)< F* (x)+ D

 

n

Колмогоров показал, что при n → ∞ величина:

λ = D n

подчиняется распределению Колмогорова.

+∞

F(λ)= (1)к e2к2λ2

к=−∞

Критерий Колмогорова так же может быть использован для статистической проверки принадлежности двух выборок объёмом n1 и n2 к одной и той же генеральной совокупности. Вычисляется параметр λ:

λ =

n1n2 max

 

F* (x)F* (x)

 

 

 

 

n1 + n2

 

1

2

 

 

 

 

 

 

29

где: F1* и F2* - эмпирические функции распределения соответственно первой и второй выборки. По величине λ судят о согласии.

Раздел 6. Основы дисперсионного анализа.

Дисперсионный анализ – это статистический метод анализа результатов наблюдений зависящий от различных одновременно действующих факторов и позволяющий выбрать из ряда факторов наиболее важные, оценивать их влияние.

Основными предпосылками дисперсионного анализа является как правило нормальное распределение результатов наблюдений и отсутствие влияния исследуемых факторов на дисперсию результатов наблюдения.

Обязательным здесь является возможность управляемого изменения фактора в рамках его разновидностей называется уровнями фактора. Эти эксперименты могут быть пассивными, когда существование уровней и их смена является естественными для исследуемого объекта и активными, когда эти изменения искусственно вносятся экспериментатором по заранее составленному плану.

Идея дисперсионного анализа в разложении общей дисперсии случайной величины на независимые случайные слагаемые, каждый из которых характеризует влияние того или иного фактора, или их взаимодействие. Последующие сравнения этих дисперсий позволяют оценить сущность влияния факторов на исследуемую величину.

Пусть Х – это некоторая случайная величина зависящая от 2х действующих на неё факторов А и В.

X - среднее значение исследуемой величины. Отклонение: X X =α + β +γ

где: α – отклонение вызванное фактором А; β – отклонение вызванное фактором В;

γ - отклонение вызванное другими факторами. α, β, γ – случайные величины независимы.

Дисперсию случайной величины Х, α, β, γ обозначим:

σx2 ,σα2 ,σβ2 ,σγ2

где: величина σγ2 - остаточная дисперсия учитывающая влияние случайных и прочих неучтённых

факторов.

Для независимых и случайных величин имеет место равенство:

σx2 =σα2 +σβ2 +σγ2

Сравнивая σα2 или σβ2 с величиной σγ2 можно установить степень влияния факторов А и В на величину Х по сравнению с неучтёнными и случайными факторами.

Сравнивая между собой σα2 и σβ2 мы можем оценить сравнительную степень влияния

факторов А и В на величину Х.

Дисперсионный анализ позволяет на основании выборочных данных найти все значения дисперсии σx2 ,σα2 ,σβ2 ,σγ2 . Далее используя соответствующие критерии можно оценить степень

влияния параметров А и В на исследуемую случайную величину.

Если речь идёт о влиянии одного фактора на исследуемую случайную величину, то речь идёт об однофакторном дисперсионном анализе. Если же речь идёт о многих факторах, то говорят о многофакторном дисперсионном анализе.

Однофакторный дисперсионный анализ.

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]