Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методичка 5175 Теор вер

.pdf
Скачиваний:
278
Добавлен:
06.06.2020
Размер:
1.64 Mб
Скачать

а) В случае известной дисперсии доверительный интервал имеет вид

где

– выборочное среднее; – объем выборки;

 

 

 

 

 

– точность интер-

 

 

 

 

 

 

 

 

 

вальной

 

оценки;

величина

находится

 

по функции Лапласа

 

 

 

 

 

 

 

из условия

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По условию

 

 

 

 

 

находим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

из

условия

 

 

 

 

 

 

 

 

 

 

по

таблице значений функции

:

 

 

 

тервал:

. Значит,

 

 

 

 

 

 

 

 

 

 

 

, а следовательно, доверительный ин-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

Итак, доверительный интервал

 

 

 

 

 

 

, длина которого равна

 

 

 

 

 

 

, с вероятностью

 

 

«накрывает» неизвестное мате-

матическое ожидание .

 

 

 

 

 

 

 

 

 

 

 

 

 

б)

В случае неизвестной дисперсии доверительный интервал имеет

вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где – выборочное среднее; – объем выборки;

 

 

 

 

– точность интер-

 

 

 

 

 

 

вальной оценки; величина

определяется как критическая точка

распределения Стьюдента по специальной таблице значений

.

По условию

 

 

 

 

 

 

 

 

находим по

указанной таблице

Значит,

 

 

 

 

 

 

 

, а

 

 

 

 

 

 

 

 

 

 

 

 

 

следовательно, доверительный интервал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

Итак, доверительный интервал

,

 

длина которого равна

, с вероятностью

«накрывает» неизвестное мате-

матическое ожидание .

 

 

 

 

 

 

 

 

 

 

81

 

(5).

Найти доверительный интервал для среднеквадратичного откло-

 

 

 

 

 

 

 

 

нения

 

.

 

 

 

 

Доверительный интервал для оценки неизвестного среднеквадратиче-

ского

отклонения имеет

вид

в

случае, если

 

, или 0

в случае, если

. Величина

определя-

ется

по

специальной

таблице значений

, связанных с

-распределением.

 

 

По условию

,

тогда

, а значит доверительный интервал

 

 

 

.

Итак, доверительный

интервал

, длина которого равна

, с вероятностью

накрывает неизвестное среднеквадратичное от-

клонение .

(6). По критерию Пирсона проверить гипотезу о нормальном распределении генеральной совокупности.

Критерий Пирсона позволяет проверить гипотезу о нормальном распределении генеральной совокупности путем сравнения эмпирических (полученных по выборке) и теоретических частот. Теоретические частоты – частоты, которые имели бы выборочные значения признака, если бы распределение генеральной совокупности было бы нормальным. В связи с этим проверка указанной гипотезы состоит из двух частей: сначала находятся теоретические частоты, а потом проводится сравнение эмпирических и теоретических частот, после чего делается вывод о том, верно или нет выдвинутое предположение о нормальности распределения.

1) Нахождение теоретических частот Вычисление теоретических частот состоит из нескольких этапов:

а) Считая, что распределение исходной совокупности – нормальное, в качестве параметров этого распределения принимаются статистические оценки, а именно , .

б) Для вычисления вероятности попадания нормально распределен-

82

ной непрерывной случайной величины в промежуток

 

, использу-

ется формула

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

в) Теоретическая частота

появления значения

из промежутка

вычисляется по формуле

теор

, где – объем выборки.

 

Для нахождения теоретических частот в первые четыре столбца табл. внесем данные из табл. 2. В пятом и шестом столбцах вычислим теоретиче-

ские значения

 

 

и

 

 

 

, где (с учетом предыдущих пунктов

 

 

 

 

 

решения задачи)

 

,

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица

 

Вспомогательная таблица для вычисления

 

 

 

 

теоретических частот

 

 

 

1

 

 

2

3

4

 

5

6

 

 

№п/п

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

36

38

3

 

2,09

1,60

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

38

40

2

 

1,60

1,11

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

40

42

2

 

1,11

0,62

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

42

44

5

 

0,62

0,13

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

44

46

7

 

0,13

0,36

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

46

48

5

 

0,36

0,85

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

48

50

3

 

0,85

1,34

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

50

52

3

 

1,34

1,83

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку непрерывная случайная величина, распределенная по нормальному закону, принимает свои значения на всей числовой прямой, а значения оказались сосредоточены на промежутке от –2,09 до 1,83, то нам необходимо эти границы «раздвинуть», в связи с этим указанные значения (в табл. они выделены жирным шрифтом) мы меняем соответственно на –∞ и +∞, тем самым в дальнейшем работаем с табл. 4. В седьмом и восьмом столбцах по специальным таблицам значений функции Лапласа и учи-

тывая свойства этой функции, вычисляем значения

и

. В девя-

том столбце подсчитывается величина

 

. В десятом –

83

вычисляются необходимые теоретические частоты . Последняя строка этой таблицы – контрольная для проверки сумм по столбцам. Суммы по четвертому и десятому столбцам должны равняться объему выборки (в нашем случае, 30), а сумма по девятому столбцу должна равняться 1, так как этот столбец содержит вероятности попадания в интервалы, образующие всю числовую ось.

Таблица 4

Расчет теоретических частот

1

2

3

4

5

6

7

8

9

10

№п п

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

36

38

3

1,60

0,5

0,4452

0,0548

1,644

 

 

 

 

 

 

 

 

 

 

2

38

40

2

1,60

1,11

0,4452

0,3665

0,0787

2,361

 

 

 

 

 

 

 

 

 

 

3

40

42

2

1,11

0,62

0,3665

0,2324

0,1341

4,023

 

 

 

 

 

 

 

 

 

 

4

42

44

5

0,62

0,13

0,2324

0,0517

0,1807

5,421

 

 

 

 

 

 

 

 

 

 

5

44

46

7

0,13

0,36

0,0517

0,1406

0,1923

5,769

 

 

 

 

 

 

 

 

 

 

6

46

48

5

0,36

0,85

0,1406

0,3023

0,1617

4,851

 

 

 

 

 

 

 

 

 

 

7

48

50

3

0,85

1,34

0,3023

0,4099

0,1076

3,228

 

 

 

 

 

 

 

 

 

 

8

50

52

3

1,34

+

0,4099

0,5

0,0901

2,703

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

1

30

 

 

 

 

 

 

 

 

 

 

2) Критерий Пирсона Для сравнения эмпирических и теоретических частот применяется

критерий согласия Пирсона, основанный на вычислении степени расхождения между частотами. Выдвигаются нулевая (основная) и альтернативная (конкурирующая) гипотезы:

: распределение генеральной совокупности не отличается от нормального распределения,

: распределение генеральной совокупности отличается от нормального распределения.

Для проверки основной гипотезы вычисляется статистика

п

84

Эта случайная величина (в предположении о справедливости гипотезы ) имеет -распределение. По экспериментальным данным вычисляет-

ся эмпирическое значение этой статистики

п и сравнивается с критиче-

ским значением

, где

– число степеней свободы указанно-

го распределения, в данном случае

 

; – число интервалов,

описывающих выборку; – количество неизвестных параметров распределения. В данном случае сравнение ведется с нормальным распределением,

значит,

 

(неизвестными параметрами являются математическое ожи-

дание и среднеквадратичное отклонение),

– уровень значимости.

Критическое значение

определяется по специальной таблице критиче-

ских точек

 

-распределения. Если

п

, то гипотезу

отвергают,

если же

п

, то говорят, что «нет оснований отвергнуть» нулевую

гипотезу. Критерий Пирсона применим тогда, когда теоретические частоты по каждому интервалу . Если хотя бы одно из значений оказывается меньше 5, то необходимо объединить соответствующие интервалы, но так, чтобы их количество не стало меньше трех. Если указанное объединение невозможно, то критерий Пирсона не применим. В случае объе-

динения интервалов в качестве

 

берется количество промежутков после

объединения.

 

 

В данном случае

,

. Заметим, что по неко-

торым промежуткам (табл. 4), а именно 1˗й, 2˗й, 3˗й, 6-й, 7˗й, 8˗й, теоретические частоты оказались меньше пяти, и, следовательно, интервалы необходимо объединить: первый со вторым и третьим, пятый с шестым и седьмой с восьмым. В связи с этим число интервалов сокращается до четырех,

т.е.

 

. Значит по таблице критических то-

чек -распределения

. Для удобства вычисления

статистики

п на основе предыдущих рассуждений составим табл. 5. Во

второй и третий столбцы вносим эмпирические и теоретические частоты (с учетом объединения), четвертый и пятый столбцы необходимы для промежуточных вычислений, элементы шестого столбца при суммировании дают значение статистики п. Седьмой столбец необходим для контроля, при

85

составлении

таблицы

должно выполняться

равенство (в данном случае

 

 

 

 

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

 

или, что то же самое,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчет

статистики

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

3

 

4

5

 

 

6

 

7

 

 

 

 

 

 

п

 

 

 

 

п

 

 

 

 

 

 

 

п

 

 

п

 

 

№п п

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

7

 

 

8,03

 

1,03

1,057

 

0,1316

 

6,1036

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

5

 

 

5,42

 

0,42

0,177

 

0,0327

 

4,6117

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

12

 

10,62

 

1,38

1,904

 

0,1793

 

13,5593

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

6

 

 

5,93

 

0,07

0,005

 

0,0008

 

6,0698

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

30

 

 

 

 

 

 

 

 

 

 

п=0,3444

 

30,3444

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Контроль:

 

 

 

 

 

. Верно.

 

 

 

 

 

 

 

 

Поскольку

п

 

 

 

 

, то нет оснований отвергнуть

гипотезу о нормальности генеральной совокупности.

 

 

 

 

 

 

Задача 2

Характеристикой технологического разброса служит дисперсия, значит, для решения задачи необходимо сравнить две дисперсии. Принимая совокупности, из которых произведены выборки, нормальными, в качестве критерия проверки выберем критерий Фишера.

Сформулируем основную и альтернативную гипотезу. В качестве альтернативной гипотезы целесообразно выбрать предположение производителя, тогда:

86

Для расчета эмпирического значения критерия Фишера найдем исправленные дисперсии по экспериментальным данным (для вычисления этих параметров необходимо воспользоваться техникой, описанной в задаче 1). Они составляют Подставим их в формулу для нахождения значения критерия

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

Найдем критическое значение критерия. Так как

, то число

степеней свободы совокупности с большей дисперсией равно 8 (

), а

число

степеней свободы совокупности с меньшей дисперсией

равно 9

(

). Критическая область задана нами как правосторонняя, следова-

тельно, уровень значимости

 

остается без изменений. По специаль-

ной таблице находим критическое значение критерия

.

 

 

Сравним эмпирическое и критическое значение критериев:

 

 

п

значит, оснований опровергнуть нулевую гипотезу нет.

Это означает, что если разработчики все-таки уверены в преимуществах своей технологии, им следует проводить эксперименты с выборками больших объемов.

Другая типовая задача:

Проведены исследования в двух группах подопытных крыс: первая группа содержалась в благоприятных условиях, вторая – в неблагоприятных. Целью исследования было выявить, увеличивается ли головной мозг крыс под воздействием благоприятной среды. Был выбран уровень значимости 5%. В результате испытаний первая группа, состоявшая из 50 животных, показала средний вес головного мозга 2,4 г при дисперсии 0,36 , вторая

87

группа, в которую входило 60 крыс, имела средний вес мозга 2,1 г при дисперсии 0,64.

Решение:

Так как выборки большие ( ), то можно воспользоваться формулой для сравнения двух средних величин при известных генеральных дисперсиях.

Сформулируем гипотезы. Предположение исследователей возьмем в качестве альтернативной гипотезы. Тогда в итоге имеем:

Рассчитаем наблюдаемое значение критерия по формуле:

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В нашем случае

,

, а следовательно

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Критическую точку найдем, используя функцию Лапласа. Для односторонней проверки

 

По условию

, поэтому

, а значит,

 

Так как критическая область правосторонняя, то она находится правее

точки

.

 

 

Наблюдаемое значение находится в критической области, следовательно, нулевую гипотезу следует отвергнуть и принять гипотезу о влиянии условий содержания на вес мозга крыс.

88

Задача 3

Проведем сравнение средней с гипотетической генеральной средней нормальной совокупности. В данном случае дисперсия задана, значит, имеем дело с известной генеральной дисперсией.

Сформулируем основную и альтернативную гипотезы. В данном случае можно провести как двустороннюю ( ), так и левостороннюю ( ) проверку. Выбор проверки зависит от того, предполагает ли исследователь конкретное направление сдвига или нет. Проведем для определенности двустороннюю проверку. Тогда имеем следующие гипотезы:

Для расчета наблюдаемого значения критерия воспользуемся формулой:

п

где – параметр, с которым сравнивается математическое ожидание.

п

Критические точки найдем, используя функцию Лапласа. Для двусторонней проверки

 

 

а следовательно,

 

 

Так как проверка – двусторонняя, то область принятия гипотезы огра-

ничена точками

и

. Вне этого интервала – критическая область.

Найденное нами наблюдаемое значение критерия , очевидно, находится внутри этого интервала, таким образом, оснований отвергнуть нулевую гипотезу о правильной настройке автомата нет.

89

Другая типовая задача:

Производитель утверждает, что средний вес изделий не ниже 100 г. Инспекция проводит проверку. Всего отобрано 10 изделий, вес которых составил в граммах:

Соответствуют ли данные утверждениям производителя, проведите проверку с уровнем значимости .

Решение:

Проведем сравнение средней с гипотетической генеральной средней нормальной совокупности, однако дисперсия не задана, а выборка малая (меньше 30 значений).

Сформулируем гипотезы. Постольку в задачи инспекции входит опровергнуть утверждения производителя, если эти утверждения ложные, в качестве конкурирующей гипотезы выдвинем предположение о занижении веса продукции. Тогда гипотезы будут следующими:

Предварительно рассчитаем среднюю выборочную и исправленное среднее квадратичное отклонение: (для вычисления этих параметров необходимо воспользоваться техникой, описанной в задаче 1).

Для расчета наблюдаемого значения критерия воспользуемся формулой:

п

 

п

Критическую точку найдем с помощью распределения Стьюдента, по

специальной таблице,

Число степеней сво-

боды в данном случае на единицу меньше объема выборки, т.е. 9. В данном случае граничная точка .

90