
Пособие по мат. стат
.pdf
71
7 |
5,65–5,75 |
5,7 |
10 |
|
|
|
|
8 |
5,75–5,85 |
5,8 |
4 |
|
|
|
|
6.По выборке объема n 51 найдена смещенная оценка D 5 генеральной дисперсии. Найти несмещенную оценку дисперсии генеральной совокупности.
7.При измерении веса 20 шоколадных батончиков (с номинальным весом 50 г) получены следующие значения в граммах:
49,1; 50; 49,7; 50,5; 48,1; 50,3; 49,7; 51,6; 49,8; 50,1; 49,7; 48,8; 51,4; 49,1; 49,6; 50,9; 48,5; 52; 50,7; 50,6.
Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную медиану, крайние члены вариационного ряда.
8. По данным выборки составить статистическое распределение. Построить гистограмму частот, график накопленных частот. Вычислить несмещенные точечные оценки параметров генеральной совокупности.
2,8; 1,3; 3,1; 4; 1; 2,3; 5,1; 4,8; 4; 2,4; 3,2; 4; 6,1; 8; 10,5; 11; 3,1; 4,5; 9; 12; 15; 2,1; 3,2; 2,8; 9,6; 9,5; 3,6; 14; 15; 14; 2,9; 9,1; 9,8; 4,7; 7,1; 6,2; 8,1; 8,2; 8,6; 13; 10,3; 11; 7,5; 4,7; 10,8; 11,6; 5,9; 6,9; 3,1; 10.
9. Найти доверительный интервал для оценки с надежностью 0,99 неизвестного математического ожидания a нормально распределенного признака X генеральной совокупности, если известны генеральное среднее квадратическое отклонение σ , выборочное среднее x и объем выборки n :
а) σ 4, x 10,2,n 16; б) σ 5, x 16,8,n 25.
10.Найти минимальный объем выборки, при которой с надежностью 0,975 точность оценки математического ожидания нормально распределенной генеральной совокупности по выборочной средней равна 0,3, если известно среднее квадратическое отклонение генеральной совокупности
σ1,2.
11.Из генеральной совокупности извлечена выборка:
xi |
2 |
1 |
2 |
3 |
4 |
5 |
ni |
2 |
1 |
2 |
2 |
2 |
1 |
72
Оценить с надежностью 0,95 математическое ожидание a нормально распределенного признака генеральной совокупности с помощью доверительного интервала.
12. При измерении веса 20 шоколадных батончиков (с номинальным весом 50 г) получены следующие значения в граммах:
49,1; 50; 49,7; 50,5; 48,1; 50,3; 49,7; 51,6; 49,8; 50,1; 49,7; 48,8; 51,4; 49,1; 49,6; 50,9; 48,5; 52; 50,7; 50,6.
а) Найти доверительный интервал для среднего веса с надежностью
95 %.
б) Найти доверительный интервал для среднего квадратического отклонения с вероятностью 90 %.
13. По данным выборки объема n из генеральной совокупности нормально распределенного количественного признака найдено исправленное среднее квадратическое отклонение s . Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,95, если:
а) n 10, s 5,1; б) n 30, s 14 .
14.По данным выборки объема n 25 из генеральной совокупности найдено исправленное среднее квадратическое отклонение s 1 нормально распределенного признака. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,9.
15.По выборке из 25 упаковок товара средний вес составил 101 г с исправленным средним квадратическим отклонением 3 г. Построить доверительные интервалы для среднего и дисперсии с вероятностью 90 %.
16.По данным таблицы из задания 5б) построить доверительные интервалы для среднего и для следующего наблюдения с надежностью 95 %, используя нормальное приближение.
17.За последние пять лет годовой рост цены акции A составил в среднем 20 % со средним квадратическим отклонением (исправленным) 10 %. Построить доверительный интервал с вероятностью 95 % для средней цены акции в конце следующего года, если в начале года она была равна 1000 ден. ед.
18.Проведена случайная выборка личных заемных счетов в банке. Из n 1000 отобранных счетов 60 оказались с задолженностью по возврату
ссуды сроком до трех месяцев. Найти доверительный интервал с вероятностью 90 % для числа счетов в генеральной совокупности, которые имеют задолженность до трех месяцев, если банк насчитывает 30000 личных заемных счетов.
19. По данным социологического опроса, среди 100 человек 20 % пользуются стиральным порошком фирмы A . Сколько еще людей следует

73
опросить, чтобы с вероятностью 99 % получить результат с точностью до
1 %?
20. В ходе аудиторской проверки фирмы была проведена случайная выборка записей по счетам. Из выборки n 500 записей 10 содержали некоторые ошибки в самой записи или в процедуре. Найти доверительный интервал для доли ошибок во всей генеральной совокупности с вероятностью 95 %. Определить объем выборки, которую следует произвести аудитору, если он хочет определить с точностью 0,005 генеральную долю с доверительной вероятностью 95 %.
Ответы.
|
|
|
|
|
x 0; |
|
8,1; S 2 8,53; |
|
x 0,067; |
|
11,53; S 2 12,35; |
||||||||||||||||
1. |
а) |
D |
б) |
D |
|||||||||||||||||||||||
в) x 1,53; |
|
4,38; S 2 |
4,69 ; 2. а) 2621; б) 0,0502; 3. а) 167,29; б) 0,0344; в) |
||||||||||||||||||||||||
D |
|||||||||||||||||||||||||||
0,1336; 4. а) |
S 2 0,0525; |
s 0, 229 ; б) S 2 |
4,89; s 2,211; |
5. а) |
x 6,7; |
||||||||||||||||||||||
S 2 68,33 ; |
|
|
|
S 2 0,0297 ; |
|
|
|
|
|
S 2 1; |
|||||||||||||||||
б) |
x 5, 459 ; |
6. 5,1; |
7. x 50; |
D |
0,95; |
||||||||||||||||||||||
ˆ 0,97; s 1; xmed 50,1; xmin 48,1; xmax 52; |
8. |
[1,15]; |
|
k 7; |
h 2; |
||||||||||||||||||||||
x 7,08 ; |
S 2 15,38; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
№ |
|
Интер |
|
ni |
|
ni |
|
wi |
|
|
c |
|
|
|
wc |
|
xi |
|
||||||||
|
|
|
|
вал |
|
|
|
|
|
h |
|
|
|
wi |
|
|
|
i |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
h |
|
|
|
|
|||
|
1 |
|
[1,3) |
|
|
|
|
8 |
|
4 |
|
0,16 |
|
|
0,16 |
|
0,08 |
|
2 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
2 |
|
[3,5) |
|
|
|
|
13 |
|
6,5 |
|
0,26 |
|
|
0,42 |
|
0,21 |
|
4 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
3 |
|
[5,7) |
|
|
|
|
5 |
|
2,5 |
|
0,1 |
|
|
0,52 |
|
0,26 |
|
6 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
4 |
|
[7,9) |
|
|
|
|
6 |
|
3 |
|
0,12 |
|
|
0,64 |
|
0,32 |
|
8 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
5 |
|
[9,11) |
|
|
|
9 |
|
4,5 |
|
0,18 |
|
|
0,82 |
|
0,41 |
|
10 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
6 |
|
11,13 |
|
|
|
|
4 |
|
2 |
|
0,08 |
|
|
0,9 |
|
0,45 |
|
12 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
7 |
|
[13,15) |
|
|
|
5 |
|
2,5 |
|
0,1 |
|
|
1 |
|
0,5 |
|
14 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9. а) (7,63; 12,77); б) (14,23; 19,37); 10. 81; 11. (0,28; 3,72); 12. а) (49,53; 50,47); б) (0,79; 1,37); 13. а) (3,51; 9,31); б) (11,24; 18,85); 14. (0,81; 1,32); 15.
99,97 a 102,03; |
5,95 σ2 15,65; 16. |
5,43 a 5,49, |
5,12 x |
5,8 ; |
17. 895 A 1505; |
18. 1440 K 2160; |
19. n 10651, |
101 |
|
еще необходимо |
опросить 10551; 20. 0,0072 p 0,0378; n 3012 .
Контрольные вопросы
1. Дайте определение оценки параметра распределения.
74
2.Какая оценка называется эффективной, несмещенной, состоятельной?
3.По каким формулам можно вычислить выборочное среднее?
4.Как определяются смещенная и несмещенная оценки дисперсии? Какой формулой эти выборочные характеристики связаны между собой?
5.Как определяются выборочные мода и медиана?
6.Дайте определение квантили уровня p .
7.Какими равенствами задаются верхняя и нижняя критические границы, соответствующие уровню значимости ?
8.Дайте определение доверительного интервала.
9.Что называется надежностью доверительного интервала?
10.По каким формулам вычисляется точность интервальной оценки для математического ожидания генеральной совокупности?
11.Критические точки какого распределения используются при построении доверительного интервала для математического ожидания генеральной совокупности, при неизвестной дисперсии?
12.Критические точки какого распределения используются при построении доверительного интервала для дисперсии генеральной совокупности?

75
Глава 3
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Статистическая проверка гипотез
Статистической гипотезой называется любое предположение относительно генеральной совокупности. Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения, когда сам закон считается известным. Статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида самой функции распределения, т.е. о виде распределения.
Метод использования выборки для проверки истинности (ложности) статистической гипотезы называется статистическим доказательством истинности выдвинутой гипотезы. Наряду с выдвинутой гипотезой рассматривают одну или несколько альтернативных гипотез. Если выдвинутая гипотеза отвергается, то вместо нее принимается альтернативная гипотеза. Поэтому статистические гипотезы подразделяются на нулевые и
альтернативные. |
|
|
|
|
|
Нулевой (основной) называют выдвинутую |
гипотезу |
H0 . |
|||
Конкурирующей (альтернативной) называют гипотезу |
H1 , |
которая |
|||
противоречит основной. |
|
|
|
|
|
Различают гипотезы, которые содержат только одно или более одного |
|||||
предположений. |
|
|
|
|
|
Простой |
называют |
гипотезу, |
содержащую |
только |
одно |
предположение. Например, если a математическое ожидание нормального распределения, то гипотеза H0 :a 8 – простая. Сложной называют гипотезу,
которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза H0 :a 8 состоит из бесконечного множества
простых гипотез вида Hi :a bi , где bi любое число, большее 8.
Для проверки нулевой гипотезы используют специально подобранную случайную величину – выборочную статистику, точное или приближенное распределение которой известны.
Случайная величина K , построенная по результатам наблюдений для проверки нулевой гипотезы, называется статистическим критерием.
Схема построения критерия такова: все выборочное пространство делится на две взаимодополняющие области – область S отклонения
основной гипотезы и область S принятия этой гипотезы. Область S , при попадании в которую выборочной точки основная гипотеза отвергается, называется критической.
В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух видов.

76
Ошибка первого рода состоит в том, что отвергается основная гипотеза, хотя на самом деле она верна. Вероятность ошибки первого рода обозначают
P S / H0 .
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают P S / H1 .
Вероятность называют также уровнем значимости (размером)
критерия. Вероятность 1 не совершить ошибку второго рода называют
мощностью критерия.
Наблюдаемым значением Kнабл называют значение критерия,
вычисленное по выборкам.
Поскольку критерий K – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы являются интервалами и существуют точки, которые их разделяют.
Критическими точками (границами) kкр называют точки, отделяющие
критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством K kкр , где kкр положительное число. Левосторонней
называют критическую область, определяемую неравенством K kкр , где kкр отрицательное число. Односторонней называют правостороннюю или
левостороннюю области.
Двусторонней называют критическую область, определяемую неравенствами K k1, K k2 , где k2 k1 . В частности, если критические
точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами
K kкр, K kкр
или равносильным неравенством
K kкр .
Критическую область следует строить так, чтобы мощность критерия была максимальной. В этом случае мы получим минимальную ошибку второго рода.

77
Проверка гипотез для одной выборки
Рассмотрим простые методы проверки параметрических гипотез в случае нормального распределения (которые являются формально точными), а также гипотезы о вероятности «успеха» в испытаниях Бернулли (на основе асимптотической нормальности). Следующие три типа гипотез проверяются для нормальных данных: X Na, .
Гипотезы о неизвестном среднем a
Дисперсия генеральной совокупности 2 известна
Пусть генеральная совокупность распределена нормально, причем генеральная средняя a , хотя и неизвестна, но имеются основания полагать, что она равна гипотетическому значению a0 . Предположим, что дисперсия
генеральной совокупности известна.
Итак, из нормальной генеральной совокупности извлечена выборка
объема n и по ней найдена выборочная средняя x , причем генеральная
дисперсия 2 известна. Требуется по выборочной средней, при заданном уровне значимости , проверить нулевую гипотезу H0 :a a0 о равенстве
генеральной средней a гипотетическому значению a0 .
В качестве критерия проверки нулевой гипотезы принимаем случайную
величину |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a0 |
|
|||
|
|
|
a |
|
|
n |
x |
|
|||||
|
|
x |
|
|
|
||||||||
U |
|
0 |
|
|
|
|
|
|
|
, |
|||
|
|
|
|
|
|
|
|
|
|||||
(x) |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
которая распределена нормально, причем, при справедливости нулевой гипотезы, M (U ) 0, (U ) 1.
Критическая область также строится в зависимости от нулевой
гипотезы. По данным наблюдений вычисляем значения критерия |
|
||||||
|
|
|
|
|
x a0 |
. |
|
U |
|
|
|
n |
(3.1) |
||
набл |
|
|
|
||||
|
|
|
|
σ |
|
||
|
|
|
|
|
|
В первом случае, когда конкурирующая гипотеза имеет вид
H1 :a a0 ,
строим двустороннюю критическую область и по таблице функции Лапласа (прил. 1) находим критическую точку по равенству

78
0,1 uкр 1 α . 2
Если Uнабл uкр нет оснований отвергнуть нулевую гипотезу.
Если Uнабл uкр нулевую гипотезу отвергают.
Второй случай. При конкурирующей гипотезе H1 :a a0 получаем
правостороннюю критическую область. Критическую точку находят по равенству
0,1 uкр 1 22α .
Если Uнабл uкр нет оснований отвергнуть нулевую гипотезу.
Если Uнабл uкр нулевую гипотезу отвергают.
И, наконец, в третьем случае, при конкурирующей гипотезе H1 :a a0
строят левостороннюю критическую область. Ищется критическая точка по равенству
0,1 uкр 1 22α .
Если Uнабл uкр , тогда нет оснований отвергнуть нулевую гипотезу. Если Uнабл uкр , тогда нулевую гипотезу отвергают.
Дисперсия генеральной совокупности 2 неизвестна
В этом случае в качестве критерия проверки нулевой гипотезы принимаем случайную величину
T n x a0 , s
где s исправленное выборочное среднее квадратическое отклонение. Величина T имеет распределение Стьюдента с k n 1 степенями свободы.
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай. Конкурирующая гипотеза
H1 :a a0 .

79
Вычисляем наблюдаемое значение признака по данным выборки
|
|
|
x a0 |
|
|
Tнабл |
|
n |
(3.2) |
||
|
|
s |
|
||
|
|
|
|
|
и по таблице критических точек распределения Стьюдента (прил. 3), по заданному уровню значимости , помещенному в верхней строке таблицы, и числу степеней свободы k n 1, находим критическую точку
tдвуст.кр tα; k .
Если Tнабл tдвуст.кр нет оснований отвергнуть нулевую гипотезу. Если Tнабл tдвуст.кр нулевую гипотезу отвергают.
Второй случай. При конкурирующей гипотезе
H1 :a a0 ,
по уровню значимости , помещенному в нижней строке таблицы, и числу степеней свободы k n 1, находим критическую точку tправост.кр правосторонней критической области.
Если Tнабл tправост.кр нет оснований отвергнуть нулевую гипотезу. Если Tнабл tправост.кр нулевую гипотезу отвергают.
Третий случай. При конкурирующей гипотезе
|
H1 :a a0 |
|
находят критическую точку |
tлевост.кр tправост.кр |
левосторонней |
критической области.
Если Tнабл tлевост.кр нет оснований отвергнуть нулевую гипотезу. Если Tнабл tлевост.кр нулевую гипотезу отвергают.
Пример
Менеджер кредитного отдела нефтяной компании хотел бы выяснить, является ли среднемесячный баланс владельцев кредитных карточек равным 75 у. е. Аудитор случайным образом отобрал 100 счетов и нашел, что среднемесячный баланс владельцев составил 83,4 у. е. с выборочным исправленным отклонением, равным 23,65 у. е. Определить на 5 % уровне значимости, может ли этот аудитор утверждать, что средний баланс отличен от 75 у. е.
Решение. Исходя из условия задачи, сформулируем нулевую и конкурирующую гипотезы:

80
H0 :a 75, H1 :a 75.
Причем дисперсия генеральной совокупности 2 неизвестна. Уровень значимости 0,05. Для проверки нулевой гипотезы применим критерий T , имеющий распределение Стьюдента. Вычислим наблюдаемое значение критерия по формуле (3.2)
|
x a0 |
|
|
|
83,4 75 |
|
|
|
8,4 |
|
|
|
Tнабл |
|
n 1 |
100 1 |
99 |
3,53. |
|||||||
s |
|
23,65 |
23,65 |
|||||||||
|
|
|
|
|
|
|
|
|
|
Далее, по таблице критических точек распределения Стьюдента для двусторонней критической области, находим критическое значение
tкр t0,05;99 2.
Так как Tнабл tкр , то нулевая гипотеза отвергается и принимается
конкурирующая гипотеза H1 :a 75 , т.е. среднемесячный баланс владельцев отличен от 75 у. е.
Гипотезы о неизвестной дисперсии
Пусть генеральная совокупность распределена нормально, причем генеральная дисперсия, хотя и неизвестна, но имеются основания
предполагать, что она равна гипотетическому значению 02 .
Пусть из генеральной совокупности извлечена выборка объема n и по
ней найдена исправленная выборочная дисперсия S 2 . Требуется по исправленной дисперсии, при заданном уровне значимости, проверить
нулевую гипотезу, состоящую в том, что генеральная дисперсия 2 равна гипотетическому значению 02 . Таким образом, нулевая гипотеза имеет вид
H0 : 2 02 .
В качестве критерия проверки нулевой гипотезы примем случайную
величину (n 1)S 2 . Эта величина случайная, потому что в разных опытах S 2
02
будет принимать различные, наперед неизвестные значения. Эта величина имеет распределение 2 с k n 1 степенями свободы, поэтому будем обозначать ее