книги / Прикладная статистика
..pdfдисперсией о2. Показать, что несмещенной оценкой для о1 будет статистка: , д
"/=1
2.В результате проведения п независимых экспериментов в одних и тех же условиях событие А произошло к раз. Показать, что относительная частота к/п появления события А будет не смещенной к состоятельной оценкой вероятности/? события А в одном эксперименте. Определить такое значениер, при котором дисперсия этой оценки будет максимальна.
3.Пусть генеральная совокупность X имеет равномерное
распределение на интервале (я, а +./), причем а неизвестно. Из генеральной совокупности извлечена выборка х {9 ху ,.,9хп объ ема п. Для оценки параметра а можно использовать статистики:
1 н |
0,5 и я2 = тах(лг/ ) - |
к |
Х 1 - |
л Т Т ’ |
|
м.=| |
|
Показать, что оценки эти не смещены. Найти дисперсию слу чайных величин л, и аг
4. Из генеральном совокупности Х шравномерно распреде ленной на НЕггервалс (ет, Ь)> извлечена выборка объема п: х г хг
.... хл~Длина интервала к =Ь -а известна, ко середина интервала С = (а + Ь)/1 неизвестна. В качестве оценки середины интервала предлагается случайная вешечина:
- _ тах (л г,)+ 1тп (.т,)
Доказать несмещенность этой^оцешш.
5. Из равномерно распределенной на интервале (а, Ь) гене ральной совокупности X извлечена выборка объема п: х г ху ...» хп, В качестве оценки длины интервала {Ь-а) предлагается слу
чайная величина: - . . /
к = тах(х/) - тт(л-,)
Доказать смещенность этой оценки.
6. Из нормально распределенной генеральной совокупнос ти с параметрами а=18,1 и а =2,3 извлечена выборка объема 9. Найти вероятности следующих событий:
151
я) {-V < 1 б},б){ 15 < \- < 17} и){| б < .V< 19}.
Как измелится решение для выборки объема л = 36?
7.Некий кандидат набрал на выборах 45% голосов. Из всей совокупности избирателей случайным образом отобрали две группы людей. Оценить вероятность того, что разность меж ду долями голосов, подоешых за этого кандидата в каждой из групп, окажется больше 0,05.
8.У случайно отобранных 525 студентов г.гужекого пола из
мерили рост. Средний рост оказался равным 181 см, выборочное среднее квадратическое отклонение роста 5 = 3,35 см. Какова точность оценки среднего роста с надежностью 0,95?
9. При испытании на крепость случайно отобранных 400 от резков одиночной нити были получены следующие результаты:
Крепость, г |
Числоиспытанны* |
Крепость, г |
Число иены глины* |
105-125 |
образцов |
205 225 |
обратив |
8 |
120 |
||
125-145 |
24 |
225-245 |
35 |
145-165 |
40 |
245-265 |
20 |
365-1В5 |
56 |
265-285 |
7 |
185-205 |
84 |
285-305 |
6 |
а) С вероятностью 0,95 определить среднюю крепость нити во всей партии.
б) С какой вероятностью можно утверждать, что разность между средней крепостью пряжи в выборочной и генеральной совокупностях нс превысит 3,5 г?
в) Сколько нужно отобрать для испытании образцов одиноч ной нити, чтобы с вероятностью 0,99 утверждать, что разность между средней крепостью пряжк в выборочной и генеральной совокупностях не превысит 3 г?
г) С вероятностью 0,95 определить гарантийные пределы, в которых находится доля пряжи во всей совокупности с крепос тью, превышающей 250 г.
152
д) Как изменить объем выборки, чтобы с вероятностью 0,9 можно было гарантировать отклонение выборочной доли от ге неральной, не превышающее 0,02?
е) С какой вероятностью можно утверждать, что выборочная доля будет отличаться от генеральной нс более чем на 0,025?
10*Для определения средней дальности пробега автомобилей наугад отобрали 100 путевок. Получены следующие данные:
Дальность пробега |
Число |
Дальность пробега |
Число |
аогомобллсй, км |
путевок |
автомобилей, км |
путевок |
20-50 |
3 |
170-200 |
13 |
50-80 |
7 |
200-230 |
6 |
80-110 |
И |
230-260 |
4 |
110-140 |
28 |
260-290 |
1 |
140-170 |
24 |
— |
— |
а) С вероятностью 0,98 определить пределы, в которых нахо дится средний пробег машин базы.
б) Как изменить гарантийную вероятность, чтобы предель ную ошибку средней дальности пробега уменьшить на 20%?
в) Сколько нужно отобрать путевок, чтобы с вероятностью 0,99 гарантировать, что средняя дальность пробега всех машин автобазы не вышла за пределы 130,6-150,6 км?
г) С вероятностью 0,98 определить пределы, в которых нахо дится доля всех машин автобазы с дальностью пробега, превы шающей 200 км.
д) Какова вероятность того, что предельная доля ошибки ма шин, дальность пробега которых превышает 200 км, но превзой дет 0,05?
е) Сколько нужно отобрать путевок, чтобы с вероятностью 0,99 гарантировать отклонение выборочной доли от генераль ной, нс превышающее 0,06?
II* Средняя масса пакетов, расфасованных на автомате, рав на 1 кг при среднем квадратическом отклонении 3 г. Сколько нужно отобрать пакетов, чтобы с вероятностью 0,95 гарантиро вать отклонение средней массы отобранных пакетов от 1 кг, не превышающее 0,1%?
153
12. Для определения среднего количества деловой древе сины в одном дереве подвергли выборочному обследованию 1000 деревьев, растущих в большом лесу. Были получены сле дующие данные:
Количество деловом:древесины в одком дереве, мл |
0,5 |
1 |
1,5 |
Количество дсрспьев, шт. |
208 |
484 |
308 |
Определить вероятность того, что генеральная средняя отли чается от выборочного среднего не более чем на 0,03 м \
13.Произведено пять независимых равноточных измерений для определения заряда электрона. Получены следуеошдс ре зультаты (кулоны): 1,594 л10'19; 1,597-ЮЛ 1,598-Ю'*; 1,593 -10” ; 1,590 -10,9. Найти доверительные границы для величины заряда электрона, если р = 0,99.
14.Средний возраст глав семей для едучайнон выборки из
3704 семейств равен 51,07 года, а выборочное среднее квадра тическое отклонение — 19,98 года. Построить доверительные интервалы для среднего возраст всех глав семейств при $ = 0,9
110 = 0,9.
15. Построить доверительные интервалы для математичес кого ожидания а с доверительными вероятностями /3 = 0,99 к {$ = 0,99 в каждом из следующих случаев:
Измерение |
X |
к |
о ( |П В С С Т 1 ! 0 ) |
Число слов л предложении |
27 |
225 |
7 |
Длина предплечья |
1&Д С Д 1 Ш Н Ц Ь 1 |
100 |
0,82 |
Диаметр мускульной мышцы |
17,1 единицы |
625 |
3,4 |
В задачах \ 6-19 найти доверительные интервалы для матема тического ожидания с доверительными вероятностями р= 0,9;
0,9;/?,= 0,9;
16.Содержание углерода в килограмме чугуна, если х =28 г,
и= 1<5,8 = 4 г.
154
17.Диаметры шести шаров в шарикоподшипнике: 2,01; 1,99; 2,00; 2,00; 2,01; 1,98 мм.
18.Увеличение частоты пульса солдат после проверки физи
ческих данных: 10, 13, 6, 8, 12, 8, 7, 10, 12,14 ударов.
19. Процентное содержание витамина С в выборке витамин ных драже: 14,3; 15,2; 16,3; 14,8; 12,9.
Для каждой ситуации, описанной в задачах 16-19, были про* асдсны повторные выборки. Используя объединенные выбо рочные оценки, снова построить доверительные интервалы для математического ожидания с теми же доверительными вероят ностями.
20.Содержание углерода в килограмме чугуна, если п - 9, ,т -28,8 г, $2= 20 г2.
21.Диаметр шаров в шарикоподшипнике: х = 2 см; 5*= 6>4* х/0'5см2; л = 8.
22. Увеличение частоты пульса: х = 9 ударов; 5,=в 4; и = / / .
23.Процентноесодержание витамина С: х = 14; 5?= 0,25; п = 7.
24.С производственной линии, производящей сигареты, было отобрано 900 сигарет, 45 нз них оказались бракованны ми. Оценить долю дефектных сигарет во всей совокупности и найти для нее доверительные границы, если Р= €,9. Какой объ ем выборки с производственной линии нужно взять, чтобы со степенью доверия 99,7% утверяедать, нто ошибка оценивания нс превосходит 0,01?
25.В 10000 сеансах игры с автоматом выигрыш появился 4000 раз. Найти доверительный интервал для вероятности вы игрыша, если р = 0,9. Сколько сеансов игры следует провести, чтобы с вероятностью 0,99 вероятность выигрыша отличалась от частоты не более чем на 0,01?
26.4709 семей в случайной выборке, включающей 7148 семей, зарегистрировали расходы на алкогольные налитки, Каковы грани цы доверительного интервала для доли всех семей, имевших расхо ды на алкогольные кашта* в период опроса, если Р = 0,999.
27. Случайная величина 2 равна разности двух независимых нормальных случайных величин А' и У. Выборочные оценки для Х м У определяли по результатам п = 16 и / = 36 наблюдений
155
соответственно. С доверительной вероятностью 0,95 найти до
верительный интервал для математического ожидания 2, соли
х=!0,у = 4,о(Х) = 2.
28были произведены выборки из трех генеральных сово купностей. Каждый раз вычислялись выборочные средние х к исправленные выборочные средние квадратические отклонения >$. После изменеЕшй условий экспериментов выборки были пов торены и снова были найдены тс же числовые характеристики. Результаты представлены в таблице. По се данным построить доверительные интервалы для средних совокупностей р = 0,9, р = 0,9* с довсритсльными вероятностями Р= 0,9 и р = 0,9 пос троить доверительные интервалы для разности средних. Мож но ли считать, что расхождения между средними объясняются только случайностью выборок?
Измерения |
X |
5 |
п |
Скорость чтения, слов/ашн |
ПО |
12 |
100 |
Скорость чтения после упражнений, слоа/мин |
130 |
14 |
Ш |
Урожай терна, удобрение^, д/га |
43 |
5 |
30 |
Урожаи зерна, удобрение Я, ц/га |
40 |
4,5 |
45 |
Добыча парафила нэторфа, %: растворительЛ |
5,3 |
2,1 |
40 |
Добыча парафина изторфа, %: растворитель В |
6,4 |
2.4 |
50 |
29. Выборка лампочек сорта А исследовалась на продолжи тельность горения. Время непрерывного свечения выбранных лампочек (условные единицы); 21, 32, 28, 14, 30, 27, 30. Про верка лампочек сорта В дала такие результаты: 28,29, 34,18,30. С доверительной вероятностью 0,99 построить доверительный интервал для разности средних продолжительностей работ лам почек двух сортов.
30. Покрышки, произведенные на заводе А> исследовались на износ (км пройденного пути). Оказалось, что средний пробег равен 25000 км, а $,=1200 км. В тех же условиях испытывались покрышки» изготовленные на заводе В. Для них средний про бег оказался равен 23500 км, $,=1000 км. Найти доверительный
156
интервал для разности средних пробегов, р = 0,9. Каждый раз испытывалось 4 покрышки.
В задачах 31-35 требуется построить доверительные интер валы для дисперсии о2 и среднего квадратического отклонения о нормально распределенной генеральной совокупности. Поло
жи т ь /^ 0,9; р = 0у% р = 0,9.
31.Обратиться к данным задачи 16.
32.Обратиться к данным задачи 17.
33.Обратиться к данным задачи 18.
34.Обратиться к данным задачи 19.
35.Результаты 10 независимых измерений длины стержня
(мкс): 23, 24, 23, 25, 25,26, 26, 25, 24, 25.
36. Требуется оценить средние еженедельные расходы на пи тание студентов некоторого университета. Эта оценка исполь зуется для определения размера дотаций нуждающимся студен там.
а) Выборку какого объема следует взять для получения до верительного интервала шириной С,4 долл, при доверительной вероятности р - 0,97 Из опыта известно, что 1? = 5 долларам.
б) Оказалось, что выборочное среднее равно 70 долларам. Указать пределы доверительного интервала для средних расхо дов на питание.
в) Сколько примерно расходует студент на питание в тече ние учебного года (35 недель)?
37. Известно, что 5* = 4, При каком п левая граница довери тельного интервала для о2 отличается от 5* на 1,8? Положить 0 = 0,9;.
38. На некотором предприятии работает 2000 человек. Ди рекция хочет оценить долю рабочих, которые в понедельник опоздали на работу более чем на 5 минут.
а) Выборку какого объема нужно взять, чтобы доверитель ный интервал имел ширину не более 4%, если Р = 0,95? (Дирек ции известно, что количество опоздавших нс больше 30%).
б) Была взята случайная выборка того объема, который был оп ределен в предыдущем пункте. Оказалось, что х = 0,18. Оценить общее число рабочих, опоздавших на работу в понедельник.
157
39.800 студентам задали следующий вопрос: купили бы вы в период с сентября по кеоль в магазине нашего университетского городка котя бы одну пару обуви? Число положительных отве тов оказалось 100.
а) Построить доверительный интервал для доли студентов, сделавших такую покупку* если /? = 0,9.
б) Оценить общее число покунагелей-студентов, если всего в университете учится 20000 студентов.
в) Предположим, что студенты, попавшие в выборку, отве тили также* сколько пар обуви они купили и за какую цену. Сто студентов, каждый из которых купил хотя бы одну пару обуви, купили в общей сложности 120 пар по средней цене л = 45 долл. за пару, причем 5 = 6,3 долларов. Построить доверительный ин тервал для средней стоимости лары обуви, приобретенной все ми студентами, р = 0,9.
г) Оценить общую сумму денег, истраченных на обувь сту дентами в магазинах этого городка.
Г л а в а VIII
ПОНЯТИЕ О ПРОВЕРКЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Осколько ггаиоткрытий чудных Готовятпросвещеньядух, Иопыт, сын ошибок трудных,
И гений, парадоксов друг, И случай, бог тобрстателъ.
А. С. Пушкин
8.1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
8.1.1. Что такое статистическая гипотеза?
Под статист ической гипотезой мы будем понимать либо предположение о законе распределения генеральной совокуп ности (закон неизвестен), либо предположение о значениях (не известных) параметров известного закона распределения.
Всоответствии со сказанным статистические гипотезы де лятся на нспараметрические, если в них высказывается предло жение о виде закона распределения, и параметрические, если в них говорится о значениях параметров известного закона рас пределения.
Вглаве 1 мы уже рассматривали процедуру проверки нспараметрнческих гипотез по критерию Пирсона.
Параметрические гипотезы рассматриваются попарно. Ги потезы, образующие пару, взаимно исключают друг друга; на зываются они нулевой и альтернативой. Процедура проверки
159
применяется к нулевой гипотезе # в. Если о результате проверки
оказывается целесообразным отвергнуть гипотезу |
то прини |
мается альтернативная гипотеза Яд. |
|
Нулевая гипотеза — это простая гипотеза, в пси говорится о конкретных значениях параметров. Альтернативная гипотеза сложная, в ней подразумевается бесконечно много возможнос тей. Рассмотрим еессколько примеров нулевых к альтернатив ных гипотез.
Нулевая гипотеза: математическое ожидание а генеральной совокупности равно числу аа Коротко это записывается так: И^\ а = ос. Возможные для этого случая альтернативные гипотезы:
1- Н \а ф |
л0. |
2. И : а > «0 |
3. |
Я : а < ал. |
Нулевая гипотеза: математические ожидания |
и «2 двух ге |
|||
неральных совокупЕшстсй |
равны. Коротко это записывается |
|||
такЯ 0: ал = аг Возможные |
альтсрЕШтивныс гипотезы; |
|||
1• Нв: а, ф аг |
2. |
Я,: (?,>«,. |
3. |
п, < я,. |
8.1.2.0 процедуре проверки нулевой гипотезы
Всякую гипотезу (не только статистическую) желательно обосновать. Вряд ли можно дать строгое определение такому понятию, как обоснование. В статистике под обоснованием ги потезы понимается следующая процедура.
1. Подбирается случайная величина К (выборочная статис тиках закон распределения которой известен в предположении справедливости нулевой гипотезы # 0.
2. Область значении случайной величины К разбивается на два непере^екающихся подмножества. Вероятность того, что случайная величина К примет значение из первого множества (если только справедлива гипотеза Яр), велика. Вероятность того, что случайная величина К примет значение из второго множества, мала. Первое множество значений называется ластью принятия гипотезы //„, второе — областью отвержения гипотезы Я пли критической областью. Вероятность попадания в критическую область называется уровнем значимости и обоз-
160