- •Предмет тй
- •Статистичне значення тй
- •Прості елементарних подій
- •Відношення між подіями
- •Властивості операцій
- •Елементи комбінаторики
- •Класичне означення ймовірності
- •Деякі властивості ймовірності
- •Формули додавання і множення ймовірностей
- •Тема 2. Випадкові величини
- •Тема 3. Вибірковий метод
- •Тема 4. Оцінки параметрів розподілу. Статистичні гіпотези
- •Тема 5. Кореляційно-регресійний аналіз
- •Завдання Тема: “Класична формула ймовірності. Теореми додавання і множення.”
- •Тема: “Формула повної ймовірності. Формула Байєcа.”
- •Тема: “Формула Бернуллі. Формула Пуасона. Теореми Муавра-Лапласа”
- •Тема: "Дискретні випадкові величини та їх характеристики"
- •Тема: “Неперервні випадкові величини. Функція розподілу. Щільність ймовірностей”
- •Тема: "Елементи математичної статистики. Вибірка, її графічні характеристики"
- •Тема: "Елементи математичної статистики. Вибірка, її числові характеристики"
- •Тема: “Елементи математичної статистики. Довірчі (надійні) інтервали”
Тема 4. Оцінки параметрів розподілу. Статистичні гіпотези
Вивчіть гл. 16-17, 19 підручника Гмурмана, звертаючи особливу увагу на розв’язання типових прикладів. Розберіть розв’язання типових задач 17-21 з даного посібника. Після цього приступайте до розв’язання завдань 117-154 контрольної роботи.
Довірчі інтервали
Якщо
генеральна сукупність має нормальний
розподіл з математичним сподіванням
і дисперсією
,
то довірчий
інтервал,
який накриває невідоме середнє
з ймовірністю
,
визначається нерівністю
,
де
–
вибіркове середнє стандартне відхилення,
n
–
об’єм вибірки, а число t
– визначається за таблицею (Гмурман,
додаток 3).
Довірчий
інтервал, який накриває невідоме середнє
квадратичне відхилення
з ймовірністю
визначається нерівністю
,
де число q
– визначається за таблицею (Гмурман,
додаток 4).
Задача 17.
Побудуємо
за вибіркою Х довірчі інтервали для
генерального середнього і середнього
квадратичного відхилення з ймовірністю
,
вважаючи розподіл генеральної сукупності
нормальним.
Розв’язання:
За
таблицею
,
тому гранична похибка вибіркового
середнього
і довірчий інтервал для генерального
середнього ознаки Х з ймовірністю
= 0,95 має вигляд:
або
За
таблицею
тому довірчий інтервал для середнього
квадратичного відхилення ознаки Х з
ймовірністю
=
0,95 має вигляд:
або
Нехай проведено n незалежних випробувань за схемою Бернуллі, в кожному з яких з невідомою ймовірністю р може з’явитися деяка подія А. Точковою оцінкою ймовірності р є відносна частота появи події А: wn=m/n. Кінці довірчого інтервалу (р1, р2), який накриває справжнє значення р з ймовірністю розраховують за формулами:
,
де
,
а параметр t
знаходять із рівності Ф(t)=
.
Якщо n
– дуже велике число (порядку сотень або
тисяч)
.
Задача 18.
Було проведено ряд дослідів кидання монет, у яких підраховувалась кількість появ герба (подія А). У двох останніх стовпчиках таблиці наведені довірчі інтервали для ймовірності герба.
-
Дослідник
n
wn
Буфон
4040
0,5069
0,4915-0,5223
0,4866-0,5272
Пірсон (1)
12000
0,5016
0,4927-0,5105
0,4898-0,5134
Пірсон (2)
24000
0,5005
0,4942-0,5068
0,4922-0,5088
Наприклад,
для
з рівності Ф(t)
= 0,95/2 = 0,475 за таблицею (Гмурман, додаток
2) маємо t
= 1,96. Тоді для n
= 4040
.
Отже,
Перевірка гіпотез про дисперсії
Нехай
(
)
і
дві незалежні вибірки з генеральних
сукупностей з нормальним розподілом з
невідомими середніми і дисперсіями
і
,
відповідно. За їх величиною висунемо
гіпотезу про рівність генеральних
дисперсій
проти альтернативної гіпотези
.
Критерій будується за допомогою
статистики
,
яка обчислюється як відношення більшої
вибіркової дисперсії до меншої. Вона
має розподіл Фішера з
і
степенями свободи. Задамо рівень
значимості
і за вибіркою обчислимо фактичне значення
статистики
,
а за таблицею (Гмурман, додаток 7) знаходимо
критичну точку розподілу Фішера
>
1. Якщо
>
,
то основна гіпотеза відхиляється, якщо
<
,то
немає підстав відхилити основну гіпотезу.
Перевірка гіпотез про середні
Нехай
(
)
і
дві незалежні вибірки з генеральних
сукупностей з нормальним розподілом з
невідомими середніми
і невідомими, але однаковими дисперсіями
За їх величиною висунемо гіпотезу про
рівність середніх
проти альтернативної гіпотези
Критерій будується за допомогою
статистики:
Вона
має розподіл Ст’юдента з
степенями свободи. Задамо рівень
значимості
і за вибіркою обчислимо фактичне значення
статистики
,
а за таблицею (Гмурман, додаток 6) знаходимо
двосторонню критичну точку розподілу
Ст’юдента
.
Якщо
>
,
то основна гіпотеза відхиляється, якщо
<
,
то немає підстав відхилити основну
гіпотезу.
Задача 19.
Порівнювали вагу дорослих індичок двох порід після однакового відкорму. За вибірками одержали такі показники:
.
За рівнем значимості
перевіримо гіпотезу про рівність
середніх
проти альтернативної гіпотези
.
Розв’язання:
Спочатку
перевіримо гіпотезу про рівність
дисперсій
проти альтернативної гіпотези
.
Обчислимо значення статистики
,
як відношення більшої вибіркової
дисперсії до меншої. За таблицею
(Колемаєв, табл. 10) для
=0,05 і кількості степенів свободи
k1
= 25-1 = 24
і
k2
= 20-1=19, знаходимо критичну точку розподілу
Фішера
Оскільки
<
,
то немає підстав відхилити гіпотезу
про рівність дисперсій.
Тепер
перевіримо гіпотезу про рівність
середніх. Обчислимо фактичне значення
статистики:
.
За
таблицею (Гмурман, додаток 6) для
=0,05
і кількості степенів свободи
знаходимо односторонню критичну точку
розподілу Ст’юдента
.
Оскільки
>
,
то гіпотезу про рівність середніх
відхиляємо. Можна вважати, що середня
вага індичок першої породи менша за
середню вагу індичок другої породи.
Перевірка гіпотез про долі
Нехай
у двох генеральних сукупностях проводяться
незалежні випробування, в кожному з
яких може з’явитися деяка подія А
(успіх). Позначимо невідому ймовірність
успіху в першій сукупності р1,
а в другій – р2.
З першої сукупності взята вибірка
об’ємом n1,
в якій було m1
успіхів. За їх величиною висунемо
гіпотезу про рівність ймовірностей
проти альтернативної гіпотези
Критерій будується за допомогою
статистики:
.
Вона має стандартний нормальний розподіл
.
Задамо рівень значимості
і за вибіркою обчислюємо фактичне
значення статистики
.
Двосторонню критичну точку стандартного
нормального розподілу
знаходимо з рівності Ф(
)
.
Якщо
>
,
то основна гіпотеза відхиляється, якщо
< , то немає підстав відхилити основну гіпотезу.
Задача 20.
Дослідження крипторхізму виявило, що серед 20 синів одного барана крипторхів виявилося 5, а у іншого барана серед 30 синів їх було 6. З’ясуємо, чи можна вважати, що доля крипторхів в усьому потомстві першого барана більше, ніж у потомстві другого.
Розв’язання:
Позначимо
р1
ймовірність народження крипторхів в
усьому потомстві першого барана, а р2
– відповідну ймовірність для другого
барана. За умовою
;
;
.
Оскільки
,
то за рівнем значущості
=0,05
перевіримо гіпотезу
проти гіпотези
.
Обчислимо фактичне значення статистики:
.
Односторонню
критичну точку стандартного нормального
розподілу Uкр
знаходимо з рівності P(U>Uкр)
=
або
.
За таблицею функції Лапласа Uкр
=
1,65. Оскільки
,
то немає підстав відхилити гіпотезу
про рівність ймовірностей.
Критерій згоди Пірсона
Якщо висунута гіпотеза, що генеральна сукупність ознаки Х має конкретний розподіл, то цей розподіл називається теоретичним. Критерієм згоди називають критерій перевірки гіпотези про розподіл генеральної сукупності.
Розглянемо
критерій згоди Пірсона. За вибіркою
оцінюють параметри теоретичного
розподілу і обчислюють теоретичні
ймовірності рі
, що ознака Х набуде значення з і-го
інтервалу варіаційного ряду, частота
якого nі.
Знаходять теоретичні частоти
і обчислюють статистику
.
Ця статистика має
–
розподіл з
степенями свободи,
де m – кількість інтервалів, r – кількість параметрів теоретичного розподілу, які оцінено за вибіркою. Частота кожного інтервалу, як вибіркова так і теоретична, повинна бути не менше 5. Інтервали, частота яких менше 5, треба об’єднати з сусідніми інтервалами.
Для
заданого рівня значущості
і кількості степенів свободи k
за таблицею (Гурман, додаток 5) знаходять
критичне значення
.
Якщо
,
то висунуту гіпотезу про розподіл
генеральної сукупності відхиляють.
Якщо
,
то немає підстав відхилити висунуту
гіпотезу.
Задача 21.
Перевіримо гіпотезу про нормальний розподіл ознаки Х за критерієм Пірсона для рівня значущості .
Розв’язання:
Розрахуємо
теоретичні частоти нормального розподілу,
вважаючи параметри розподілу відомими
і рівними їх оцінкам за вибіркою:
.
Теоретичні ймовірності рі
попадання випадкової величини Х в
інтервали (
дорівнюють
,
де Ф(х)
– функція Лапласа, а кінці інтервалів
обчислені за формулами
,
причому найменше значення, тобто zl,
покладаємо рівним
,
а найбільше – рівним
.
Тоді теоретичні частоти дорівнюють
.
Результати обчислень зведемо до таблиці:
i |
xi |
xi+1 |
zi |
|
Ф( |
Ф( ) |
рі |
n’i |
1 |
54 |
57,00 |
|
-1,69 |
-0,5000 |
-0,4545 |
0,0455 |
3,55 |
2 |
57,00 |
60,00 |
-1,69 |
-1,17 |
-0,4545 |
-0,3790 |
0,0755 |
5,89 |
3 |
60,00 |
63,00 |
-1,17 |
-0,65 |
-0,379 |
-0,2422 |
0,1386 |
10,67 |
4 |
63,00 |
66,00 |
-0,65 |
-0,13 |
-0,2422 |
-0,0517 |
0,1905 |
14,86 |
5 |
66,00 |
69,00 |
-0,13 |
0,39 |
-0,0517 |
0,1517 |
0,2034 |
15,87 |
6 |
69,00 |
72,00 |
0,39 |
0,9 |
0,1517 |
0,3186 |
0,1669 |
13,02 |
7 |
72,00 |
75,00 |
0,91 |
1,43 |
0,3186 |
0,4236 |
0,1050 |
8019 |
8 |
75,00 |
78,00 |
1,43 |
1,95 |
0,4236 |
0,4744 |
0,0508 |
3,96 |
9 |
78,00 |
81,00 |
1,95 |
|
0,4744 |
0,5000 |
0,0256 |
2,00 |
|
|
|
|
|
|
|
1,0000 |
78,01 |
Нанесемо теоретичні частоти на полігон частот
Перевіримо
висунуту гіпотезу за критерієм Пірсона
для рівня значущості
.
Обчислимо значення
,
для чого складемо розрахункову таблицю
8, де об’єднані два перших і два останніх
інтервали, частота яких менше 5.
i |
ni |
n’i |
|
1 |
5 |
3,55 |
|
2 |
6 |
5,89 |
0,259 |
3 |
11 |
10,67 |
0,010 |
4 |
9 |
14,86 |
2,310 |
5 |
15 |
15,87 |
0,001 |
6 |
20 |
13,02 |
3,744 |
7 |
6 |
8,19 |
0,586 |
8 |
3 |
3,96 |
0,154 |
9 |
2 |
2,00 |
|
|
|
|
7,06 |
За
вибіркою оцінювали два параметри
нормального розподілу:
і
,
тому кількість степенів свободи
.
Для рівня значущості
і
степенів свободи за таблицею (Гмурман,
додаток 5) знаходимо критичне значення
=
9,5. Оскільки
<
,
то гіпотезу про нормальний розподіл
генеральної сукупності не відхиляємо.
