
Брушковський О. Л. ВИЩА МАТЕМАТИКА
.pdf
s= s2 .
|
Інтервальні оцінки |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
Інтервальною називають оцінку, яка визначається двома числами |
|||||||||||||||||||
— кінцями інтервалу, що покриває параметр, який оцінюється. |
|
|||||||||||||||||||
|
Під точністю оцінки a |
параметра a |
|
розуміють таке 0 , |
||||||||||||||||
для якого виконується нерівність a−a . |
|
|
|
|||||||||||||||||
|
Ймовірність |
, з якою виконується ця нерівність, |
називається |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
надійністю оцінки параметра |
a , тобто |
P a−a |
= . |
|
||||||||||||||||
|
Цю ймовірність можна також записати так: |
|
|
|
||||||||||||||||
|
|
|
|
|
|
= − |
P a− a a = . |
|
|
|
||||||||||
|
|
|
|
|
I |
|
називається інтервалом надійності. |
|||||||||||||
|
Інтервал |
|
a |
;a |
|
|
||||||||||||||
Рівнем значущості такого інтервалу називають число =1− . |
|
|||||||||||||||||||
|
Для |
оцінки |
математичного |
сподівання |
a |
нормально |
||||||||||||||
розподіленої випадкової величини |
Х |
|
по |
вибірковій середній |
||||||||||||||||
|
x |
і |
відомим середнім |
|
квадратичним |
відхиленням |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
генеральної сукупності використовують надійний інтервал [4]: |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
x−t |
|
|
|
a x t |
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
n |
|
n |
|
|
|
|||||||
де |
t |
|
|
— точність оцінки; n — об'єм вибірки, t — таке значення |
||||||||||||||||
|
|
|
||||||||||||||||||
n |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
t = . |
|
|
|
||||||
|
|
|
|
функції Лапласа при якому |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|||
|
Якщо середнє квадратичне відхилення |
|
|
невідоме, (а об'єм |
||||||||||||||||
вибірки |
n 30 |
) то надійний інтервал |
|
|
|
|
|
|
|
121
|
x−t |
|
s |
a x t |
|
s |
, |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
n |
|
n |
|
|
||||||||
де |
s — виправлене середнє квадратичне відхилення; |
t |
|||||||||||||
знаходиться по таблиці (стор.159) по заданому об'єму вибірки |
n |
||||||||||||||
і надійності [4]. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для оцінки середнього квадратичного відхилення |
нормально |
||||||||||||||
розподіленої величини |
з надійністю |
|
по виправленому вибірко |
||||||||||||
вому |
середньому |
квадратичному |
|
|
|
|
відхиленню |
s |
|||||||
використовується надійний інтервал |
[4]: |
|
|
|
|
|
|
|
|||||||
|
s 1−q s 1 q |
, при q < 1 ; |
|
|
|||||||||||
|
0 s 1 q , при q > 1, |
|
|
||||||||||||
де |
q знаходиться по таблиці (стор.160) згідно n і |
[4]. |
|
Перевірка статистичних гіпотез
Статистичною називають гіпотезу про вид невідомого розподілу або про параметри відомих розподілів.
Критерій згоди — це таке правило, яке дозволяє відкинути або прийняти гіпотезу на основі вибірки. У результаті перевірки статистичної гіпотези можуть бути допущені помилки двох видів.
Помилка першого виду полягає в тому, що буде відхилена правильна гіпотеза.
Помилка другого виду полягає в тому, що буде прийнята неправильна гіпотеза.
Ймовірність зробити помилку І виду називають рівнем значущості. Найбільш часто його приймають рівним 0,01—0,05.
Розглянемо критерій згоди Пірсона для перевірки гіпотези про розподіл генеральної сукупності [4]. У цьому критерії за міру
122
розходження між теоретичним і статистичним розподілом приймається величина 2 (хіквадрат):
k |
p − p ' 2 |
|
2=n ∑ |
i i |
|
pi ' |
||
i=1 |
де: pi відносні статистичні частоти, тичні ймовірності ; n об'єм вибірки.
,
pi ' відповідні теоре
Розподіл 2 залежить |
від |
параметра |
f |
, який називається |
|
числом степенів свободи. |
|
|
|
|
|
|
|
f =k−l , |
|
|
|
де: k — число інтервалів; |
l , — число незалежних умов, що |
||||
накладаються на частоти |
pi . |
|
|
|
|
Якщо перевіряється гіпотеза про нормальний розподіл, то l=3 |
|||||
і теоретичні ймовірності |
pi ' |
знаходяться за формулою: |
|||
pi '= |
bi−x |
− |
ai− x |
|
|
в |
в |
Для спрощення обчислень використовують не відносні частоти, а
статистичні частоти ni |
і теоретичні частоти |
ni ' . Тоді |
||||||||||||
2 |
k |
|
ni |
−ni ' 2 |
де ni '=n |
b |
−x |
− |
a |
−x |
. |
|||
|
|
|
|
|
|
i |
|
|
i |
|
|
|||
сп=∑ |
, |
|
|
|||||||||||
|
|
|
|
|
|
|||||||||
|
i=1 |
ni ' |
в |
|
в |
|
||||||||
По |
таблиці |
критичних |
значень при |
числі |
степенів |
|
свободи |
|||||||
f =k−3 |
|
і заданому рівні значущості |
|
|
знаходимо критичне |
|||||||||
значення |
кр2 |
(стор.161 ) [4]. |
|
|
|
|
|
|
|
|
123
Якщо сп2 кр2 , то дані спостережень не суперечать |
гіпотезі |
про нормальний розподіл величини Х. Якщо сп2 ≥ кр2 , |
то дану |
гіпотезу про нормальний розподіл величини Х слід відхилити.
Елементи теорії кореляції
Досить часто потрібно встановити і оцінити зв'язок випадкової величини Х із однією або кількома іншими випадковими величинами. Випадкові величини можуть бути зв'язані статистичною або функціональною залежністю. Статистична залежність, це така залежність, при якій зміна однієї з випадкових величин приводить до зміни розподілу іншої.
Якщо при зміні однієї з випадкових величин змінюється статистичне середнє другої, то така статистична залежність називається кореляційною.
Припустимо, що вибірка зроблена з двомірної генеральної
сукупності X ,Y . |
Вибірка об'єму n складається з пар виду |
xi , y j , i=1, ... , k ; |
j=1,... , m . |
Числовими характеристиками такої двомірної величини є: статистичні середні значення:
|
|
|
1 |
k |
|
1 |
|
m |
|
||
|
|
x= |
∑ nxi xi ; |
y= |
∑ nyj y j ; |
||||||
|
|
n |
n |
||||||||
|
|
|
i=1 |
|
|
j=1 |
|
||||
статистичні дисперсії: |
|
|
|
|
|
|
|||||
|
1 |
k |
|
|
|
|
|
|
1 |
m |
|
Dxв= 2xв= |
∑ nxi xi− x 2 ; |
Dyв= y2в |
= |
∑ nyj y j −y 2 ; |
|||||||
n |
n |
||||||||||
|
i=1 |
|
|
|
|
|
|
j=1 |
а також коефіцієнт кореляції між X і Y:
124

|
|
|
|
|
|
k |
m |
|
|
|
|
|
|
|
|
|
|
|
|
∑∑ ni j xi y j−n x y |
|
|
|||||
|
|
|
|
|
r в= |
i=1 |
j=1 |
|
|
|
; |
|
|
|
|
|
|
|
n xв yв |
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|||
де: |
n xi |
частота появи значення |
xi |
; |
|
|
|
||||||
|
n yj |
частота появи значення |
y j |
; |
|
|
|
||||||
|
ni j |
частота появи пари |
xi , y j . |
|
|
||||||||
|
|
|
x y−x y |
|
k |
m |
|
|
|
|
|||
Або |
r в= |
|
|
, де |
x y= |
1 ∑ ∑ ni j xi y j . |
|
|
|||||
|
|
|
|
||||||||||
|
|
|
xв yв |
|
n i=1 j=1 |
|
|
|
|
||||
Регресією Y на X називається довільна функція y |
= f x , |
, |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
яка наближено |
дає залежність |
y |
від x. Графік цієї функції |
||||||||||
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
називається лінією регресії. Аналогічно визначається регресія |
X на |
||||||||||||
Y: |
x |
=g x . |
|
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
|
Якщо обидві лінії регресії прямі, то кореляцію називають лінійною.
Вибіркове рівняння прямої лінії регресії Y на X має вид:
yx− y=rв yв x−x .
xв
Вибірковий коефіцієнт кореляції має властивості:
1) |
r в ≤1 ; |
|
|
2) |
чим ближче |
r в до одиниці, тим зв'язок між X і Y |
|
сильніший. |
в |
|
|
|
|
до 0, тим зв'язок слабший. |
|
3) чим ближче r |
|
125
|
|
в |
|
в |
Якщо |
r |
0,5 , то зв'язок слабкий. Якщо |
r |
0,8 , то |
зв'язок сильний. |
|
|
||
Якщо |
r в =1 ,то X і Y зв'язані лінійною функціональною залеж |
|||
ністю. |
|
|
|
|
Точковою оцінкою коефіцієнта кореляції є вибірковий коефіцієнт кореляції
r =rв .
Інтервальною оцінкою генерального коефіцієнта кореляції є інтервал надійності
|
r в−t r r Г r в t r , |
|||||||
|
|
|
1−r2 |
|
|
|||
де для n≥50 |
|
= |
|
|
в |
|
. |
|
|
|
|
|
|
||||
|
r |
|
n |
|
|
|
||
Значення t знаходять з умови |
|
t = |
. |
|||||
|
|
|
|
|
|
|
|
2 |
126
4.5 Навчальний варіант для підготовки до змістового модуля №3 “Основи математичної статистики” (20 б.) (ФБА, IV семестр)
Варіант 31
Завдання 1 (10 б.) За даними спостережних значень (з додатку № 7 ) за допомогою таблиці випадкових чисел виконати вибірку об'єму n, провести групування статистичних даних, записати відповідний ряд розподілу, побудувати полігон і гістограму, знайти числові характеристики вибірки випадкової величини Х, провести їх статистичні точкові та інтервальні оцінки
при даній надійності і перевірити за допомогою критерію Пірсона гіпотезу про нормальний розподіл випадкової величини Х
при рівні значущості |
n=50 ; |
=0,999 ; |
=0,05 . |
|||
Таблиця випадкових чисел. Варіант 31. |
|
|
||||
|
|
|
|
|
|
|
7582 |
7878 |
7325 |
|
0146 |
|
5286 |
|
|
|
|
|
|
|
2358 |
4919 |
0065 |
|
1526 |
|
1106 |
|
|
|
|
|
|
|
6751 |
0807 |
8653 |
|
7753 |
|
7968 |
|
|
|
|
|
|
|
9562 |
3556 |
1873 |
|
7559 |
|
4603 |
|
|
|
|
|
|
|
9630 |
1374 |
8509 |
|
9702 |
|
0840 |
|
|
|
|
|
|
|
5786 |
3668 |
7340 |
|
6021 |
|
2196 |
|
|
|
|
|
|
|
6861 |
9043 |
7142 |
|
7699 |
|
0424 |
|
|
|
|
|
|
|
1683 |
6298 |
6692 |
|
6721 |
|
3414 |
|
|
|
|
|
|
|
9079 |
4239 |
4760 |
|
1732 |
|
9796 |
|
|
|
|
|
|
|
7871 |
1645 |
0116 |
|
1773 |
|
8283 |
|
|
|
|
|
|
|
127
Додаток №7 |
( навчальний). Дані спостережень за величиною Х |
|||||||
|
|
|
|
|
|
|
|
|
№ п/п |
Х |
|
№ п/п |
Х |
№ п/п |
Х |
№ п/п |
Х |
|
|
|
|
|
|
|
|
|
00 |
90,1 |
|
25 |
100,4 |
50 |
68,0 |
75 |
66,1 |
|
|
|
|
|
|
|
|
|
01 |
76,2 |
|
26 |
83,9 |
51 |
74,4 |
76 |
86,4 |
|
|
|
|
|
|
|
|
|
02 |
79,9 |
|
27 |
88,1 |
52 |
81,7 |
77 |
81,0 |
|
|
|
|
|
|
|
|
|
03 |
45,4 |
|
28 |
76,7 |
53 |
87,0 |
78 |
84,0 |
|
|
|
|
|
|
|
|
|
04 |
72,4 |
|
29 |
93,1 |
54 |
77,0 |
79 |
87,2 |
|
|
|
|
|
|
|
|
|
05 |
70,7 |
|
30 |
100,1 |
55 |
72,4 |
80 |
73,0 |
|
|
|
|
|
|
|
|
|
06 |
79,1 |
|
31 |
68,4 |
56 |
81,3 |
81 |
80,0 |
|
|
|
|
|
|
|
|
|
07 |
77,0 |
|
32 |
108,2 |
57 |
82,0 |
82 |
102,4 |
|
|
|
|
|
|
|
|
|
08 |
92,1 |
|
33 |
63,3 |
58 |
84,4 |
83 |
88,2 |
|
|
|
|
|
|
|
|
|
09 |
89,4 |
|
34 |
81,2 |
59 |
83,0 |
84 |
81,3 |
|
|
|
|
|
|
|
|
|
10 |
109,4 |
|
35 |
103,4 |
60 |
70,4 |
85 |
67,3 |
|
|
|
|
|
|
|
|
|
11 |
82,2 |
|
36 |
92,2 |
61 |
72,2 |
86 |
89,1 |
|
|
|
|
|
|
|
|
|
12 |
81,4 |
|
37 |
89,7 |
62 |
99,4 |
87 |
77,0 |
|
|
|
|
|
|
|
|
|
13 |
59,1 |
|
38 |
79,0 |
63 |
94,7 |
88 |
79,6 |
|
|
|
|
|
|
|
|
|
14 |
68,5 |
|
39 |
90,0 |
64 |
79,8 |
89 |
80,3 |
|
|
|
|
|
|
|
|
|
15 |
67,0 |
|
40 |
115,2 |
65 |
74,4 |
90 |
70,1 |
|
|
|
|
|
|
|
|
|
16 |
78,0 |
|
41 |
69,4 |
66 |
82,1 |
91 |
59,2 |
|
|
|
|
|
|
|
|
|
17 |
76,1 |
|
42 |
83,3 |
67 |
80,1 |
92 |
101,7 |
|
|
|
|
|
|
|
|
|
18 |
91,5 |
|
43 |
78,2 |
68 |
79,7 |
93 |
90,1 |
|
|
|
|
|
|
|
|
|
19 |
85,4 |
|
44 |
84,4 |
69 |
91,0 |
94 |
50,2 |
|
|
|
|
|
|
|
|
|
20 |
99,1 |
|
45 |
69,0 |
70 |
72,3 |
95 |
52,0 |
|
|
|
|
|
|
|
|
|
21 |
80,0 |
|
46 |
93,2 |
71 |
69,4 |
96 |
93,5 |
|
|
|
|
|
|
|
|
|
22 |
84,0 |
|
47 |
94,1 |
72 |
98,0 |
97 |
80,0 |
|
|
|
|
|
|
|
|
|
23 |
60,1 |
|
48 |
73,5 |
73 |
91,5 |
98 |
84,1 |
|
|
|
|
|
|
|
|
|
24 |
80,7 |
|
49 |
79,0 |
74 |
81,6 |
99 |
54,7 |
|
|
|
|
|
|
|
|
|
128
Завдання 2 (10 б.)
1)Знайти вибіркові середні, вибіркові дисперсії , вибіркові середні квадратичні відхилення, вибірковий коефіцієнт кореляції та вибіркове рівняння прямої лінії регресії У на Х, а також по значенню коефіцієнта кореляції оцінити тісноту зв'язку між У та Х згідно кореляційної таблиці.
2)Провести статистичні оцінки генеральних середніх, гене рального середнього квадратичного відхилення та генерального коефіцієнта кореляції.
У |
16 |
20 |
24 |
28 |
32 |
Х |
|
|
|
|
|
|
|
|
|
|
|
30 |
2 |
4 |
3 |
|
|
|
|
|
|
|
|
35 |
|
6 |
6 |
35 |
|
|
|
|
|
|
|
40 |
|
|
2 |
14 |
|
|
|
|
|
|
|
45 |
|
|
|
8 |
7 |
|
|
|
|
|
|
50 |
|
|
|
|
10 |
|
|
|
|
|
|
55 |
|
|
|
|
3 |
|
|
|
|
|
|
Розв'язання.
Завдання 1. За допомогою таблиці випадкових чисел робимо простий випадковий відбір 50 різних значень величини Х (простий випадковий відбір, вибірка без повернення, додаток 5) . Для цього спочатку використовуємо лише перші дві цифри кожного чотиризначного випадкового числа таблиці, стежачи, щоб одержані двозначні числа не повторювались, а потім при необхідності переходимо знову на початок таблиці і використовуємо дві останні цифри. Відібрані значення заносимо в таблицю.
129
№п.п |
№п.п |
Значення |
№п.п |
№п.п |
Значення |
|
|
|
|
|
|
Вибірка |
Ген. сукуп. |
Х |
Вибірка |
Ген. сукуп. |
Х |
|
|
|
|
|
|
1 |
75 |
66,1 |
26 |
01 |
76,2 |
|
|
|
|
|
|
2 |
23 |
60,1 |
27 |
15 |
67,0 |
|
|
|
|
|
|
3 |
67 |
80,1 |
28 |
77 |
81,0 |
|
|
|
|
|
|
4 |
95 |
52,0 |
29 |
97 |
80,0 |
|
|
|
|
|
|
5 |
96 |
93,5 |
30 |
60 |
70,4 |
|
|
|
|
|
|
6 |
57 |
82,0 |
31 |
76 |
86,4 |
|
|
|
|
|
|
7 |
68 |
79,7 |
32 |
17 |
76,1 |
|
|
|
|
|
|
8 |
16 |
78,0 |
33 |
52 |
81,7 |
|
|
|
|
|
|
9 |
90 |
70,1 |
34 |
11 |
82,2 |
|
|
|
|
|
|
10 |
78 |
84,0 |
35 |
79 |
87,2 |
|
|
|
|
|
|
11 |
49 |
79,0 |
36 |
46 |
91,2 |
|
|
|
|
|
|
12 |
08 |
92,1 |
37 |
21 |
80,0 |
|
|
|
|
|
|
13 |
35 |
103,4 |
38 |
04 |
72,4 |
|
|
|
|
|
|
14 |
13 |
59,1 |
39 |
34 |
81,2 |
|
|
|
|
|
|
15 |
36 |
92,2 |
40 |
82 |
102,4 |
|
|
|
|
|
|
16 |
62 |
99,4 |
41 |
58 |
84,4 |
|
|
|
|
|
|
17 |
42 |
83,3 |
42 |
51 |
74,4 |
|
|
|
|
|
|
18 |
73 |
91,5 |
43 |
30 |
100,1 |
|
|
|
|
|
|
19 |
00 |
90,1 |
44 |
61 |
72,2 |
|
|
|
|
|
|
20 |
86 |
89,1 |
45 |
83 |
88,2 |
|
|
|
|
|
|
21 |
18 |
91,5 |
46 |
19 |
85,4 |
|
|
|
|
|
|
22 |
85 |
67,3 |
47 |
07 |
77,0 |
|
|
|
|
|
|
23 |
71 |
69,4 |
48 |
56 |
81,3 |
|
|
|
|
|
|
24 |
66 |
82,1 |
49 |
74 |
81,6 |
|
|
|
|
|
|
25 |
47 |
94,1 |
50 |
43 |
78,2 |
|
|
|
|
|
|
130