Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теорія ймовірності - high_math

.pdf
Скачиваний:
1188
Добавлен:
10.03.2016
Размер:
6.54 Mб
Скачать

Із значення rB робимо висновок, що ознаки X i Y скорельовані і

мають майже лінійну залежність.

Зауважимо, що оцінки параметрів ознак X i Y можна знайти, користуючись інтервальним розподілом (табл. 3.13). Наприклад,

 

k

*

 

/ n

xB =

xi

ni

i=1

 

 

 

де k — кількість знайдених інтервалів і xi* — середини цих інтер-

валів.

Таким чином,

xB = 201 (12,4 4 5,2 3 + 2 6 + 9,2 5 + 16,4 2) = 1,28.

Абсолютно аналогічно будуть знаходитись інші оцінки, але вони будуть менш точними, ніж знайдені.

в) Нехай Н0 — гіпотеза про незалежність випадкових величин X та

Y, xmax = 20, xmin = – 16, ymax = 62, ymin = – 32, m = 5, hx = 7,2, hy = 18,8.

Результати перевірки Н0 подаємо у вигляді табл. 3.14, де на перетині i-го рядка та j-го стовпця містяться елементи nij .

Таблиця 3.14

Y

 

 

 

 

 

 

 

 

5

 

X

[– 32; – 13,2]

[– 13,2; 5,6]

[5,6; 24,4]

[24,4; 43,2]

[43,2; 62]

 

nij = ni0

 

 

 

 

 

 

 

j =1

 

[– 16; – 8,8]

 

2

2

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

[– 8,8; – 1,6]

 

1

2

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

[– 1,6; 5,6]

 

4

2

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

[5,6; 12,8]

 

1

2

1

1

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

[12,8; 20]

 

1

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

5

5

= 20

nij = n0 j

 

3

9

5

1

2

 

∑∑nij

i=1

 

 

 

 

 

 

 

i=1 j=1

 

За формулою (3.20)

 

 

 

 

 

 

 

χ2

= 20 [1/ 4(22 / 3 + 22 / 9) + 1/ 3(12 / 3 + 22 / 9) +

 

 

 

+1/ 6(42 / 9 + 22 / 5) + 1/ 5(12 / 9 + 22 / 5 + 12 /1+ 12 / 2) +

 

 

 

 

 

+1/ 2(12 / 5 + 12 / 2) 1] = 21,28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

231

Кількість ступенів свободи k = (5 – 1)(5 – 1) = 16.

Оскільки за таблицею χα2 = 26,3, а χ2 > χα2 , то гіпотезу про неза-

лежність випадкових величин X та Y потрібно відкинути. Тобто задана система величин X та Y є залежною. При цьому залежність між

ними близька до лінійної, оскільки rB = 0,89 (майже одиниця).

Приклад 3.15. Реакцію хворих на застосування медичного препарату задано даними, наведеними в табл. 3.15

 

 

 

 

Таблиця 3.15

 

 

 

 

 

 

Стать

Кількість хворих, стан яких

 

Усього

 

 

 

 

поліпшився

не змінився

погіршився

 

 

 

 

 

 

 

 

 

 

Чоловіки

18

28

6

 

52

 

 

 

 

 

 

Жінки

33

40

19

 

92

 

 

 

 

 

 

Усього

51

68

25

 

144

Чи можна вважати, що вплив препарату не залежить від статі хворих? Узяти α = 0,9.

Розв’язання. За формулою (3.20)

χ2 = 144 [1/ 52(182 / 51+ 282 / 68 + 62 / 25) + +1/ 92(332 / 51+ 402 / 68 + 192 / 25) 1] = 2,53.

Кількість ступенів свободи k = (2– 1)(3– 1) = 2.

Оскільки за таблицею χα2 = 4,6 і χ2 < χα2 , то гіпотеза приймається, тобто вплив препарату не залежить від статі.

3.4. Кореляційний та регресійний аналіз. Оцінки лінійної та квадратичної регресії за методом найменших квадратів

При одночасній появі двох і більше величин у результаті проведення експерименту дослідник має підстави для встановлення певної залежності між ними.

Строгої функціональної залежності між змінними, у буквальному розумінні цього слова, у реальному світі не існує, бо вони перебувають під впливом випадкових факторів, наслідки яких передбачити практично неможливо. Тому між змінними існує особлива форма

232

зв’язку, яку називають стохастичною і яка трансформується, не змінюючи своєї суті, у статистичну залежність.

Показником, що вимірює стохастичний зв’язок між змінними, є коефіцієнт кореляції, який свідчить з певною мірою ймовірності, наскільки зв’язок між змінними близький до строгої лінійної залежності.

Для двовимірного статистичного розподілу вибірки введемо поняття статистичної залежності між ознаками X та Y.

Статичною залежністю ознаки X від ознаки Y називають таку залежність, за якої при зміні значень ознаки Y = yi змінюється умо-

вний статистичний розподіл ознаки X.

Статистичною залежністю ознаки Y від ознаки Х називають таку залежність, за якої зі зміною значень ознаки X = xi змінюється умовний статистичний розподіл ознаки Y.

Уразі зміни умовних статистичних розподілів змінюватимуться

йумовні числові характеристики.

Звідси випливає визначення кореляційної залежності між ознаками X і Y.

Кореляційною залежністю ознаки Y від Х, або регресією Y на Х,

називається функціональна залежність умовного середнього

yx j від

аргументу x :

(3.22)

yx = ϕ(x).

Аналогічно кореляційною залежністю ознаки Х від Y називається функціональна залежність умовного середнього xyi від аргументу y :

xy = ψ( y).

Графіки функцій ϕ(x) та ψ( y) називають кривими регресії.

Між ознаками X та Y може існувати статистична залежність і за відсутності кореляційної. Але коли існує кореляційна залежність між ознаками X та Y, то обов’язково між ними існуватиме і статистична залежність.

Для функції ϕ(x) припускаються відомими властивості гладкості або її вигляд з точністю до деяких параметрів. Наприклад,

yx = ϕ(x, β0 , β1 ) або yx = ϕ(x, β0 , β1 , , βN ).

У частинному випадку, якщо ϕ(x, β0 , β1 ) = β0 + β1 x , то говорять про лінійну регресію Y на Х. Пряма y = β0 + β1 x називається пря-

мою регресії з невідомими параметрами β0 і β1 .

233

Для вибіркових даних X :{ x1, x2 , , xn } i Y :{ y1 , y2 , , yn } природно визначити залежність рівностями

yi = β0 + β1xi + δi , (i = 1, n)

де δi — незалежні випадкові величини, що характеризують відхилення y від гіпотетичної теоретичної регресії з M (δi ) = 0 і однаковими дисперсіями D(δi ) = σ2 . При цьому елементи послідовності

δ1, δ2 , , δn є некорельованими ( Kij = 0).

Для нелінійного випадку аналогічно припускається, що

y = ϕ(x ) + δ

, M (δ

) = 0, D(δ

) = σ2 .

i

i

i

i

i

 

Щоб визначити параметри функції ϕ(x) = ϕ(x, β0 , β1, , βN ), за-

стосовують метод найменших квадратів. Для цього складають суму квадратів відхилень

n

δi2

n

, β1, , βN ))2

Q =

, Q(β0 , β1, , βN ) = ( yi − ϕ(xi , β0

i=1

 

i=1

 

і вимагають, щоб вона для вибіркових даних була мінімальною. Статистичні оцінки β0 , β1, ..., βN параметрів β0 , β1, ..., βN знаходять як розв’язки системи рівнянь:

Q

= 0, ...,

Q

= 0.

 

 

∂β0

∂βN

Метод найменших квадратів для параметрів β0 , β1 лінійної регресії дає такі оцінки:

 

 

n

n

n

 

 

 

 

 

 

 

 

 

nxi yi (xi )(yi )

 

 

 

 

 

 

 

β1 =

i=1

i=1

i=1

,

β0 = yB − β1xB .

(3.23)

n

n

 

 

 

nxi2

(xi )2

 

 

 

 

 

 

 

 

 

i=1

i=1

 

 

 

 

 

 

 

 

Коефіцієнт β1 можна знайти також за формулою

 

 

 

 

 

 

 

 

=

K

XY

.

(3.24)

β

 

 

 

1

 

sX2

 

234

Якщо елементи вибірки (xi , yi ),

 

(i =

1, n

)

 

перетворити за фор-

мулами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x0 =

xi xB

,

y0 =

yi yB

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

σBX

 

 

 

 

 

i

 

 

 

 

σBY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

то пряма регресії буде визначатися співвідношенням y0

= r x0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

β′

, β′

 

 

 

 

 

 

 

 

 

 

 

B

Аналогічно оцінки параметрів

лінійної регресії X на Y об-

числюється за формулами

 

 

 

 

 

 

 

 

 

0

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

′ =

K

XY

;

 

 

 

 

= x

 

 

y

 

 

 

 

(3.25)

 

β

 

 

β

B

β

B

 

 

 

 

 

 

 

 

 

 

 

1

 

 

s2

 

 

 

 

0

 

 

 

 

 

 

 

1

 

 

 

 

 

Співвідношення

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

′ =

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3.26)

 

 

 

 

 

 

 

β

 

β

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 1

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

використовують для контролю обчислень.

 

 

 

 

 

 

 

x2

 

У випадку, коли y = ϕ(x, β

0

, β , β

2

) = β

0

 

+ β x + β

2

для оцінок

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

1

 

 

β0 , β1 , β2 параметрів β0 , β1, β2 дістаємо таку систему лінійних рівнянь:

 

 

 

 

n

 

 

 

 

 

n

 

 

 

n

 

n

 

 

 

β

2 xi4

+

β

1 xi3

+

β

0 xi2

= xi2 yi ,

 

 

 

 

i=1

 

 

 

 

 

i=1

 

 

 

i=1

 

i=1

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

n

 

 

 

 

β

2 xi3

+

β

1 xi2

+

β

0 xi

=

xi yi ,

(3.27)

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

i=1

 

 

i=1

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

β

2 xi2

+

β

1 xi

+

β

0n = yi .

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

i=1

 

 

Для спрощення обчислень вихідні дані часто попередньо перетворюють (див. приклад 3.17).

Приклад 3.16. Дано вибірку

xi

3,72

3,09

3,47

3,25

3,34

3,11

3,51

3,34

3,68

3,40

yi

1,49

2,73

3,32

3,32

3,69

3,67

3,30

2,55

3,11

3,60

Обчислити коефіцієнт кореляції, визначити і побудувати прямі регресії Y на Х та Х на Y.

Розв’язання. За формулами (3.16) знаходимо xB = 3,39; yB = 3,08. Складаємо табл. 3.16.

235

Таблиця 3.16

i

xi

xi xB

yi

yi yB

( xi xB ) ( yi yB )

( xi xB )2

( yi yB )2

 

 

 

 

 

 

 

 

1

3,72

0,33

1,49

– 1,59

– 0,525

0,109

2,528

 

 

 

 

 

 

 

 

2

3,09

– 0,3

2,73

– 0,35

0,105

0,09

0,123

 

 

 

 

 

 

 

 

3

3,47

0,08

3,32

0,24

0,019

0,006

0,058

 

 

 

 

 

 

 

 

4

3,25

– 0,14

3,32

0,24

– 0,034

0,020

0,058

5

3,34

– 0,05

3,69

0,61

– 0,03

0,003

0,372

 

 

 

 

 

 

 

 

6

3,11

– 0,28

3,67

0,59

– 0,165

0,078

0,348

 

 

 

 

 

 

 

 

7

3,51

0,12

3,30

0,22

0,026

0,014

0,048

8

3,34

– 0,05

2,55

– 0,53

0,027

0,003

0,281

 

 

 

 

 

 

 

 

9

3,68

0,29

3,11

0,03

0,009

0,084

0,001

 

 

 

 

 

 

 

 

10

3,40

0,01

3,60

0,52

0,005

0,000

0,270

 

 

 

 

 

 

 

 

33,91

 

30,78

 

– 0,56

0,41

4,09

 

 

 

 

 

 

 

 

За формулами (3.17), (3.18) та (3.21) знаходимо sX2

= 0,05;

σ

 

 

 

= 0,22; s2 = 0,45; σ

 

 

 

 

 

 

 

 

= – 0,06; r

= – 0,41.

ÂX

BY

= 0,67; K

XY

 

 

 

Y

 

 

 

 

 

 

 

 

 

B

Прямі регресії Y на Х та Х на Y мають відповідно вигляд

 

 

 

 

 

y = β

0

+ β x та x = β′ + β′y.

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

0

 

 

Оцінки для параметрів β0

і β1

знаходимо за формулами (3.23) та

(3.24):

 

 

 

 

1 = – 0,06/0,05 = – 1,2;

 

 

 

 

= 3,08 – (– 1,2)·3,39 = 7,15

 

 

 

 

β

β

0

Оцінки параметрів β′ таβ′

знаходимо за формулами (3.25):

 

 

 

0

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

= – 0,06/0,45 = – 0,13;

 

= 3,39 – (– 0,13) · 3,08 = 3,8.

 

β

β

 

1

 

 

 

 

0

 

 

 

 

 

Таким чином, прямі регресії мають такі рівняння: y = 7,15 – 1,2 x та x = 3,8 – 0,13 y .

Для перевірки застосуємо співвідношення (3.26):

ββ′ = (1,2) (0,13) = 0,39.

11

Зурахуванням помилок округлення можна вважати, що

β β′ = r .

1 1 B

236

Прямі регресії подано на рис. 3.4

yy

 

 

х 3,8 – 0,13 y

7,155

 

 

х=3,8-0,13у

 

 

 

3,08

 

 

 

 

 

 

 

 

x

0

 

3,39

 

5,95

yу=7,15-1,2 1,2х

x

х

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.4

Приклад 3.17. Заміри температури повітря на протязі доби в другій половині вересня в середній смузі кожні 4 години дали наступні результати:

t, час

0

4

8

12

16

20

24

 

 

 

 

 

 

 

 

Т, °C

10

6

9

13

17

14

11

Вважаючи,

що залежність між цими змінними

 

має вигляд

T = β

0

+ β t + β

t2 , знайти оцінки параметрів β

,

β , β

2

за методом

 

1

2

0

 

1

 

найменших квадратів.

 

 

 

 

Розв’язання. Попередньо перетворимо вихідні дані за формулами

x = (t 12) / 4,

y = T 11 і знайдемо оцінки параметрів моделі y = β0 +

+ β x + β

2

x2 .

Для підрахунку коефіцієнтів системи (3.27) складемо

1

 

 

 

 

 

 

 

 

 

 

 

табл. 3.17.

 

 

 

 

 

 

 

Таблиця 3.17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ti

 

 

xi

 

 

Ti

yi

xiyi

xi2

xi2yi

xi3

xi4

0

 

 

– 3

 

 

10

– 1

3

9

– 9

– 27

81

4

 

 

– 2

 

 

6

– 5

10

4

– 20

– 8

16

8

 

 

– 1

 

 

9

– 2

2

1

– 2

– 1

1

12

 

 

0

 

 

13

2

0

0

0

0

0

16

 

 

1

 

 

17

6

6

1

6

1

1

20

 

 

2

 

 

14

3

6

4

12

8

16

24

 

 

3

 

 

11

0

0

9

0

27

81

 

 

0

 

 

 

3

27

28

– 13

0

196

 

 

 

 

 

 

 

 

 

 

 

 

237

Система для обчислення оцінок параметрів β0 , β1, β2 має вигляд

196

 

 

 

2

 

 

+28

 

 

0

= −13,

β

β

 

 

 

 

28

 

1

 

 

 

 

 

= 27,

 

 

 

 

β

 

 

 

 

 

28

 

2

+7

 

0

= 3.

β

β

Розв’язавшицю систему, одержуємо β0 = 1,63; β1 = 0,96; β2 = – 0,3. Тобто

y = 1,63 + 0,96x 0,3x2 .

Повертаючись до вихідних змінних, одержуємо

T 11 = 1,63 + 0,96(t 12) / 4 0,3((t 12) / 4)2 .

Або

T = −0,02t2 + 0,72t + 6,87.

Т.3 ВПРАВИ ДЛЯ АУДИТОРНОЇ

ІСАМОСТІЙНОЇ РОБОТИ

1.Під час обробки даних випробувань літака було зафіксовано такі показники швидкості V , ì /ñ, відриву літака при зльоті за даної

зустрічної швидкості вітру ν, м/с:

v

9,8

10

11

11,4

13

14

14,7

V

63,8

64,2

64,7

65,3

66

66,7

68

 

 

 

 

 

 

 

 

а) Знайти статистичні оцінки математичного сподівання, дисперсії, кореляційного момента та коефіцієнта кореляції;

б) перевірити гіпотезу про незалежність цих випадкових величин на рівні значущості α = 0,001.

2. Результати аналізу залежності кількості набраних балів абітурієнтами Х від кількості абітурієнтів Y на вступних іспитах подано вибіркою:

Х

45

43

42

41

40

39

Y

25

38

65

95

120

140

238

а) Знайти статистичні оцінки параметрів системи (Х, Y);

б) перевірити гіпотезу про незалежність цих випадкових величин на рівні значущості α = 0,1.

3.Залежність річної заробітної плати Y від загального виробітку

Хподано у вигляді двовимірного статистичного розподілу:

Y = yi

 

 

 

X = xj

 

 

 

 

 

 

 

 

 

1,5

2,5

3,5

 

4,5

5,5

ny

 

 

 

 

 

 

 

 

 

i

0,82

1

3

 

4

0,86

3

2

 

1

6

 

 

 

 

 

 

 

 

0,9

2

5

 

9

3

19

 

 

 

 

 

 

 

 

0,94

 

6

4

10

 

 

 

 

 

 

 

 

0,98

 

2

2

 

 

 

 

 

 

 

 

nx j

1

8

7

 

16

9

41

Обчислити xB , yB , sX2 , sY2 , σBÕ , σBY , KXY і rB .

4. Залежність висоти прольоту дальнього привода Н, м, під час заходу літака на посадку від мінімальної швидкості літака V , м/с,

наведено у вигляді двовимірного статистичного розподілу:

H = hi

 

 

 

V = vj

 

 

 

 

 

 

 

 

 

53

53,5

54

 

54,5

55

nh

 

 

 

 

 

 

 

 

 

i

322

1

3

 

1

 

324

2

2

 

 

326

2

 

3

 

328

3

1

2

 

 

330

2

1

 

 

nv j

 

 

 

 

 

 

 

Обчислити KVH і rB .

5. Стверджується залежність доброякісного продукту від постачальника. Перевірити це твердження за такими даними при рівні значущості α = 0,05:

239

Продукт

 

Постачальник

 

 

 

 

А

В

С

 

 

 

 

 

Доброякісний

19

25

24

 

 

 

 

Недоброякісний

28

31

27

 

 

 

 

6. Із двох сортів металу виготовлено дві партії однотипних виробів, по 100 виробів в кожній партії. Вимірювання цих деталей дали такі результати:

Номер партії

 

Кількість виробів

 

 

 

 

виробів

Заниженого

Нормального

Завищеного

 

розміру

розміру

розміру

1

30

45

25

2

47

41

12

 

 

 

 

Чи залежать розміри вимірюваних виробів від сорту металу?

Узяти α = 0,05.

За даними в задачах 7 і 8 вибірками знайти статистичні оцінки параметрів ознак X i Y і оцінки коефіцієнтів лінійної регресії Y на Х та Х на Y.

7. Дано вибірку

X

0

1

2

3

4

5

6

7

8

9

Y

0,5

0,9

1,4

2,5

3,5

3,9

4,5

5,1

7,1

7,8

 

 

 

 

 

 

 

 

 

 

 

Закінчення вибірки

10

11

12

13

14

15

16

8,2

8,7

9,6

12,3

13,6

15,4

17,3

 

 

 

 

 

 

 

8. Дано вибірку

X

0,4

0,5

0,6

0,7

0,8

0,9

1

1,1

1,2

1,3

 

 

 

 

 

 

 

 

 

 

 

Y

2,3

2,4

3,2

4,2

5,5

8,1

10,5

12,5

17,1

22,8

 

 

 

 

Закінчення вибірки

 

 

 

 

 

 

1,4

1,5

1,6

1,7

 

1,8

25,7

33,6

38,2

42,5

 

52,1

 

 

 

 

 

 

240