Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 кореляція регрессия

.pdf
Скачиваний:
18
Добавлен:
04.02.2016
Размер:
807.55 Кб
Скачать

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

bX

XY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a X

b Y

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де

 

X 2

xi2

 

- вибірковий

початковий момент другого порядку від

 

 

 

 

 

 

 

 

 

 

 

 

N i 1

 

 

 

 

 

 

 

 

 

 

 

1

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

першої

координати

вибірки,

 

X

 

 

 

xi

 

- вибіркове середнє від першої

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

N

 

 

 

 

 

 

N i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

координати ,

 

Y

 

yi -- вибіркове

 

 

середнє від другої координати вибірки,

 

 

 

 

 

 

 

 

1

 

N

 

 

 

 

 

N i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

XY

 

xi yi - вибіркове середнє від добутку координат.

 

 

 

 

 

N i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Розв’яжемо цю систему за методом Крамера :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X 2

 

 

 

 

;

a

 

 

 

 

 

 

 

 

 

 

 

 

 

; b

X 2

 

 

 

 

 

 

.

 

 

 

 

 

 

 

X

X

XY

X

Y

Y

X

XY

Тоді розв’язками системи будуть :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X 2

 

 

 

 

 

 

 

 

 

 

 

a

 

XY

X

Y

 

, b

 

Y

X

XY

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X 2

 

 

 

 

 

 

X 2

 

 

 

 

 

 

 

 

 

X

X

 

 

 

 

X

X

 

 

 

В знаменниках цих формул стоїть вибіркова дисперсія компоненти X :

s( X )2 D( X ) X 2

 

 

 

 

- квадрат вибіркового середнє квадратичного

X

X

відхилення . Чисельником в формулі для a є вибірковий коефіцієнт коваріації :

cov( X ,Y ) XY X Y .

В цих позначеннях рівняння лінійної регресії (після простих перетворень) буде мати вигляд :

y

 

 

cov( X ,Y )

(x

 

)

(1)

Y

X

s( X )2

 

 

 

 

 

 

 

Воно називається лінією регресії Y на X .

Симетрично розв’язаної задачі можна вивчати задачу побудови лінії

регресії виду

x ( y) cy d

При цьому ставиться задача мінімізації квадратів відхилень абсцис експериментальних точок від відповідних абсцис точок на кривої x ( y,c,d) .

Після обчислень, що аналогічні вищенаведеним, отримуємо рівняння лінії

11

регресії X на Y :

x

 

 

cov( X ,Y )

( y

 

)

(2)

X

Y

s(Y )2

 

 

 

 

 

 

 

де s(Y )2 - вибіркова дисперсія компоненти Y . ОЗНАЧЕННЯ. Вибірковим коефіцієнтом кореляції називається

 

cov(X ,Y )

 

 

 

 

cov( X ,Y )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

XY

X

Y

s( X ) s(Y )

 

D( X ) D(Y )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X 2

 

 

 

 

 

Y 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

X

Y

Y

Можна довести, що вибірковий коефіцієнт кореляції , а також вибіркові

коефіцієнти регресії

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

cov( X ,Y )

 

 

 

s(Y )

 

 

і

 

 

 

cov( X ,Y )

 

s( X )

 

 

 

 

 

 

 

s( X )2

 

s(X )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s(Y )2

 

 

 

 

s(Y )

є конзистентними оцінками відповідних теоретичних параметрів -

коефіцієнта кореляції двовимірної випадкової величини

( X ,Y ) і коефіцієнтів

регресії Y на X та X на

Y . Тому при достатньо великих N можна сподіватись,

що вибіркові характеристики будуть мало відрізнятись від теоретичних.

З рівнянь регресії Y на

 

X

та

X на

Y

 

 

 

- (1)

та (2)

 

 

– випливає, що лінії

регресії Y на X

та

 

X на

 

Y

в загальному

випадку -

 

 

це різні лінії, вони

перетинаються в

 

 

точці

 

 

(

 

,Y ) -

 

координати

 

якій

– вибіркові середні

 

 

 

 

X

 

 

відповідних координат.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Знайдемо кут між ними :

s(Y )

 

 

s(Y )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

k

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

s( X )s(Y )

tg( )

 

2

 

 

s(X )

 

 

 

 

 

s( X )

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s(Y )

 

 

s(Y )

 

 

 

 

 

 

 

 

s2 ( X ) s2 (Y )

 

 

 

1

k1k2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s( X )

s( X )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Перший множник в цій формулі залежить тільки від коефіцієнта кореляції, а другій – тільки від вибіркових дисперсії компонент. Дві лінії регресії Y на X та X на Y співпадають, коли або одна з вибіркових дисперсії нульова (а тоді с ймовірністю одиниця одна з компонент є сталою) , або коефіцієнт кореляції

дорівнює 1 ( 2 1 0 ). Чим більше коефіцієнт кореляції наближається до

нуля, тим більше кут між прямими регресії наближається до 90 . Такий ефект називається кореляційними ножицями.

На малюнку 9 , що наведений нижче, зображено поле кореляції і дві лінії регресії. Коефіцієнт кореляції 0,9397 , лінії регресії мають рівняння :

y 0,7679x 2,4470 i

y 0,6781x 2,2355

12

Рис.9 (300 точок)

Ці лінії перетинаються в точці ( X ,Y ) (2,3561;0,6378) . Кут між

кореляційними прямими – 3,38 . В цьому випадку маємо явно виражений

від’ємний лінійний кореляційний зв'язок.

В наступному прикладі на малюнку 10 кореляційне поле показує наявність залежності, але далекої від лінійної. Коефіцієнт кореляції 0,3779 , лінії

регресії мають рівняння :

 

y 0,0763x 0,0272 i

y 0,5343x 0,0061

Ці лінії перетинаються в точці ( X ,Y ) ( 0,0726;0,0328) . Кут між кореляційними прямими – 23,75 .

Рис.10 (500 точок)

На малюнках 11-13 наведені приклади кореляційних полів, яки показують наявність залежності між випадковими величинами, з яких обираються вибіркові дані, але їх коефіцієнт кореляції близький до нуля – кут в

кореляційних ножицях – близькій до 90 , одна з лінії регресії майже горизонтальна, а інша – майже вертикальна.

13

рис. 11 0,058

рис. 12 0,006

рис.13 0,055

З іншого боку, в наступних прикладах (рис.14-15) кореляційних полів, близькість до нуля коефіцієнта кореляції підтверджує відсутність хоча б якогось зв’язку між випадковими величинами X та Y .

рис. 14 0,002

 

 

рис.15 0,012

З означення коефіцієнта кореляції випливають формули, що пов’язують

його з коефіцієнтами лінії регресії :

 

 

 

2 a c

cov( X ,Y )

 

cov( X ,Y )

або a c .

s( X )2

s(Y )2

 

 

 

Квадрат коефіцієнта кореляції 2 називають коефіцієнтом детермінації, він

вимірює долю варіації компоненти X , що пояснюється впливом Y , і навпаки. Знак коефіцієнта кореляції співпадає зі знаком коефіцієнтів ліній регресії.

Якщо коефіцієнти кореляції і регресії додатні, то кажуть, що залежність між X та Y - додатна, вони одночасно зростають – при збільшенні X збільшується і Y . При від’ємних коефіцієнтах кореляції і регресії кажуть ,що зв'язок між X та Y - від’ємний, тобто при збільшенні X зменшується Y .

Властивості коефіцієнта кореляції:

1. Можливі значення коефіцієнта кореляції (як теоретичного, так і вибіркового) обмежені відрізком [ 1, 1]. 1 1

2.Теоретичний коефіцієнт кореляції двох незалежних випадкових величин – нульовий.

14

3.Теоретичний коефіцієнт кореляції між випадковими величинами X та Y дорівнює +1 або -1 тоді і тільки тоді , коли випадкові величини

пов’язані лінійної залежністю.

ОЗНАЧЕННЯ. Випадкові величини з нульовим коефіцієнтом кореляції називаються некорельованими.

На відміну від теоретичного, вибірковий коефіцієнт кореляції вибірки з незалежних випадкових величин тільки наближається до нуля ( в залежності від об’єму вибірки). Так саме , навіть при наявності лінійної залежності між випадковими величинами вибірковий коефіцієнт кореляції тільки наближається до 1.

З некорельованості двох випадкових величин , взагалі, не випливає їх незалежність. Але в деяких випадках, наприклад, якщо випадкові величини X та Y нормально розподілені – незалежність буде випливати з некорельованості. Тобто, для нормально розподілених випадкових величин, незалежність еквівалентна некорельованості. Значить, якщо з якихось теоретичних міркувань можна припускати нормальний розподіл випадкових величин X та Y , вибірку з яких ми розглядаємо, то наближення до нуля вибіркового коефіцієнта кореляції можна вважати підтвердженням їх незалежності. Альтернативно, можна висувати гіпотезу про нормальний розподіл кожної з компонент вибірки {(x1, y1),(x2 , y2 ),(x3 , y3 ),.....(xN , yN )}. І, якщо така гіпотеза знаходить своє

підтвердження, з близькості до нуля коефіцієнта кореляції можна робити висновок про незалежність випадкових величин, з яких обрана вибірка.

Прикладом вибірки з незалежними нормально розподіленими компонентами є та, що наведена на малюнку 15. Як і повинно бути , вибірковий коефіцієнт кореляції наближається до нульового теоретичного.

В той час , як на малюнку 14 зображена вибірка з незалежних рівномірно розподілених на відрізках компонент, яка також буде вибіркою з двовимірної рівномірно розподіленою в прямокутнику випадкової величини. Тут також вибірковий коефіцієнт кореляції наближається до нульового теоретичного, що є відображенням незалежності.

Навпаки, існують випадкові величини, яки пов’язані функціональної залежністю, але нелінійною, що мають нульовий коефіцієнт кореляції. Стандартним прикладом таких величин є : X - рівномірно розподілена на

відрізку [ 1, 1], а Y X 2 , ( X ,Y ) 0 . Вибірка з такої величини представлена

на малюнку 13 – некорельовані, але нелінійно залежні компоненти - близькість до нуля вибіркового коефіцієнта кореляції означає відсутність лінійної залежності, але не дає ніякої інформації про наявність чи відсутність залежності нелінійної.

Тому вибірковий коефіцієнт кореляції слід розглядати тільки як міру лінійної залежності, але в багатьох практичних випадках цього достатньо .

Наведемо шкалу, за якій дається якісна оцінка степеня лінійної залежності випадкових величин.

15

Якісна оцінка зв’язку за коефіцієнтом кореляції

Інтервал значень

Характеристика лінійної залежності

коефіцієнта кореляції

 

[ 1, 2 / 3]

Сильна від’ємна ( зворотна )

( 2 / 3, 1 / 3]

Помірно від’ємна ( зворотна )

( 1 / 3, 1/ 3)

Слабка або відсутня залежність

[ 1 / 3, 2 / 3)

Помірно додатна (пряма )

[ 2 / 3, 1]

Сильна додатна (пряма )

3. ЗРАЗОК ВИКОНАННЯ РОЗРАХУНКОВОЇ РОБОТИ

Метою розрахункової роботи є дослідження степеня лінійної залежності двох випадкових величин за результатами спостережень за їх вибірковими значеннями, знаходження вибіркового коефіцієнта кореляції , вибіркових ліній регресії Y на X та X на Y , висновок про якісний характер лінійного зв’язку між ними. Вихідними даними для розрахунків є послідовність 100 вибіркових значень (xi , yi ) , що спостерігаються , і яки можна розглядати як випадкові

значення двовимірної випадкової величини ( X ,Y ) .

Таблиця вибіркових даних спостережень для розрахункової роботи

N

X(i)

Y(i)

N

X(i)

 

Y(i)

N

X(i)

Y(i)

1.

1,46

0,621

35.

2,22

 

1,19

69.

2,47

1,2

2.

1,86

0,971

36.

1,7

0,869

70.

2,1

1,09

3.

2,3

1

37.

1,65

0,773

71.

2,02

0,94

4.

1,79

0,823

38.

2,84

1,53

72.

2,23

0,996

5.

1,66

0,751

39.

1,94

0,893

73.

1,78

0,837

6.

2,09

1,22

40.

2,03

1,05

74.

1,92

1,17

7.

2,21

1,12

41.

2,15

1,17

75.

1,93

0,759

8.

1,71

1,02

42.

1,88

0,974

76.

1,8

1,05

9.

1,9

0,925

43.

1,59

0,878

77.

1,98

0,897

10.

1,89

1,05

44.

2,57

1,39

78.

2,09

1,08

11.

2,1

0,939

45.

3,58

1,83

79.

1,85

0,726

12.

1,97

0,8

46.

1,4

0,818

80.

1,23

0,852

13.

1,95

0,981

47.

1,67

0,809

81.

1,72

1,13

14.

2,62

1,25

48.

1,65

0,854

82.

1,17

0,48

15.

1,79

1,04

49.

2,18

1,36

83.

1,3

0,687

16.

2,23

1,13

50.

1,54

1,14

84.

2,81

1,32

17.

2,63

1,19

51.

1,52

0,909

85.

1,63

0,841

18.

1,96

0,991

52.

2,1

1,01

86.

2,26

1,02

19.

1,61

0,809

53.

2,12

1,35

87.

0,888

0,842

20.

1,94

0,874

54.

2,48

1,23

88.

2,88

1,65

16

21.

1,32

0,7

55.

1,83

0,778

89.

2,36

1,29

22.

2,05

1,05

56.

1,77

1,2

90.

0,898

0,702

23.

1,82

0,999

57.

2,04

1,14

91.

2,89

0,869

24.

1,94

1,13

58.

1,63

1,09

92.

1,94

0,801

25.

1,63

0,802

59.

1,68

0,945

93.

2,21

1,02

26.

1,48

1,07

60.

1,95

1,01

94.

2,33

1,03

27.

1,32

0,749

61.

2,52

1,15

95.

2,66

1,08

28.

2,39

1,2

62.

2,56

1,17

96.

1,6

1,03

29.

1,45

0,917

63.

1,58

0,756

97.

2,62

1,14

30.

2,34

1,22

64.

2,15

1,09

98.

1,91

0,849

31.

1,63

0,929

65.

1,49

0,934

99.

3,15

1,56

32.

2,03

0,991

66.

2,36

1,21

100.

1,77

0,911

33.

2,57

0,984

67.

1,53

0,767

 

 

 

34.

2,06

0,859

68.

1,99

1

 

 

 

Вибіркові дані з таблиці зображаємо точками на площині – отримуємо поле кореляції – рис.16 :

Рис. 16

Цій малюнок наведений тільки для ілюстрації процесу розв’язку задачі і при самостійному виконанні розрахункової роботи необов’язковий. Він виготовлений за допомогою спеціального пакета прикладних програм, вивчення таких програм не передбачено учбовою програмою. Але, якщо ви володієте одної з таких програм, то дозволяється і бажано її використовувати. Таки можливості дають поширені програми, такі як Excel, Mathcad, Maple, Mathematica , Mathlab, Statistica та інші. Ці програми дозволяють дуже просто розв’язати задачу, що розглядається, але в даної розрахункової роботі дозволяється використовувати їх можливості тільки для спрощення обчислень

17

та графічного представлення даних, в рамках описаної схеми, тому що при використанні таких потужних можливостей складно побачити сутність задачі і алгоритму її розв’язку, а це і є метою даної роботи. Для того, щоб засвоїти суть алгоритму і методу, варто хоча б одну задачу розв’язати за допомогою лише калькулятору.

Для спрощення обчислень використовуємо поширений метод математичної статистики – метод групування даних. Поле кореляції обмежуємо прямокутником, таким чином, щоб всі вибіркові дані були розміщені всередині цього прямокутника. Для цього знаходимо найбільші і найменші значення координат Xi та Yi . Min( X ) 0,888 , відповідає N 87 , Max(X ) 3.58,

відповідає N 45 , Max(Y ) 1,83, відповідає N 45 , Min(Y ) 0,48 , відповідає

N 82 .

Потім цій прямокутник розбиваємо на маленькі прямокутники однакового розміру. Кількість таких прямокутників не повинна буду замалої, щоб отримати достатнє наближення до точних вибіркових характеристик, а, з іншого боку , не повинна бути завеликою , щоб не ускладнювати обчислень. Чим більше кількість прямокутників, тем більше точність , але при цьому більше складність обчислень. Окрім цього , складність обчислень залежить від розсіяння точок всередині великого прямокутника. Чим більше клітинок, в які не потрапляють жодної точки, тим простіше обчислення . Велика кількість порожніх клітинок відповідає більш тіснішому кореляційному зв’язку. Для нашої кількості вибіркових даних ( N 100) достатньо розбиття прямокутника

на 100 клітинок – розбиття сторін 10 10 . Взагалі, при розбитті сторін

прямокутника на N частин, при рівномірному двовимірному розподілі, в середньому в кожну клітинку потрапляє по однієї точці і ми не маємо ніякого спрощення обчислень, але цей випадок відповідає найбільш некорельованим випадковим величинам. На протилежному полюсі, при лінійної залежності, не

порожніх клітинок буде N - це буде найбільше спрощення. При значно великої кількості випробувань треба виходити з обчислювальних можливостей дослідника, розбиття сторін 10 10 дає не досить великий об’єм обчислень і може бути використано для попередніх висновків про залежність або незалежність.

18

Підраховуємо кількість точок, що потрапляють в кожну клітиночку, і записуємо цю кількість на відповідне місці в наступну таблицю. В останньому рядочку і в першому стовпчику записуємо інтервали, на які розбиваємо сторони прямокутника : (xi , xi 1),( y j , y j 1) .

[1,695;

 

 

 

 

 

 

 

 

 

1

1,83]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[1,560;

 

 

 

 

 

 

 

1

1

 

1,695)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[1,425;

 

 

 

 

 

 

 

1

 

 

1,560)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[1,290;

 

 

 

 

2

1

1

1

 

 

1,425)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[1,155;

 

 

 

2

3

5

3

 

 

 

1,290)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[1,020;

 

 

4

6

9

2

3

 

 

 

1,155)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[0,885;

 

 

5

9

7

1

1

 

 

 

1,020)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[0,750;

1

2

10

9

2

 

 

1

 

 

0,885)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[0,615;

1

3

1

 

 

 

 

 

 

 

0,750)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[0,48;

 

1

 

 

 

 

 

 

 

 

0,615)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y / X

[0,888;

[1,1572;

[1,4264;

[1,696;

[1,9648;

[2,2340;

[2,5032;

[2,7724;

[3,0416;

[3,3108;

1,1572)

1,4264)

1,6956)

1,965)

2,234)

2,5032)

2,7724)

3,0416)

3,3108)

3,58]

 

h

xmax xmin

, x x

i h ,

 

x

10

 

 

i

min

x

 

 

 

 

 

 

hy

ymax ymin

, yj

ymin j hy

 

 

10

 

 

 

 

 

Розмір кожної клітиночки - hx hy ,

hx 0,2692,

hy 0,1350.

 

 

19

 

 

Розташування рядків і стовпчиків в цієї таблиці нестандартне, але більш зручне, тому що наближене до розташування координатних осей на площині, а структура таблиці схожа на кореляційне поле.

Для контролю, чи правильно знайдені кратності входження вибіркових значень до клітиночок, знаходимо контрольні суми по рядкам і стовпчикам. Їх записуємо в окремий стовпчик справа и рядок знизу. Сума значень в останньому рядку і останньому стовпчику повинна співпадати с об’ємом вибірки N 100 . Вона розташована в правому нижньому куточку таблиці.

Така таблиця схожа на закон розподілу двовимірної дискретної величини. В подальшому ми будемо діяти з цією таблицею, так саме, як з такими законами розподілу, після того, як ми замінюємо всі вибіркові значення, що потрапляють до деякої клітиночці, на одне значення - середню точку цієї клітинці, а кількість точок будемо вважати кратністю. Якщо ми поділимо кратності на об’єм вибірки N 100 , то в таблиці будуть розташовані відносні частоти – аналоги ймовірностей pi, j . Формули для вибіркових середніх, вибіркових

центральних моментів, вибіркових коефіцієнтів коваріації і кореляції аналогічні відповідним формулам для теоретичних середніх, теоретичних центральних моментів і теоретичних коефіцієнтів коваріації і кореляції двовимірної дискретної випадкової величини, що обчислюються за аналогічною таблицею.

Будуємо наступну таблицю, в яку додаємо перший рядок і стовпчик, в які записуємо середини відповідних інтервалів.

Таблиця 1

Y \ X

1,0226

1,2918

1,561

1,8302

2,0994

 

2,3686

 

2,6378

2,907

3,1762

3,4454

 

1,7625

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

1,6275

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

2

1,4925

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

1,3575

 

 

 

 

 

 

2

 

 

1

 

 

1

1

 

 

5

1,2225

 

 

 

 

2

 

3

 

 

5

 

 

3

 

 

 

13

1,0875

 

 

4

 

6

 

9

 

 

2

 

 

3

 

 

 

24

0,9525

 

 

5

 

9

 

7

 

 

1

 

 

1

 

 

 

23

0,8175

1

2

10

 

9

 

2

 

 

 

 

 

 

1

 

 

25

0,6825

1

3

1

 

 

 

 

 

 

 

 

 

 

 

 

 

5

0,5475

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

6

20

 

26

 

23

 

 

9

 

 

8

4

1

1

100

 

 

 

x

 

 

xi 1 xi

, y

 

 

yi 1 yi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i,сер

 

 

2

 

i,сер

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для знаходження коефіцієнта кореляції і коефіцієнтів в рівняннях лінії регресії нам необхідно обчислити за вищенаведеною таблицею наступні середні

значення : X ,Y , X 2 ,Y 2 , X Y .

20