Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пiдручник3_prn.doc
Скачиваний:
126
Добавлен:
16.11.2019
Размер:
18.08 Mб
Скачать

5.13.2. Кореляція

Вивчення живих організмів вимагає встановлення функціональних залежностей, за яких кожному значенню однієї перемінної (аргументу) відповідає одне конкретне значення іншої перемінної (функції).

Частіше зустрічаються такі співвідношення між змінними, коли кожному значенню ознаки X відповідає не одне, а багато значень ознаки Y, тобто їх розподілення. Такі зв'язки називаються стохастичними (вірогіднісними) або корелятивними.

Часто зі зростанням однієї перемінної збільшується інша або зі зростанням однієї відбувається зменшення іншої. Тому такий зв'язок називають прямою, або зворотньою (негативною) кореляцією.

Дослідження кореляції зводиться до:

1) встановлення факту залежності змін однієї ознаки від зміни іншої і визначення форми зв'язку між ними;

2) знаходження тісноти зв'язку, тобто ступеня зв'язку між зна­ченнями однієї та іншої ознаки.

Ступінь зв'язку виражають у вигляді абстрактного числа, яке за лінійної кореляції називають коефіцієнтом кореляції, а за криволінійної залежності – кореляційним відношенням.

При простій кореляції досліджують зв'язок між двома ознаками, при множинній кореляції на величину однієї результативної ознаки впливає кілька факторіальних. Кореляція між двома перемінними незалежно від інших перемінних, які варіюють одночасно з тими, що розглядаються, на­зивається простою, або загальною кореляцією.

Кореляція між двома перемінними, коли одне або більше число пе­ремінних утримується на постійному рівні, називається частковою коре­ляцією. У багатьох випадках не враховують, яка з перемінних є залежною. Незалежну перемінну позначають X, а залежну перемінну - Y. Для встановлення зв'язку треба встановити, як тісно пов'язані дві змінні, і чи встановлена залежність є дійсною або випадковою. Для встановлення ступеня (тісноти) зв'язку між двома змінними визначають коефіцієнт кореляції, який позначають символом r.

Повна назва коефіцієнта кореляції - коефіцієнт лінійної регресії. Ні­що у визначенні коефіцієнта кореляції не вказує або не має на увазі, що зв'язок між двома перемінними є причинно-наслідковою залежністю. Коефіцієнт кореляції обчислюють за формулою:

або .

Коефіцієнт кореляції змінюється від -1 до +1. При r=±1 кореляція перетворюється на функціональну. Якщо r=0, між х і у немає зв'язку, але криволінійна залежність може існувати.

При r<0,3 зв'язок слабкий, r=0,3..0,7 зв'язок середній, r>0,7 – зв'язок сильний. Додатнє значення (+) r вказує на пряму (позитивну), а від'ємне (-) на обернену (негативну) кореляцію. Низький коефіцієнт кореляції не завжди визначає відсутність зв'язку, у такому випадку може мати місце кри­волінійна залежність.

Для оцінки надійності коефіцієнта кореляції обчислюють його похиб­ку і критерій суттєвості. Похибку коефіцієнта кореляції (Sr) визначають за формулою:

,

де r – коефіцієнт кореляції; n – число вибірок (число пар, за якими об­числюють коефіцієнт кореляції).

Критерій суттєвості коефіцієнта кореляції розраховують за формулою:

.

Якщо trфакт ≥ trтеор , то кореляційний зв'язок істотний, а якщо trфакт < trтеор - не істотний (t - теоретичне беруть із таблиці Стьюдента для рівня вірогідності 95, або 99% і числі ступеня свободи v=n-2).

Для малих вибірок у значеннях r, близьких до одиниці, розподіл коефіцієнтів кореляції вибірок значно відрізняється від нормального. Тому для оцінки значущості коефіцієнта кореляції в генеральній сукупності і порівняння коефіцієнтів кореляції критерій Стьюдента стає ненадійним. Щоб вийти з такого положення, Р.Фішер запропонував перетворити r на величину z, яка розподілена нормально. Для переходу від r до z і в зворотньому напрямку використовують таблиці 5.12.

Стандартна похибка величини z дорівнює , де n - обсяг вибірки. Критерій значущості для z і різниця z1-z2, а та­кож довірчі границі величини z визначають за відношеннями:

; ;

Після визначення довірчих меж зворотним перетворенням за таблицею знаходять відповідні zмакс і zмін , величини rмакс і rмін (табл. 5.13).

Таблиця 5.12 — Співвідношення між величинами r i z.

Десяті частки

Соті частки

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

Значення z

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0,000

0,100

0,203

0,309

0,424

0,549

0,693

0,867

1,099

1,472

0,010

0,110

0,213

0,321

0,436

0,563

0,709

0,887

1,127

1,527

0,020

0,121

0,224

0,332

0,448

0,576

0,725

0,908

1,157

1,589

0,030

0,131

0,234

0,343

0,460

0,590

0,741

0,929

1,188

1,653

0,040

0,141

0,245

0,354

0,472

0,604

0,758

0,951

1,221

1,773

0,050

0,151

0,255

0,365

0,485

0,618

0,776

0,973

1,256

1,832

0,060

0,161

0,266

0,377

0,498

0,633

0,793

0,996

1,293

1,946

0,070

0,172

0,277

0,388

0,510

0,648

0,811

1,020

1,333

2,092

0,080

0,182

0,288

0,400

0,523

0,663

0,829

1,045

1,376

2,298

0,090

0,192

0,299

0,412

0,536

0,678

0,848

1,071

1,422

2,647

Перевірити нульову гіпотезу Н0: r=0 можна без розрахунків критерію, а безпосередньо за табл. 5.8. У ній наведені граничні значення коефіцієнтів кореляції на 5%-ому і 1 %-ому рівнi значущості. Між X і Y існує суттєвий зв'язок і Н0 не відкидають, якщо rфаkт. > rтеоо. Нульова гіпотеза відкидається тоді, коли rфакт. < rтеоо Для доведення слабких зв'язків необхідно мати 40-100, середніх – 12-40 і сильних 6-12 пар спостережень.

Таблиця 5.13 — Критичні значення коефіцієнта кореляції на 5%-му і 1%-му рівнях значущості

Ступені свободи (n-2)

0,05

0,01

Ступені свободи (n-2)

0,05

0,01

Ступені свободи (n-2)

0,05

0,01

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

0,997

0,950

0,978

0,811

0,754

0,707

0,666

0,632

0,602

0,576

0,553

0,532

0,514

0,497

0,482

1,000

0,990

0,959

0,917

0,874

0,834

0,798

0,765

0,735

0,708

0,684

0,661

0,641

0,623

0,606

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

0,468

0,458

0,444

0,433

0,423

0,413

0,404

0,396

0,388

0,381

0,374

0,367

0,361

0,355

0,349

0,590

0,575

0,561

0,549

0,537

0,526

0,515

0,505

0,496

0,487

0,478

0,470

0,463

0,456

0,449

35

40

45

50

60

70

80

90

100

150

200

300

400

500

1000

0,325

0,304

0,288

0,273

0,250

0,232

0,217

0,205

0,195

0,159

0,138

0,113

0,098

0,088

0,062

0,418

0,393

0,372

0,354

0,325

0,302

0,283

0,267

0,254

0,208

0,181

0,148

0,128

0,115

0,081

Під лінійною (прямолінійною) кореляційною залежністю між двома ознаками X і Y розуміють таку залежність, яка має лінійний характер і зображується рівнянням прямої лінії у=а+вх, де а - вільний член; в – коефіцієнт регресії. Це рівняння називають рівнянням регресії у на х. Відповідну йому пряму лінію називають вибірковою лінією регресії у на х.

При лінійній кореляції зі збільшенням середнього значення однієї ознаки збільшується середнє значення іншої. Така кореляція називаєть­ся прямою; при оберненій кореляції зі збільшенням середнього значен­ня однієї ознаки зменшується середнє значення іншої.

Криволінійна кореляція показує, що зі збільшенням значення однієї ознаки інша набуває значення, яке збільшується до певної величини, а потім зменшується або навпаки. Для криволінійного розподілу даних за допомогою логарифмічного або напівлогарифмічного перетворення може бути вибрана поліномінальна форма кривої у=а+вх+сх2+ах3t…

Під час розрахунку використовують стільки членів, скільки потрібно для одержання задовільних даних.

Для визначення невідомих коефіцієнтів а, в, с, d та інших необхідно розв’язати систему рівнянь, які називають нормальними рівняннями:

an+bΣx+cΣx2+d Σx3+…= Σy;

aΣx+bΣx2+cΣx3+dΣx4+…= Σxy;

aΣx2+bΣx3+cΣx4+dΣx5+…= Σx2y;

aΣx3+bΣx4+cΣx5+dΣx6+…= Σx3y.

Число рівнянь і число членів лівої частини рівняння повинно дорівнювати числу необхідних коефіцієнтів або бути на одне більше, ніж ступінь рівняння регресії. Ступінь рівняння і криві мають певні назви (табл. 5.14).

Якщо відхилення експерименту від розрахункової кривої носить випадковий характер, то підбір кривої більшого ступеня втрачає значення; якщо відхилення мають систематичний характер або утворюють певні групи щодо знака, то розрахунок рівняння наступного порядку, як правило, є бажаним. Ступінь зв’язку у варіації двох величин більш точно вимірюється квадратом коефіцієнта кореляції (r2). Він показує частку (%) тих змін, які у даній події залежать від досліджуваного фактора.

Таблиця 5.14 — Назви ступенів, рівнянь і кривих (Т. Литтл, Ф. Хилз)

Ступінь

Назва рівнянь

Назва кривої

Перший

Другий

Третій

Четвертий

П’ятий

Лінійне

Квадратичне

Кубічне

Четвертого ступеня

П’ятого ступеня

Пряма лінія

Парабола

Кубічна парабола

Парабола четвертого ступеня

Парабола п’ятого ступеня

Коефіцієнт детермінації є прямим засобом відображення залежності однієї величини від іншої. В цьому випадку він має переваги перед коефіцієнтом кореляції. Множинною кореляцією називається об’єднана кореляція між залежною і всіма незалежними перемінними. Квадрат коефіцієнта множинної кореляції R2 називається коефіцієнтом детермінації.