Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
біостатистика нові ООЗ / книги ООЗ / Москаленко, Вороненко - Соціальна медицина та організація охорони здоровя.doc
Скачиваний:
4638
Добавлен:
16.05.2015
Размер:
16.89 Mб
Скачать

Кореляційна залежність за направленістю, силою та формою зв'язку

Форма зв'язку

Прямолінійна - рівномірна зміна одногопараметра відповідає рівномірним змінаміншого параметра (при незначних коли-ваннях)

Криволінійна - рівномірна зміна одногопараметра відповідає нерівномірним змі-нам іншого параметра (нерівномірність маєпевну закономірність)

Направленість зв'язку - визначається за знаком коефіцієнта кореляції

Прямий зв'язок (позитивний) - динаміка параметрів є однонаправленою - збіль­шення одного параметра обумовлює збільшення іншого (зростання екологіч­ного навантаження обумовлює зростання

Сила зв'язку

Слабка г = 0,01 -0,29

Середня г = 0,30-0,69

Сильна г = 0,70-0,99

Зворотний зв'язок (негативний, від'ємний) -динаміка параметрів є різнонаправленою - збільшення одного параметра обумовлює зменшення іншого (при збільшенні віку дітей спотерігається зниження рівня захво­рюваності)

Ранговий коефіцієнт кореляції (Спірмена) відноситься до непараметрич-них критеріїв оцінки взаємозв'язку. Особливість коефіцієнта - простота обчис­лення при недостатній точності дозволяє його використовувати для орієнтов­ного аналізу з проведенням швидких розрахунків, при визначенні даних у напівкількісному, описовому вигляді. Він базується на визначенні рангу кожного значення ряду. Методику розрахунку наведено на прикладі характе­ристики взаємозв'язку між рівнем перинатального ризику у вагітних та часто­тою післяпологових ускладнень (табл. 2).

Порядок розрахунків:

1. Визначаємо ранги для значень кожної величини ряду (х) та (у). Рангу-вання обох рядів повинно бути однонаправленим, наприклад, від меншого добільшого.

2. Визначаємо відхилення значень першого ряду від другого (сі ). їх сума

ху

з врахуванням знаків повинна дорівнювати нулю.

3. Підносимо отримані результати до квадрата та визначаємо їх сумуШ\, = 4).

Таблиця 2

Взаємозв'язок між рівнем перинатального ризику у вагітних та частотою післяпологових ускладнень

Перинатальний ризик (бали)X

Частота післяпологових ускладнень (%) У

Поряді номери (і

<ові эанги)

Різниця рангів

Квадрат різниці рангів

X

У

с!хч, = х-у

СІ"ху

До 2

0,4

1

1

0

0

3-4

0,8

2

3

-1

1

5-6

0,6

3

2

1

1

7-8

1,4

4

5

-1

1

9-10

1,3

5

4

1

1

Іс12ху=4

4. Підставляємо отримані результати у формулу:

Р п(п2-1) 5(25-1)

Висновок: між рівнем перинатального ризику вагітних та частотою післяпо­логових ускладнень виявлено сильний, прямий кореляційний зв'язок.

Похибка рангового коефіцієнта кореляції для нашого випадку (п < ЗО) визначається за формулою:

При великому числі спостережень (п > ЗО) середня похибка рангового коефіцієнта кореляції може бути визначена за формулою:

л/п

Оцінка вірогідності коефіцієнта кореляції проводиться за тими ж принципами, що використовуються для інших показників з розрахунком критерію вірогіднос­ті (t) і врахуванням числа спостережень (число ступенів свободи варіаційних рядів n' = п - 2). Отримані результати порівнюють з табличними значеннями. Загалом, слід пам'ятати, що для оцінки вірогідності результатів коефіцієнт кореляції повинен перевищувати свою похибку не менше ніж в 2,5-3 рази при достатньому числі спостережень.

Для нашого випадку тр = 0,346 і t = р/тр = 0,80/0,346 = 2,31, що, відповідно, нижче граничних значень (t = 3,2 при р < 0,05). Отриманий результат (t) не дозволяє зробити висновок про вірогідність даного рангового коефіцієнта кореляції. Доцільним в даному випадку є використання більшого числа спостережень.

Спрощений метод оцінки рангового коефіцієнта кореляції передбачає порів­няння його з критичним табличним значенням для відповідного числа пар спостережень. Коефіцієнт кореляції є значимим з вірогідністю похибки не вище 5 % (р < 0,05), якщо отриманий результат вище чи дорівнює табличному значенню. Для нашого прикладу для 5 пар спостереження табличне значення р = 0,900 (при р < 0,05), що вище фактичного значення. Отже, отриманий результат не можна вважати суттєвим.

Для розрахунку коефіцієнта прямолінійної кореляції існує багато методів. Вони визначаються метою, характером та об'ємом дослідження, наявністю обчислювальної техніки. Один з методів був запропонований К. Пірсоном, в науковій літературі відомий як лінійний коефіцієнт кореляції Пірсона. Формула його розрахунку така:

Vid--id-;

де: х і у - варіанти порівнюваних варіаційних рядів; did- відхилення

х у

кожної варіанти від своєї середньої арифметичної.

Наприклад: визначити залежність між тривалістю паління (роки) та часто­тою виявлення хронічних бронхітів у молодому віці (до 29 років).

Таблиця З

Тривалість паління (роки) (х)

Частота хронічних бронхітів (%) (у)

dx

dy

dx' dy

dx2

dy2

3

6,0

-3,5

-11,0

38,5

12,25

121,0

4

9,0

-2,5

-8,0

20,0

6,25

64,0

5

12,0

-1,5

-5,0

7,5

2,25

25,0

6

13,0

-0,5

-4,0

2,0

0,25

16,0

7

14,0

0,5

-3,0

1,5

0,25

9,0

8

21,0

1,5

4,0

6,0

2,25

16,0

9

26,0

2,5

9,0

22,5

6,25

81,0

10

35,0

3,5

18,0

63,0

12,25

324,0

£=52

2=136

ldx=0

Zdv=0

Idx-dv=161

Idx2=42

Idv2=656

Хх=6,5

Xv=17

Розрахунок лінійного коефіцієнта кореляції:

  1. Визначають середні значення для кожного ряду (Хх,Х ).

  2. Визначають відхилення кожного із значень ряду від середньої величини did.

х у

  1. г =

    Підносять визначені відхилення до квадрата та визначають їх суми: Zdx2=42 та Idy2=656.

  2. Підставивши отримані значення у формулу Пірсона, отримаємо:

Idx-dy _ 161

-0,97

Висновок: між тривалістю паління в молодому віці та частотою хронічних бронхітів існує сильний прямий зв'язок.

Вірогідність отриманого результату визначимо за співвідношенням і = т/тг, де тг при малому числі спостережень (п < 30) дорівнює:

= 9,7,


= 0,1


mr =


1 -0,97п-2 V 8-2

t =

Для нашого випадку коефіцієнт вірогідності:

щ.


г 0,97

0,1

що значно вище гранично допустимих значень при вірогідності похибки р < 0,05.

При великому числі спостережень (п>30) формула для розрахунку середньої похибки коефіцієнта кореляції має інший вигляд:

12

2 тг =—=^

Л/П

Прямолінійний кореляційний зв'язок між параметрами характеризується тим, що кожному з однакових вимірів одного показника відповідає певне середнє значення іншого показника. Дану залежність можна описати коефіці­єнтом регресії. Він показує, на яку величину в середньому зміниться другий параметр при зміні першого на певну одиницю виміру.

Розраховується коефіцієнт регресії за формулою:

К -г 4

ЛхЛ - Гх\ ~Т~

' 4

де І?х/у - коефіцієнт регресії ознак х по у; гху - коефіцієнт кореляції; 5х та 5у - середні квадратичні відхилення рядів (х) та (у).

Розглянемо використання коефіцієнта регресії на прикладі.

При аналізі даних фізичного розвитку 7-річних хлопчиків отримані

наступні параметри фізичного розвитку за зростом (Хх) та вагою (Ху): X = 120,0 см; 5 = 6,0 см та X = 26,0 кг; 6 = 2,2 кг; г = 0,76.

х х у у ху

Коефіцієнт регресії за даних умов складає:

= • -|- = 0,76 • ^ = 0,28(кг)

Отже, при зміні зросту на 1 см вага хлопчиків в середньому зміниться на 0,28 кг. Визначений коефіцієнт регресії можна використати в рівнянні регресії при прогнозуванні ситуації - яка вага в середньому буде відповідати зросту хлопчиків 125,0 см:

ух = Ху + Ях/у ■ (х - X) = 26 + 0,28• (125 -120) = 27,4 (кг)

Коефіцієнти регресії досить широко використовуються для побудови рівнянь регресії при розробці багатьох медико-соціальних та клінічних проблем, в тому числі для оцінки фізичного розвитку дітей та підлітків. Дані рівняння являють собою математичну модель, яка описує характер взаємозв'язку між досліджу­ваними параметрами. Це особливо актуально при побудові багатофакторних моделей і прогнозуванні рівнів результативного параметра системи при фіксова­них рівнях окремих компонентів (показників).

Неведені вище методики розрахунку парних коефіцієнтів кореляції є осно­вою і лише першим етапом багатофакторного кореляційного аналізу. Парні коефіцієнти показують характер зв'язку (загального, "неочищеного") між досліджуваними параметрами без врахування впливу інших факторів. Оцінка

"чистого" взаємозв'язку в багатофакторних моделях визначається на основі парціальних коефіцієнтів кореляції. Основою для їх розрахунку є парні коефіцієнти. Множинний коефіцієнт кореляції відображає зв'язок одночасно комплексу факторів з досліджуваним результативним фактором (клінічними показниками та ін.).

Ще одним параметром багатофакторного кореляційного аналізу є коефіці­єнт детермінації, який відображає питому вагу (%) впливу факторів, що вивчаються (факторіальні ознаки), на рівень результативних ознак (показники здоров'я населення, клінічні показники та інші).

Методики практичної реалізації багатофакторного аналізу не розгляда­ються в даному розділі, тому що вони є досить об'ємними та широко наведені в спеціальній літературі. Враховуючи значні об'єми розрахунків, реалізація багатофакторного кореляційного аналізу не можлива без використання обчис­лювальної техніки. Дані методики реалізовані в багатьох пакетах прикладних програм: SPSS, STATISTICA, STADIA, AXUM, MULTIFAC, STATGRAPHICS plus, SAS та інших. їх повноцінне використання в клінічних та медико-соціальних дослідженнях не можливе без знань основ медичної статистики.

Контрольні питання

  1. Що таке кореляційний зв'язок, чим він відрізняється від функціонального?

  2. Дайте характеристику форми, направленості та сили зв'язку.

  3. Які методи використовують для розрахунку коефіцієнта кореляції?

  4. Як визначається вірогідність коефіцієнта кореляції?

  5. Що таке регресія?