Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л_6_м_с_2_вища.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
137.65 Кб
Скачать

5. Вибірковий коефіцієнт лінійної кореляції та його властивості

Вибірковий коефіцієнт кореляції служить для вимірювання сили (тісноти) лінійного зв’язку між значеннями ознак Х та Y. Це – величина відносна; виражається в долях одиниці. Знак коефіцієнта вказує на напрям кореляційного зв’язку (прямий, обернений), а його абсолютна величина – на тісноту кореляції.

Коефіцієнт кореляції обчислюється за формулою:

( 3)

rxy - коефіцієнт кореляції;

хі - значення першої ознаки;

уі - значення другої ознаки;

, - середні арифметичні ознак X та Y, відповідно.

Властивості коефіцієнта кореляції:

  1. Якщо r = 0 і обидві вибіркові лінії регресії - прямі, то лінійний кореляційний зв’язок між ознаками Х та Y відсутній.

  2. Якщо r = 1, то зв’язок настільки тісний, що переходить у функціональний.

  3. |r|≤1 (це означає, що величина коефіцієнта кореляції знаходиться в межах від - 1 до 1).

  4. Знак коефіцієнта кореляції вказує на характер зв’язку: при r>0 кореляція – пряма, при r<0 – обернена.

  5. При |r| < 0,3 – зв’язок слабий;

при 0,3 ≤ |r| < 0,5 – поміркований;

при 0,5 ≤ | r| < 0,7 – значний;

при 0,7 ≤ |r| ≤ 0,9 – сильний;

при |r| > 0,9 – вважається дуже сильним, близьким до функціонального.

Слід мати на увазі, що такий розподіл значень коефіцієнта умовний і не є загальноприйнятим стандартом при оцінюванні ступеня спряженості між ознаками, які варіюють.

Вибірковий коефіцієнт кореляції характеризує тісноту кореляційного зв’язку між кількісними ознаками у вибірці. Чим ближче |r| до 1, тим зв’язок більш сильний; чим ближче |r| до 0, тим зв’язок більш слабий.

Якщо вибірка має достатньо великий об’єм і добре представляє генеральну сукупність (репрезентативна), то висновок про тісноту лінійної залежності між ознаками, отриманий за даними вибірки, певною мірою можна розповсюдити і на генеральну сукупність.

6. Довірча оцінка коефіцієнта кореляції

Вибірковий коефіцієнт кореляції є випадковою величиною, тому він може відрізнятися від нуля навіть при незалежному варіюванні ознак. Тож його треба розглядати як оцінку генерального коефіцієнта кореляції (rген). При оцінюванні rген нульова гіпотеза формулюється так: між випадковими величинами Х та Y в генеральній сукупності кореляція відсутня, тобто rген=0.

Для перевірки нульової гіпотези використовують t-критерій Стьюдента:

при n < 100 критерій обчислюється за формулою (для великих вибірок, де n≥100, за число ступенів свободи беруть n):

(4)

r – емпіричний коефіцієнт кореляції;

n–2 – число ступенів свободи (n – для великих вибірок);

n – об’єм вибірки.

Нульова гіпотеза відхиляється, якщо ( t знаходять в таблиці Стьюдента для ν=n–2 і взятого рівня значущості α). Ця нерівність означає, що в генеральній сукупності rген 0, і вибірковий коефіцієнт кореляції достовірно відрізняється від нуля – між Х таY існує кореляційний зв’язок. Якщо ж t<t - нульова гіпотеза зберігається – відмінність вибіркового коефіцієнта кореляції від нуля вважається випадковою.

Приклад 2.

Щоб визначити вплив рівня розвитку «вибухової» сили м’язів нижніх кінцівок на результат бігу на 100 м у студенток ІІ курсу (n=10), виміряли відповідні показники: хі - результат стрибка в довжину з місця в сантиметрах; уі - час забігу на 100 м у секундах.

Чи існує лінійний кореляційний зв’язок у цих студенток між результатами стрибка і часом забігу? Чи достовірний цей зв'язок у генеральній сукупності?

Щоб з'ясувати, чи існує взаємна залежність між результатами стрибка і бігу в даній групі досліджуваних, треба обчислити вибірковий коефіцієнт кореляції, величина якого дасть відповідь на перше питання. На друге питання відповість перевірка нуль-гіпотези за t-критерієм Стьюдента.

Результати обчислень зручно подати у вигляді таблиці (див. нижче):

1

2

3

4

5

6

7

xі

yі

( )∙( )

( )2

( )2

155

160

160

165

165

167

170

175

178

180

18,2

18,5

18,4

18,6

17,5

18,6

17,4

16,4

16,3

17,5

-13

- 8

- 8

- 3

- 3

- 1

2

7

10

12

0,5

0,8

0,7

0,9

-0,2

0,9

-0,3

-1,3

-1,4

-0,2

-6,5

-6,4

-5,6

-2,7

0,6

-0,9

-0,6

-9,1

-14,0

-2,4

169

64

64

9

9

1

4

49

100

144

0,25

0,64

0,49

0,81

0,04

0,81

0,09

1,69

1,96

0,04

1675

176,8

- 47,6

613

6,82

У першій графі таблиці розміщені в порядку зростання значення стрибка в довжину з місця в сантиметрах – xі.. В другій - відповідні значення часу забігу в секундах – yі. Очевидно, що зі збільшенням довжини стрибка зменшується час пробігу дистанції. Тож можна припустити, що існує від’ємний кореляційний зв’язок між досліджуваними ознаками.

Знайдемо середні арифметичні обох ознак. Для цього просумуємо окремо всі числа першого і другого стовпчиків і отримані суми (1675 та 176,8) поділимо на кількість даних (n=10).

Отже, середня дальність стрибка в групі 1675:10=167,5≈168(см), а середній час забігу 176,8:1=17,68≈17,7 (с).

У графу 3 записують різниці кожної варіанти xі і знайденої середньої арифметичної . У графі 4 – аналогічні результати для ознаки yі. У 5-му стовпчику записуються добутки відповідних значень третього і четвертого стовпчиків, а в нижньому рядку таблиці - сума цих добутків. В шостій і сьомій графі - результати піднесення до квадрата даних третього і четвертого стовпчиків, відповідно. Числові значення останніх двох стовпчиків також сумують.

П ідставивши у формулу (3) для обчислення r знайдені суми, матимемо:

Знайдене значення коефіцієнта свідчить про те, що у вибірці між досліджуваними ознаками існує значна від’ємна кореляційна залежність.

Перевіримо, чи достовірно відрізняється rxy від нуля в генеральній сукупності. Обравши рівень значущості α=0,05 і обчисливши число ступенів свободи

ν =n-2=8, знайдемо в таблиці граничних значень t-критерію Стьюдента tα=2,31. Обчислимо значення t за формулою (4):

Результат порівняння: t=3,12>tα=2,31 свідчить про те, що і в генеральній сукупності існує значний кореляційний зв’язок між довжиною стрибка і часом подолання 100-метрової дистанції.

Отже, вплив рівня розвитку «вибухової» сили м’язів нижніх кінцівок на результат бігу є очевидним (не зважаючи на те, що вибірка малого об’єму). Цей факт, підтверджений розрахунками, свідчить, що його необхідно правильно враховувати в процесі фізичного виховання чи спортивних тренувань.

На практиці трапляється, що отриманий на малочисельних вибірках і оброблений фактичний числовий матеріал, суперечить логічним припущенням щодо існування кореляційного зв’язку між досліджуваними ознаками. Тобто логічний аналіз результатів спостереження дає підстави вважати, що кореляційний зв’язок між конкретними параметрами існує, а обчислений коефіцієнт кореляції має низьке значення або при перевірці достовірності виявляється недостовірним. Проте статистична недостовірність емпіричного коефіцієнта кореляції ще не доводить, що зв’язок між ознаками, які варіюють, відсутній. При достатній кількості спостережень цей зв’язок може виявитися достовірним. Дослідник повинен мати це на увазі і за потреби збільшити обсяг вибірки та виконати всі розрахунки знову.

Приклад 4.

Результат бігу на 60 м є показником швидкості, який залежить від ряду факторів, зокрема, від абсолютної швидкості. Біг на 20 м з ходу – тест на абсолютну швидкість.

Перевірити, чи існує лінійний кореляційний зв’язок між результатами бігу на 20 м з ходу – хі (с) та на 60 м – уі (с), зафіксованими у 16 учениць 4 класу. Обчислити коефіцієнт лінійної кореляції r. Перевірити його достовірність.

№ №

хі

уі

( )∙( )

( )2

( )2

1

3,0

12,0

-1,1

-0,2

0,22

1,21

0,04

2

3,5

11,0

-0,6

-1,2

0,72

0,36

1,44

3

3,9

11,8

-0,3

-0,4

0,12

0,09

0,16

4

4,1

12,9

0,0

0,7

0,00

0,00

0,49

5

4,1

12,3

0,0

0,1

0,00

0,00

0,01

6

4,2

14,8

0,1

2,6

0,26

0,01

6,76

7

4,2

11,0

0,1

-1,2

-0,12

0,01

1,44

8

4,2

12,0

0,1

-0,2

-0,02

0,01

0,04

9

4,2

10,1

0,1

-2,1

-0,21

0,01

4,41

10

4,2

10,4

0,1

-1,5

-0,15

0,01

2,25

11

4,2

11,2

0,1

-1,0

-0,10

0,01

1,00

12

4,3

12,0

0,2

-0,2

-0,04

0,04

0,04

13

4,3

14,1

0,2

1,9

0,38

0,04

3,61

14

4,3

12,3

0,2

0,1

0,02

0,04

0,01

15

4,5

15,5

0,4

3,3

1,32

0,16

10,89

16

4,5

11,0

0,4

-1,2

-0,48

0,16

1,44

Σ=65,7

Σ=194,4

Σ=1,92

Σ=2,16

Σ=34,03

Виконавши відомі обчислення, знайдемо середні значення ознак Х та Y, та проведемо подальші обчислення для знаходження лінійного коефіцієнта кореляції.

(с); (с);

Перевіримо достовірність цього коефіцієнта:

При обраному рівні значущості α=0,05 і числі ступенів свободи ν=16-2=14 табличне значення tst=2,14, що перевищує tф. Отже, розрахунки показали, що вибірковий лінійний коефіцієнт кореляції низький і недостовірний для генеральної сукупності. Проте відомо, що тест на абсолютну швидкість (біг на 20 м з ходу) є інформативним і надійним, а отже, його результати повинні корелювати з результатами бігу на 60 м. То чому ж цей факт не підтвердили проведені обчислення? Очевидно, наша вибірка виявилась недостатньо репрезентативною для того, щоб отримати надійні результати. Мінімальний об’єм вибірки треба збільшити. Для цього існує спеціальна формула.

Вивчаючи в ході педагогічного експерименту різні ознаки, здійснюючи контроль, можна виявляти цікаві з позиції як науки, так і практики факти взаємного зв’язку між цими ознаками (наприклад, між об’ємом навантаження і значеннями конкретних функціональних показників). Це надасть можливість впливати на один показник через інший, кореляційно пов’язаний з ним. Виявлену залежність можна нормувати або завдяки їй оцінювати ефективність тренувального процесу у певного контингенту досліджуваних (учнів, спортсменів тощо). Взагалі, вивчення кореляційних зв’язків відкриває широкі можливості перед дослідниками в царині фізичної культури.

Питання для самопідготовки

  1. Яка залежність між двома величинами називається функціональною? Навести приклад.

  2. Який вид зв'язку, відмінний від функціонального, існує в природі? Чим він характерний? Навести приклади .

  3. Пояснити на конкретному прикладі, що таке умовна, або групова, середня величина.

  4. Сформулювати визначення кореляційної залежності величини Y від величини Х.

  5. Що таке рівняння регресії?

  6. В чому полягають основні задачі кореляційного аналізу?

  7. Охарактеризувати види кореляції. Навести приклади кореляційного зв’язку, що вивчаються в царині фізичної культури. Що таке факторна і результативна ознаки?

  8. Як наочно можна зобразити кореляційний зв'язок між ознаками і які висновки при цьому зробити?

  9. За якою формулою обчислюється парний коефіцієнт лінійної кореляції?

  10. Назвати властивості парного коефіцієнта лінійної кореляції.

  11. Як за допомогою t-критерію Стьюдента перевірити, чи достовірно відрізняється від нуля вибірковий коефіцієнт кореляції (тобто чи дійсно в генеральній сукупності між величинами Х і Y існує кореляція)?

Таблиця значень t-критерію Стьюдента

Число ступенів

свободи ν

Рівні значущості

Число ступенів

свободи ν

Рівні значущості

0,05

0,01

0,05

0,01

1

12,71

63,66

18

2,10

2,88

2

4,30

9,92

19

2,09

2,86

3

3,18

5,84

20

2,09

2,85

4

2,78

4,60

21

2,08

2,83

5

2,57

4,03

22

2,07

2,82

6

2,45

3,71

23

2,07

2,81

7

2,36

3,50

24

2,06

2,80

8

2,31

3,36

25

2,06

2,79

9

2,26

3,25

26

2,06

2,78

10

2,23

3,17

27

2,05

2,77

11

2,20

2,11

28

2,05

2,76

12

2,18

3,05

29

2,05

2,76

13

2,16

3,01

30

2,04

2,75

14

2,14

2,98

40

2,02

2,70

15

2,13

2,95

60

2,00

2,66

16

2,12

2,92

120

1,98

2,62

17

2,11

2,90

1,96

2,58


Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]