
- •Тема V. Методи аналізу взаємозв’язків …………………………………….30
- •Передмова
- •Програма нормативної дисципліни “основи статистики фізичного виховання і фізичної реабілітації”
- •Зміст тем курсу
- •Тема V: Методи вивчення взаємозв’язків.
- •Список рекомендованої літератури
- •Структура навчального курсу для заочного відділення (розподіл годин).
- •Тема V. Методи аналізу взаємозв’язків.
- •Стислий огляд теми і
- •Стислий зміст теми іі.
- •Тема ііі. Статистичні розподіли і їх характеристика. Показники варіації та форми розподілу. План
- •Стислий огляд теми ііі.
- •Тема V Методи аналізу взаємозв’язків План
- •Стислий огляд теми V.
- •1. Види взаємозв’язків.
- •2. Кореляційний зв’язок, кореляційний аналіз, кореляційне поле, коефіцієнт кореляції.
- •3. Перевірка гіпотези про істотність кореляційного зв’язку (строгий метод).
- •4. Спрощений метод оцінки істотності коефіцієнта кореляції і його довірчого інтервалу.
- •5. Непараметричний критерій Спірмена для виявлення кореляційного зв’язку.
- •6. Метод аналітичного групування і кореляційне відношення для оцінки взаємозв’язку при нелінійній формі залежності.
- •7. Кореляційно – регресійний аналіз лінійної залежності і коефіцієнт детермінації.
- •8.Дисперсійний аналіз і його суть.
- •9. Однофакторний дисперсійний аналіз.
- •Хід лабораторної роботи
- •Лабораторна робота № 2
- •План обчислень:
- •Хід лабораторної роботи.
- •Лабораторна робота № 4.
- •Хід лабораторної роботи.
- •Розподіл Стьюдента ( - розподіл).
- •Критичні значення кореляційного відношення і коефіцієнта детермінації , рівень значущості
- •Критичні значення коефіцієнта рангової кореляції Спірмена
- •Рівномірно розділені випадкові числа
5. Непараметричний критерій Спірмена для виявлення кореляційного зв’язку.
Використовуються також спрощені непараметричні методи оцінки сили зв’язку, які є менш надійними, проте є більш оперативними. Однією із найпростіших таких процедур є використання коефіцієнта рангової кореляції Спірмена:
, (5.15)
де
,
а
- відповідно рейтинги показників
.
Нехай значення
означають обсяг годин тренування
спортсмена – бігуна в годинах за тиждень,
а
- результати фінішного забігу на 100 м
(табл.2.).
Таблиця 2.
№ п/п |
Обсяг тренувальних годин, год., |
Результат забігу на 100 м, сек., |
Рейтинги |
Різниці
|
|
|
|
|
|||||
1 |
20 |
10,57 |
6 |
6 |
0 |
0 |
2 |
25 |
10,42 |
4 |
4 |
0 |
0 |
3 |
30 |
10,26 |
1 |
2 |
-1 |
1 |
4 |
28 |
10,28 |
2 |
3 |
-1 |
1 |
5 |
21 |
10,54 |
5 |
5 |
0 |
0 |
6 |
26 |
10,25 |
3 |
1 |
2 |
1 |
7 |
18 |
10,62 |
8 |
7 |
1 |
1 |
8 |
19 |
10,71 |
7 |
8 |
-1 |
1 |
9 |
16 |
10,80 |
10 |
9 |
1 |
1 |
10 |
17 |
10,85 |
9 |
10 |
-1 |
1 |
|
|
|
|
|
|
|
За результатами обчислень, за табл. 2 маємо:
Істотність зв’язку оцінюють на основі нерівності:
(5.16)
Із
таблиці додатку 9 маємо для
.
Отже, нерівність (5.16) підтвердилась. А
це значить, що зв’язок між часом
тренування спортсмена
і результатами забігу
є прямим і істотним. Коли б нерівність
(5.16) не підтвердилась, то з цього слід
зробити висновок, що зв’язок не доказаний.
6. Метод аналітичного групування і кореляційне відношення для оцінки взаємозв’язку при нелінійній формі залежності.
Метод
аналітичного групування (МАГ) полягає
в розбитті статистичної сукупності
даних на групи за факторною ознакою
.
Кількість груп
визначають Старджеса:
,
(5.17)
де – кількість спостережень.
Основна
вимога при групуванні: в групі не може
бути менше двох спостережень. Якщо є
групи, в яких є лише одне спостереження
то в цьому разі беруть число груп
-1
і проводять перегрупування. Ширина
інтервалу групування
визначається за формулою:
,
(5.18)
де
= розмах варіації :
Таким чином, якщо = 10, то за правилом (5.17) =3 і маємо такі інтервали для груп:
І група
:
;
ІІ група
:
;
ІІІ
група :
;
Кореляційне
поле, розбите на три групи за факторною
ознакою, показано на рис. 7. В кожній
групі знайдемо середнє значення
,
де
– номер групи (
=1,2…,
);
- кількість
груп. На рис. 7. середні значення
в групах з’єднано подвійною лінією.
Одержана ламана є емпіричною
лінією регресії. Перед
тим як досліджувати цю регресію необхідно
встановити факт істотності зв’язку,
що і є основою методу МАГ. Це здійснюється
за допомогою кореляційного відношення,
яке можна обчислити для будь-якого
зв’язку - як лінійного, так і нелінійного.
Рис.7. Емпірична лінія регресії (ламана лінія).
Кореляційне
відношення
обчислюють за формулою:
, (5.19)
де
-
факторна дисперсія, яку обчислюють за
формулою:
,
(5.20)
де
- середня арифметична по
-тій
групі
- число спостережень в
-тій
групі,
- загальна середня.
Зміст факторної дисперсії полягає в тому, що вона характеризує лише ту частину варіації результативної ознаки, яка визвана зміною факторної.
Дисперсія
називається загальною дисперсією і
обчислюється за формулою:
(5.21)
Загальна дисперсія відображає вплив на результативну ознаку усіх без винятку факторів.
Для
контролю правильності обчислень
дисперсій
та
,
які
входять в основну формулу (5.19),
використовують правило
складання дисперсій:
,
(5.22)
де
- залишкова дисперсія, яка обчислюється
за формулою
. (5.23)
Якщо
після обчислення
,
,
рівність (5.22) підтвердиться, то це
значить, що всі обчислення виконані
правильно і можна знаходити кореляційне
відношення
за
формулою (5.19). Якщо рівність (5.22) не
виконується, то необхідно повторити
обчислення дисперсій
,
,
заново, при необхідності збільшивши
точність розрахунків, особливо значень
в групах.
Істотність зв’язку перевіряють на основі нерівності
, (5.25)
де
- рівень ризику;
- число груп,
- загальна кількість спостережень.
Значення
вибирають із таблиці додатку 7 в залежності
від
.
Якщо нерівність (5.20) підтверджується, то це свідчить про істотність зв’язку, якщо ні, то наявність зв’язку не доведена.