- •6. Вибірковий метод. Статистична перевірка гіпотез
- •6.1. Суть вибіркового спостереження
- •6.2. Вибіркові оцінки середньої та частки
- •Вік і потенційна професійна мобільність робітників
- •6.3. Різновиди вибірок
- •6.4. Визначення обсягу вибірки
- •Достатній обсяг вибірки для вивчення малопоширених явищ
- •6.5. Статистична перевірка гіпотез
- •Ймовірність ризиків помилкових рішень при перевірці гіпотез
- •Основні категорії та поняття
- •7. Методи аналізу взаємозв’язків
- •7.1. Види взаємозв’язків
- •Залежність фондомісткості видобутку вугілля від глибини розробки вугільних пластів
- •7.2. Регресійний аналіз
- •Розрахунок параметрів лінійної регресії, теоретичних рівнів і залишкових величин
- •7.3. Оцінка щільності та перевірка істотності кореляційного зв’язку
- •Розрахунок загальної дисперсії фондомісткості видобутку вугілля (
- •Розрахунок факторної дисперсії фондомісткості продукції ()
- •7.4. Рангова кореляція
- •Розрахунок коефіцієнта рангової кореляції Спірмена
- •7.5. Оцінка узгодженості варіації атрибутивних ознак
- •Розподіл респондентів за віком і схильністю до ризику
- •Критичні значення
- •Розподіл пацієнтів клініки за результатами легеневих проб
- •Основні категорії та поняття
7.5. Оцінка узгодженості варіації атрибутивних ознак
Взаємозв’язки між атрибутивними ознаками аналізуються на підставі таблиць взаємної спряженості (співзалежності). Як приклад розглянемо табл. 7.8, у якій наведено результати соціологічного опитування населення щодо намірів узяти участь на ринку цінних паперів. Тих, хто не боїться ризикувати, класифікували як ризикових інвесторів, тих, хто не уявляє ризику без гарантій, — обережними, а хто ризику уникає взагалі, — неризиковими.
Частоти комбінаційного розподілу респондентів за віком і схильністю до ризику концентруються навколо діагоналі з верхнього лівого кута в нижній правий. Серед молодих більшість готова ризикувати на ринку цінних паперів, у середній віковій групі готовий ризикувати один з п’яти, а половина не уявляє ризику без гарантій, у третій віковій групі на одного обережного припадають два неризикових.
Таблиця 7.8
Розподіл респондентів за віком і схильністю до ризику
Вік х, |
Тип інвестора у |
Разом | ||
років |
ризиковий |
обережний |
неризиковий |
|
16 — 30 |
24 |
12 |
4 |
40 |
31 — 50 |
20 |
50 |
30 |
100 |
51 і більше |
6 |
18 |
36 |
60 |
Разом |
50 |
80 |
70 |
200 |
Характер розподілу частот свідчить про наявність стохастичного зв’язку між віком і схильністю до ризику.
Оцінка щільності стохастичного зв’язку грунтується на відхиленнях частот (часток) умовного та безумовного розподілів, тобто на відхиленнях фактичних частот від теоретичних, пропорційних до підсумкових:
,
де — підсумкові частоти за ознакою;— підсумкові частоти за ознакою;— обсяг сукупності
Якби схильність до ризику не залежала від віку, то кількість ризикових серед молоді становила б
обережних у другій віковій групі
неризикових у третій віковій групі
Абсолютну величину відхилень фактичних частот від пропорційниххарактеризує квадратична спряженістьПірсона:
.
За відсутності стохастичного зв’язку = 0. На основі розподілу ймовірностейперевіряється істотність зв’язку. Критичні значеннядля= 0,05 і числа ступенів свободинаведено в табл. 7.9. Так, длякритичне значенняФактичне значення
що значно перевищує критичне, а отже, з імовірністю 0,95 істотність зв’язку між віком і схильністю до ризику доведено.
Відносною мірою щільності стохастичного зв’язку слугують коефіцієнти взаємної спряженості(співзалежності). Найчастіше використовується формула Чупрова:
,
де — число груп за ознакою,— число груп за ознакою. Оскільки при незалежності ознакто іС = 0. При функціональному зв’язкуза умови, щоТому в разі, коли, зручніше користуватися формулою Крамера:
де — мінімальне число груп (або).
У нашому прикладі а тому наведені формули коефіцієнта взаємної спряженості тотожні:
,
що свідчить про помітний зв’язок.
Таблиця 7.9
Критичні значення
k |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
3,84 |
5,99 |
7,81 |
9,49 |
11,07 |
12,59 |
14,07 |
15,51 |
Якщо обидві взаємозв’язані ознаки альтернативні, тобто кількість груп , то за відсутності зв’язку добутки діагональних частот однакові:Саме на відхиленнях добутків частот грунтуються характеристики зв’язку:
,
.
У літературі зі статистики коефіцієнт для 4-клітинкової таблиці називаєтьсякоефіцієнтом контингенціїабоасоціації. Очевидно, що за змістом він ідентичний коефіцієнту взаємної спряженості, а зпов’язаний функціонально:.
За допомогою коефіцієнта контингенції оцінимо щільність зв’язку між шкідливою звичкою палити і хворобами легенів (табл. 7.10):
Таблиця 7.10