Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ІАД / Лекція 6.doc
Скачиваний:
21
Добавлен:
05.02.2016
Размер:
137.73 Кб
Скачать

9

Лекція 6

Ми говоримо, що завданням кореляційного аналізу є вивчення взаємозв’язків та причинних залежностей явищ.

Факторні та результативні ознаки: ознака, що характеризує наслідок - результативна ознака, що характеризує фактор – факторна ознака (фактор - вхідна незалежна змінна, яка може приймати визначені значення в деякому інтервалі часу)- приклад вага – факторна ознака, маса тіла – результативна ознака.

Види зв’язків явищ

  1. За характером залежності – функціональні та кореляційні

  2. За напрямком – прямий, коли залежна змінна збільшується зі збільшенням факторної ознаки, та зворотнім, коли зростання факторної ознаки спричиняє зменшення результату.

  3. За аналітичною формою – лінійні і нелінійні. В першому випадку між ознаками проявляються в середньому лінійні співвідношення. В другому випадку змінні пов’язані нелінійно.

  4. За кількістю факторів, що розглядаються розрізняють парний, якщо характеризується зв’язок двох ознак і множинний або багатофакторний, якщо вивчаються більше ніж 2 змінні.

  5. За силою, ця характеристика виражається конкретними числами.

Для кількісної оцінки щільності зв’язку використовують коефіцієнт кореляції.

Коефіцієнт кореляції симетричний

•  Приймає значения в діапазоні від -1 до +1

•  Безрозмірна величина

•  Показує силу зв’язку між признаками

•  Знак коефіцієнту говорить про напрям зв’язку.

Чим ближчий зв’язок між ознаками, тим ближча величини коефіцієнта кореляції до 1. Якщо r= ± 1, то кореляційний зв’язок переходить в функціональний, тобто кожній ознаці принака Х буде відповідати одна або декілька строго визначених значень признака У.

Сила кореляційного зв’язку за абсолютним значенням коефіцієнта кореляції (шкала Чеддока).

  • сильний ±0,7 до ±1

  • середній: ±0,5 до ±0,7

  • слабкий: ±0.2 до ±0,5

дуже слабкий ±0 до ±0.2

Тільки по величині коефіцієнта кореляції не можна судити про достовірність кореляційного зв’язку. Цей параметр залежить від числа степеней волі k = n – 2, (n- об’єм вибірки). Кількість степеней волі — це кількість значень в обчисленні статистики, які здатні варьюватись. Чим більше n, тим вища достовірність зв’язку при одному й тому ж значення коефіцієнта кореляції.

Парна кореляція – це зв’язок між двома показниками, один з яких є факторний, інший – результативний.

Методи визначення коефіцієнта кореляції: метод квадратів (метод Пірсона) та ранговий метод (метод Спірмена).

1).Коефіцієнт кореляції Браве-Пірсона

Для того, чтобы эта сумма не зависела от количества значений X и Y, ее следует поделить ее на N-1.

В Ех функція ПИРСОН() і КОРЕЛ().

Для исключения влияния стандартных отклонений на величину связи, следует поделить ковариацию sXY на стандартные отклонения sX  и  sY:

Отже, вибірковий коефіцієнт кореляції можна порахувати за формулою

Оцінка значимості параметрів взаємозв’язку

Коли отримані оцінки кореляції необхідно перевірити їх на відповідність істинним параметрам взаємозв’язку.

1 спосіб. Для оцінки значимості коефіцієнта парної кореляції розраховують стандартну помилку коефіцієнта кореляції:

.

,

де tрозр – так зване розрахункове значення t-критерію.

Якщо tрозр більше теоретичного (табличного) значення критерію Стьюдента (tтабл) для заданого рівня ймовірності та (п-2) ступенів свободи, то можна стверджувати, що значимий.

2 спосіб. Перевірка достовірності виявленої зв'язку здійснюється порівнянням і (з таблиці “стандартні коефіцієнти кореляції”). На підставі того, що > , наявність виявленого зв'язку вважається достовірним, а того, що < , наявність виявленого зв'язку вважається недостовірним.

За коефіцієнтом кореляції легко визначити коефіцієнт детермінації R, що обчислюється за формулою:

%. (показує ступінь взаємного впливу факторної і результативної ознаки).

Наприклад, якщо коефіцієнт детермінації=60% то це означає, що 60% варіації спричинено їх взаємним впливом, і інші 40% варіації – вплив інших неврахованих факторів.

Рангова кореляція — метод кореляційного аналізу, який використовується для сукупностей невеликого обсягу і для кількісних ознак, якщо їхня сукупність не має нормального розподілу.

Завдання: методом рангів встановити напрям і силу зв'язку між стажем роботи в роках і частотою травм, якщо отримані наступні дані:

Стаж работы в годах

Число травм на 100 работающих

до 1 года 1-2 3-4 5-6 7 и более

24 16 12 12 6

Обгрунтування вибору методу: для вирішення задачі може бути вибраний тільки метод рангової кореляції, тому перший ряд ознаки "стаж роботи в роках" має відкриті варіанти (стаж роботи до 1 року і 7 і більше років), що не дозволяє використовувати для встановлення зв'язку між порівнюваними ознаками більш точний метод - метод квадратів.

Рішення. Послідовність розрахунків викладена в тексті, результати представлені в табл. 2.

Таблиця 2

Стаж работы в годах

Xi

Число травм

Yi

Порядковые номера (ранги)

Разность рангов

Квадрат разности рангов

DX

DY

DX-DY

(DX-DY) 2

До 1 года

24

1

5

-4

16

1-2

16

2

4

-2

4

3-4

12

3

2,5

+0,5

0,25

5-6

12

4

2,5

+1,5

2,25

7 и более

6

5

1

+4

16

 

Σ = 38,5

Коли оцінюється тіснота зв’язку між результативною Y та двома факторними ознаками X1, X2, то множинний коефіцієнт кореляції можна визначити за формулою:

де r – парні коефіцієнти кореляції між ознаками.

Множинний коефіцієнт кореляції змінюється в межах від 0 до 1 і є позитивною величиною: 0<R<1:

Важливою задачею статистики є розробка методики статистичної оцінки соціальних явищ, яка ускладнюється тим, що багато соціальних явищ не мають кількісної оцінки.

Для визначення щільності зв’язку двох якісних ознак, кожний з яких складається лише з двох груп, застосовують коефіцієнти асоціації та контингенції.

Для їх обчислення будують таблицю, яка показує зв’язок між двома явищами, кожне х яких повинне бути альтернативним, тобто складатися з двох якісно відмінних один від іншого значень ознаки (наприклад, хороший, поганий).

Таблиця для обчислення коефіцієнтів асоціації та контингенції

a

b

a+b

c

d

c+d

a+c

b+d

a+b+c+d

Коефіцієнт асоціації: .

Коефіцієнт контингенції: .

Коефіцієнт контингенції завжди менший коефіцієнта асоціації. Звיязок вважається підтвердженим, якщо Ка > 0,5, або Кк > 0,3.

Приклад. Досліджувалась характеристика випадкових споживачів наркотиків в залежності від їх сімейного стану в одному з регіонів Росії (тис. чол.).

Групи споживачів наркотиків

Сімейний стан

Всього

жонатий (заміжня)

нежонатий (незаміжня)

Споживав

Не споживав

10,0

2,5

14,5

4,5

24,5

7,0

Разом

12,5

19,0

31,5

Таким чином, споживання наркотиків не залежить від сімейного стану випадкових споживачів.

Коли кожна з якісних ознак складається більше ніж з двох груп, то для визначення щільності зв’язку можливе застосування коефіцієнтів взаємного сполучення Пірсона та Чупрова:

де - показник взаємного сполучення, визначається як сума відношень квадратів частот кожної клітки таблиці пху до добутку підсумкових частот відповідного стовпчика пу та строки пх мінус одиниця;

;

К1 – число значень (груп) першої ознаки;

К2 – число значень (груп) другої ознаки.

Чим більш наближені величини показників КП та КЧ до 1, тим тісніше зв’язок між показниками.

Приклад. Досліджувалась залежність між оцінкою рівня життя респондентів Москви та типом підприємства, на якому вони працюють

Тип підприємства

Оцінка рівня життя

Всього

цілком задовільний

скоріше задовільний

скоріше не задовільний

зовсім не задовільний

державне

акціонерне

орендне

приватне

31

17

4

8

35

13

2

5

35

14

1

4

35

9

1

3

136

53

8

20

Разом

60

55

54

48

217

;

;

.

Таким чином, оцінка рівня життя респондентів не залежить від типа підприємства, на якому вони працюють.

Соседние файлы в папке ІАД