Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

big_doc_LKG

.pdf
Скачиваний:
17
Добавлен:
07.02.2016
Размер:
20.24 Mб
Скачать

258

Розділ 5

Таблиця 5.6 Розрахунок даних для визначення парного коефіцієнта кореляції

,

п/п ваг.-год.

1

120

0,40

0,12

0,0144

–379

143641

–45,00

2

670

0,21

–0,07

0,0049

171

29241

–11,97

3

742

0,43

0,15

0,0225

243

59049

36,45

4

482

0,21

–0,07

0,0049

–17

289

1,19

5

151

0,57

0,29

0,0845

–348

121104

–100,92

6

367

0,21

–0,07

0,0049

–132

17424

9,24

7

714

0,37

0,09

0,0081

215

46225

19,32

8

505

0,16

–0,12

0,0144

6

36

–0,72

9

484

0,48

0,2

0,0400

–15

225

–3,00

10

210

0,21

–0,07

0,0049

–289

63521

20,23

11

396

0,58

0,30

0,0900

–103

10609

–30,90

12

498

0,35

0,07

0,0045

–1

1

–0,07

13

651

0,13

–0,15

0,0225

152

23104

–22,80

14

420

0,38

0,10

0,0100

–79

6241

–7,90

15

815

0,12

–0,16

0,0256

316

99856

–50,56

16

413

0,13

0,15

0,0225

–86

7396

12,90

17

493

0,12

–0,16

0,0226

6

36

–0,96

18

567

0,15

–0,13

0,0169

68

4624

–8,84

19

860

0,10

–0,18

0,0324

361

130321

–64,98

20

422

0,22

–0,06

0,0036

–77

5929

4,62

 

 

 

 

 

 

 

 

 

9980

5,53

 

0,4567

 

768872

–244,67

Згідно з табл. 5.6 маємо:

 

 

 

 

 

 

;

 

;

 

 

.

Розрахунок кореляційного відношення. Всі розрахунки виконуємо в кореляційній таблиці (табл. 5.7), яка доповнюється рядками обчислень статистичних характеристик.

Для спрощення цих обчислень здійснюємо заміну змінних з переносом системи координат в точку і за формулами:

;

.

Таблиця 5.7

Кореляційна таблиця для обчислення кореляційного відношення

 

 

 

 

 

Інтервали

 

 

 

 

 

Інтервали

Середини

Кодовані

0–0,1

0,1–0,2

0,2–0,3

0,3–0,4

0,4–0,5

0,5–0,6

 

 

 

 

Середина інтервалів

 

 

 

 

 

 

інтервалів

значення

 

 

 

 

 

 

 

0,05

0,15

0,25

0,35

0,45

0,55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кодовані значення

 

 

 

 

 

 

 

 

–3

–2

–1

0

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0–150

75

–3

 

 

 

1

 

 

1

–3

9

 

 

 

 

 

 

 

 

 

 

 

 

150–300

225

–2

 

 

1

 

 

1

2

–4

8

 

 

 

 

 

 

 

 

 

 

 

 

300–450

375

–1

 

 

2

1

 

1

5

–5

5

 

 

 

 

 

 

 

 

 

 

 

 

450–600

525

0

 

3

1

1

1

 

6

0

0

 

 

 

 

 

 

 

 

 

 

 

 

600–750

675

1

 

1

1

1

1

 

4

4

4

 

 

 

 

 

 

 

 

 

 

 

 

750–900

825

2

1

1

 

 

 

 

2

–4

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сума по стовпцях

 

 

 

 

 

 

 

20

–4

34

 

 

 

 

 

 

 

 

 

 

 

 

1.

 

 

1

6

5

4

2

2

20

 

 

2.

 

 

2

0,33

–0,6

–0,75

1,5

–1,5

0,98

Сума по рядках

3.

 

 

4

0,65

1,8

2,25

4,5

4,5

17,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

260

Розділ 5

За даними табл. 5.7 запишемо:

;

.

.

Емпіричне кореляційне відношення дорівнює

.

Оцінка міри нелінійності кореляційного зв’язку. Результати попередніх розра-

хунків не дають чіткої уяви щодо форми кореляційного зв’язку. Тому у подальшому визначаємо міру відхилення від прямолінійного зв’язку.

З методологічних міркувань оцінку виконаємо декількома методами. При використанні статистики (5.21) маємо:

.

У додатку Д8 значень критерію на рівні значимості та кількості ступе-

нів вільності

та

знаходимо критичне значення

. Так як , то при обраному рівні значимості гіпотеза про лінійність кореляційного зв’язку підтверджується.

За умовою (5.22) обчислюємо різницю

.

Так як , то правомірність лінійності зв’язку слід підтвердити аналізом міри відхилення від лінійності. Аналіз виконуємо двома способами.

Перший спосіб. За формулою (5.24) обчислюємо похибку різниці

.

Розраховуємо параметр за формулою (5.23)

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 261

.

Так як , то кореляційний зв’язок можна вважати лінійним. Другий спосіб. За формулою (5.25) розраховуємо критерій лінійності

.

Так як значення , то гіпотеза про лінійність зв`язку підтверджується. Таким чином, остаточно приходимо до висновку, що кореляційний зв’язок між

досліджуваними ознаками можна вважати лінійним.

3. Перевірка надійності коефіцієнта кореляції. Перевірку виконаємо двома способами.

Перший спосіб. Обчислюємо значення t-критерію за формулою (5.19)

.

Для рівня значимості і кількості ступенів вільності за додатком Д6 визначаємо табличне значення t-критерію .

Так як , то отриманий коефіцієнт кореляції вважається незначимим і не може бути розповсюджений на всю генеральну сукупність.

Другий спосіб. За даними табл. 5.3 для кількості ступенів вільності визначаємо критичне значення . Так як , то на рівні значимості гіпотезу про наявність кореляційної залежності між величинами та слід відкинути.

4. Перевірка надійності кореляційного відношення. Маємо: кількість роз-

рядів ознаки ; загальна кількість спостережень . Обчислюємо за формулою (5.20) статистику

.

У додатку Д8 для і кількості ступенів вільності , знаходимо критичне значення .

Так як , то на рівні значимості гіпотезу про суттєвість нелінійного зв’язку слід відхилити.

262

Розділ 5

5.3.Множинний кореляційний аналіз

5.3.1.Аналіз статистичних даних з однорідними ознаками. Якщо система включає більше двох випадкових величин, виникають різні рівні кореляції. Для визначення і оцінки багатофакторного статистичного зв’язку вживаються три типи парних коефіцієнтів кореляції:

1) парний коефіцієнт кореляції між результативною ознакою і одним із факторів .

2)парний коефіцієнт кореляції між факторами та : ;

3)частинний коефіцієнт кореляції між результативною ознакою

іодним із факторів, відокремленим від інших: .

Оцінка кореляційного зв’язку виконується за такою схемою.

Побудова і аналіз первинної матриці коефіцієнтів кореля-

ції. Для побудови матриці за формулами (5.10)–(5.13) обчислюємо два типи парних коефіцієнтів кореляції:

1)коефіцієнти , що визначають щільність зв’язку між результативною ознакою і одним із факторів ;

2)коефіцієнти , які показують щільність зв’язку між фактора-

ми і (). При цьому в формулах (5.10)–(5.13) ознака замінюється на ознаку .

Фактор, у якого коефіцієнт кореляції , вважається не-

суттєвим і з подальшого розгляду може бути виключений.

Якщо один із коефіцієнтів буде дорівнювати 1, то це означає, що фактори і функціонально (не імовірнісно) пов’язані між собою і тоді доцільно один із них виключати із подальшого розгляду, причому залишають фактор з більшим значенням коефіцієнту кореляції .

Після обчислення всіх парних коефіцієнтів кореляції і виключення із розгляду того чи іншого фактора можна побудувати первинну квадратну симетричну матрицю коефіцієнтів кореляції (табл. 5.8).

Виявлення наявності мультиколінеарності між фактора-

ми. Наявність мультиколінеарності можна визначати двома способами.

Перший спосіб. Апріорі колінеарними вважають такі фактори та , для яких виконується умова . У цьому випадку один із факторів виключається із розгляду, причому залишають фактор,

який має більш тісний зв’язок з результативною ознакою.

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 263

Таблиця 5.8

Первинна кореляційна матриця

1

1

rx x

rx x

rx x

p

rx y

 

2 3

2

i

2

2

 

1

 

 

 

 

 

 

 

1

 

 

 

 

1

Другий спосіб. Наявність мультиколінеарності встановлюють на підставі F-критерію. Для цього первинна кореляційна матриця (табл. 5.8) перетворюється на обернену матрицю

. (5.26)

Для кожного фактора розраховують значення за формулою

 

, (

),

(5.27)

де

– діагональний елемент оберненої матриці.

 

 

Обчислене значення порівнюється з табличними значеннями роз-

поділу Фішера (додаток Д8) для кількості ступенів вільності

і

 

та рівнів значимості

та

.

 

Якщо

, то при 5% рівні значимості приймаємо гіпотезу

про відсутність мультиколінеарності

і-го аргумента-фактора з реш-

тою в генеральній сукупності. Якщо

 

, то при 1%-му рівні

264

Розділ 5

значимості відхиляємо гіпотезу відсутності мультиколінеарності і-го аргумента-фактора з рештою в генеральній сукупності. У цьому випадку включення і-го аргумента-фактора в загальну модель вважається неприпустимим. Висновки про виключення аргумента-фактора супроводжуються економічним аналізом.

Залишивши в сукупності тільки не мультиколінеарні фактори, складаємо нову кореляційну матрицю (табл. 5.8), обернену їй (5.26) і повторюємо перевірку за допомогою (5.27) до повного «очищення» від мультиколінеарності. Після цього складається остаточна (скоригована) матриця парних коефіцієнтів кореляції.

Визначення ступеня впливу на результативний показник кожного фактора окремо. Для цього використовується частинний коефіцієнт кореляції, який відображає «чистий» вплив тільки одного і-го фактора на результативний показник при виключенні із розгляду інших факторів.

При множинній залежності показника від двох факторів та , коефіцієнти частинної кореляції розраховується за формулами:

– між змінними та при виключенні із розгляду

; (5.28)

– між змінними та при виключені із розгляду

. (5.29)

Для залежності, яка включає три і більше факторів, звязок` між () і результативною ознакою характеризується частин-

ними коефіцієнтами кореляції більш високого рівня. У випадку трьох факторів розглядаються частинні коефіцієнти кореляції другого порядку

, , . Так, визначається за формулою

. (5.30)

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 265

Цей коефіцієнт кореляції характеризує звязок` між та за умови, що спочатку фіксували (виключали) фактор а не . При іншому порядку фіксування буде отриманий частинний коефіцієнт кореляції , який може не дорівнювати .

Для інших коефіцієнтів кореляції маємо:

; (5.31)

. (5.32)

У загальному випадку з р факторами коефіцієнт кореляції можна визначити за формулами:

; (5.33)

або

 

 

 

,

(5.34)

де

– визначник матриці, утворений із матриці коефіцієнтів

кореляції викреслюванням першого рядка і k-го стовпця для кожного визначника відповідно;

– визначник тієї ж самої матриці з викресленими першим рядком і першим стовпцем, тобто визначник матриці парних коефіцієнтів кореляції між факторами;

– визначник матриці з викресленими k-м рядком i k-м стовпцем.

Результати розрахунків представляють у вигляді вектора

,

де , , , – частинні коефіцієнти кореляції.

266

Розділ 5

Гіпотеза : для коефіцієнта кореляції перевіряється за допомогою статистики

 

 

,

(5.35)

де – кількість факторів.

 

 

При справедливості нульової гіпотези

величина

розподілена за

розподілом Стьюдента з

ступенями вільності (додаток Д6).

У випадку

нульова гіпотеза

відхиляється на рівні

значимості .

Як і парні коефіцієнти кореляції, частинні коефіцієнті кореляції змінюються від –1 до +1.

Оцінка щільності зв’язку. Кількісно щільність зв’язку при множинній кореляції можна оцінити за допомогою множинного (сукупного) коефіцієнта кореляції, який визначається за формулою

,

(5.36)

де – визначник матриці парних коефіцієнтів кореляції. У випадку залежності від двох факторів

. (5.37)

Коефіцієнт множинної кореляції змінюється у межах від 0 до 1. При спостерігається функціональний зв’язок. При кореляційний зв’язок між функцією і аргументом відсутній. Чим ближчий до одиниці, тим зв’язок щільніший.

Значимість коефіцієнта множинної кореляції можна перевірити декількома способами.

За критерієм Стьюдента

,

(5.38)

де – стандартна похибка коефіцієнта множинної кореляції.

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 267

Величина обчислюється за формулою

. (5.39)

За критерієм Фішера. Для цього обчислюють статистику

. (5.40)

Отримане значення порівнюють з табличним на вибраному рівні значимості (зазвичай ) і кількостях ступенів вільності і . Якщо розрахункове значення перевищує табличне, то зв’язок вважають статистично значимим.

Шляхом порівняння з критичним значенням коефіцієнта множинної кореляції. Якщо ,

то кореляція вважається значимою. Критичні значення

наведені у табл. 5.9.

Таблиця 5.9

Критичні значення коефіцієнтів множинної кореляції на рівні значимості ( – кількість змінних, – обсяг вибірки)

 

 

 

 

 

 

3

4

5

6

 

 

 

 

 

1

0,999

0,999

0,999

1,00

2

0,975

0,983

0,987

0,990

3

0,930

0,950

0,961

0,968

4

0,881

0,912

0,930

0,942

5

0,836

0,874

0,898

0,914

6

0,795

0,839

0,867

0,886

7

0,758

0,807

0,838

0,860

8

0,726

0,777

0,811

0,835

9

0,697

0,750

0,786

0,812

10

0,671

0,726

0,763

0,790

11

0,648

0,703

0,741

0,770

12

0,627

0,683

0,722

0,751

13

0,608

0,664

0,703

0,733

14

0,590

0,646

0,686

0,717

 

 

 

 

 

 

3

4

5

6

15

 

 

 

 

0,574

0,630

0,670

0,701

16

0,559

0,615

0,655

0,687

17

0,545

0,601

0,641

0,673

18

0,532

0,587

0,628

0,660

19

0,520

0,575

0,615

0,647

20

0,509

0,563

0,604

0,636

22

0,488

0,542

0,582

0,594

24

0,470

0,523

0,562

0,594

26

0,454

0,506

0,545

0,576

28

0,439

0,490

0,529

0,570

30

0,425

0,476

0,514

0,545

40

0,373

0,419

0,455

0,484

60

0,308

0,348

0,380

0,406

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]