Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

big_doc_LKG

.pdf
Скачиваний:
17
Добавлен:
07.02.2016
Размер:
20.24 Mб
Скачать

248

Розділ 5

Тут підсумовування проводиться за кожним значенням випадкових величин, включаючи повторювані значення.

При значній кількості спостережень та їх упорядкуванні кореляційне поле розбивають на клітини, обмежені інтервальними значеннями ознак та . Тоді кореляційне поле буде містити певну кількість клітин, у кожну з яких потрапляє деяка кількість експериментальних точок (рис. 5.3).

Рис. 5.3. Групування статистичного матеріалу

Якщо матеріал спостережень розташувати на клітинах, отриманих в межах інтервалів по та інтервалів по , то математичні вирази для визначення коефіцієнта кореляції можна представити у більш зручному для практичних розрахунків вигляді:

;

;

(5.7)

;

; (5.8)

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 249

, (5.9)

де , – середини відповідних інтервалів по осях , .

Матеріал групують по інтервалах значень величин та , потім складають кореляційну таблицю (табл. 5.1), у якій також здійснюють розрахунок частот.

Таблиця 5.1 Кореляційна таблиця для визначення щільності зв’язку

Інтервал

 

 

Інтервали x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коефіцієнт кореляції можна визначити за такими формулами:

;

(5.10)

;

(5.11)

;

(5.12)

250

Розділ 5

. (5.13)

Коефіцієнт кореляції може приймати як додатні, так і від’ємні значення і змінюється в межах від –1 до +1.

При додатному маємо додатну кореляцію (із збільшенням збільшується ); при від`ємному має місце від’ємна кореляція (із збільшенням зменшується )

При прямолінійна кореляція відсутня; при або маємо прямолінійний функціональний зв`язок.

За значеннями оцінки коефіцієнта кореляції можна зробити висновки щодо щільності лінійного зв’язку між досліджуваними ознаками. Прийнята така градація:

– зв’язок відсутній;

– зв’язок слабкий;

– зв’язок середній;

– зв’язок сильний.

Розрахунок кореляційного відношення. Коефіцієнт кореляції характеризує тільки лінійну залежність змінних та , коли при зростанні значень однієї з них значення іншої лінійно спадають або

зростають.

У загальному випадку для визначення щільності зв’язку використовується показник кореляційного відношення . За основу визначення щільності зв’язку у цьому випадку береться загальний показник мінливості досліджуваної функції – її повна дисперсія

,

(5.14)

де – загальна дисперсія сукупності;

– дисперсія показника відносно емпіричної лінії регресії;

– дисперсія лінії регресії відносно генерального середнього

арифметичного .

При розрахунку значень цих дисперсій виходять із відомого положення: якщо ряд із спостережень включає груп спостережень,

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 251

то дисперсія всього ряду буде дорівнювати сумі внутрішньогрупової

і міжгрупової дисперсій.

Загальна дисперсія визначає середній квадрат відхилень (за орди-

натою) точок кореляційного поля від лінії

(рис. 5.3)

 

 

.

(5.15)

Дисперсія визначає середній квадрат відхилень точок кореляційного поля від емпіричної лінії

 

 

,

(5.16)

де

 

– середнє арифметичне значення

в i-му

 

 

інтервалі по осі .

 

Ця складова характеризує ступінь розсіяння змінної

навколо

групових середніх

, тобто описує вплив випадкових факторів на

результати спостереження або досліду, незалежних від .

 

Дисперсія

 

описує вплив досліджуваного фактора

на зміну

функції

і представляє середній квадрат відхилень емпірич-

ної лінії регресії від лінії

 

 

 

.

(5.17)

Емпіричне кореляційне відношення розраховують за формулою

. (5.18)

Величина змінюється в межах .

252

Розділ 5

Етап 3. Встановлення виду і аналіз кореляційного зв’язку.

При встановленні виду зв`язку слід виходити із рекомендацій, наведених у табл. 5.2.

Таблиця 5.2

Характеристика видів зв`язку

Значення

Вид зв’язку

 

відсутній

1

лінійний функціональний

0

1

нелінійний функціональний

0

<1

нелінійний кореляційний

 

 

строго лінійний кореляційний

 

 

 

 

< 1

лінійний кореляційний

 

 

 

Із табл. 5.2 виходить, що за допомогою кореляційного відношення можна виявити тільки нелінійність зв’язку між досліджуваними ознаками, але не можна отримати ніякої інформації щодо конкретного математичного вигляду функції , що описує залежність між фак- тором-аргументом і залежною змінною .

Аналіз включає перевірку значимості абсолютного значення коефіцієнта кореляції і кореляційного відношення , а також перевірку прийнятої гіпотези щодо лінійної форми кореляційного зв`язку.

Оцінка значимості коефіцієнта кореляції і кореля-

ційного відношення. Обчислене значення парного коефіцієнта кореляції характеризує оцінку відповідного істинного коефіцієнта кореляції для генеральної сукупності. Так як вихідна статистична інформація являє собою вибіркові дані, то необхідно перевірити значимість кореляційного зв’язку між випадковими величинами, тобто значимість відхилення коефіцієнта кореляції від нуля.

Оцінка значимості виявленого за частковою вибіркою кореляційного зв’язку здійснюється шляхом перевірки так званої нульової гі-

потези: якщо коефіцієнт кореляції за модулем більший за нуль, то між двома випадковими величинами існує зв’язок.

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 253

Підтвердження гіпотези означає, що обчислений за формулами (5.3), (5.10)–(5.13) вибірковий коефіцієнт кореляції є значимим.

Перевірку прийнятої гіпотези можна здійснити двома способами.

Перший спосіб. Перевірка здійснюється за t-критерієм Стьюдента. Значення обчислюється за формулою

. (5.19)

Величина порівнюється з табличними значеннями , визна-

ченим за розподілом Стьюдента у відповідності з прийнятим рівнем значимості (зазвичай ) і кількості ступенів вільності (додаток Д6).

Якщо , то отриманий коефіцієнт кореляції буде справед-

ливим для всієї генеральної сукупності.

Якщо , то у генеральній сукупності кореляції може не іс-

нувати, або зв’язок є нелінійним.

Другий спосіб. Гіпотеза перевіряється порівнянням вибіркового значення коефіцієнта кореляції з його критичним значенням , яке

являє собою -квантиль розподілу при . Кореляція між випадковими величинами вважається значимою, якщо . Критичні значення наведені у табл. 5.3.

Для кореляційного відношення перевірка нульової гіпотези : проти альтернативної гіпотези : виконується за допо-

могою статистики

 

 

 

,

(5.20)

де

– кількість інтервалів факторіальної ознаки ;

 

 

– загальна кількість спостережень результативної ознаки .

Отримане значення

порівнюється

з критичним

значенням -

критерію (додаток Д8) для вибраного рівня значимості

і кількості

ступенів вільності

та

.

 

Якщо

, то нульова гіпотеза відхиляється на рівні значимості .

254

Розділ 5

Таблиця 5.3 Критичні значення коефіцієнта кореляції відносно нуля

для рівня значимості

Кількість

Значення

Кількість

Значення

Кількість

Значення

ступенів

ступенів

ступенів

 

 

 

вільності

 

вільності

 

вільності

 

 

 

 

 

 

 

1

0,9877

18

0,3780

70

0,1950

2

9000

19

3690

80

1830

3

8050

20

3600

90

1730

4

7290

21

3520

100

1640

5

6690

22

3440

120

1500

6

6210

23

3370

150

1340

7

5820

24

3300

200

1160

8

5490

25

3230

150

1040

9

5210

26

3170

300

0950

10

4970

27

3110

350

0878

11

4760

28

3060

400

0822

12

4570

29

3010

500

0735

13

4410

30

2960

700

0621

14

4260

35

2750

1000

0520

15

4120

40

2570

1500

0424

16

4000

50

2310

2000

0368

17

3890

60

2119

 

 

 

 

 

 

 

 

Оцінка міри нелінійності кореляційного зв’язку. Цю процедуру виконують шляхом порівняння розрахованих емпіричного кореляційного відношення і лінійного коефіцієнта кореляції . При цьому обидва показники підносяться до квадрату і отримують назву коефіцієнта детермінації. За міру лінійності кореляційного зв’язку приймається різниця . Можливі два підходи до оцінки міри нелінійності.

При першому підході перевірка гіпотези : проти гіпотези : може бути виконана за допомогою статистики

. (5.21)

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 255

Ця статистика при справедливості нульової гіпотези має -розподіл з та ступенями вільності. Якщо , то на рівні значимості гіпотеза лінійності кореляційного зв’язку відхиляється.

При другому підході міра нелінійності визначається за умовою

. (5.22)

У випадку необхідно виміряти відхилення від лінійності. Це можна здійснити двома способами.

Перший спосіб. Цей спосіб полягає у порівняння різниці коефіцієнтів детермінації з деякою величиною параметра t, який визначається за формулою

. (5.23)

де t – коефіцієнт, за яким вимірюється відхилення від лінійності;

– коефіцієнт детермінації, розрахований за емпіричним кореляційним відношенням;

– коефіцієнт детермінації, розрахований за лінійним коефіцієнтом кореляції;

– похибка різниці між та . Величина визначається як

 

,

(5.24)

де

– коефіцієнт лінійності.

 

Якщо величина

то відмінність між емпіричною і теоретичною

формами зв’язку вважають несуттєвою і кореляційний зв`язок визна-

ють лінійним.

Другий спосіб. Критерій прямолінійності зв’язку можна побуду-

вати на співвідношенні між

та

 

 

,

(5.25)

256

Розділ 5

де 0,742 –

параметр, отриманий емпіричним шляхом;

n

обсяг статистичної вибірки;

 

 

– найменше з двох емпіричних кореляційних відношень

 

 

та

;

 

r

– лінійний коефіцієнт кореляції.

Якщо

значення обчисленого

, то кореляційний зв’язок

можна вважати лінійним.

Приклад 1. Одним із основних показників ефективності вантажопереробки на підприємстві є величина простою рухомого складу в системі. Значення цього показника у кожному конкретному випадку формується під впливом низки факторів: кількості вагонів, що надходять в систему; типу вагонів; класу вантажів; завантаження вагонів; нерівномірності прибуття; продуктивності вантажоперероблювальної техніки тощо.

Була сформульована гіпотеза відносно впливу на загальний простій Т (вагоно- години) вагонів в системі (результативна ознака ) частки вантажів , що прибувають в критих вагонах (ознака ). Статистичні дані наведені в табл. 5.4.

Необхідно встановити наявність і вид зв’язку між ознаками і оцінити його щільність.

Таблиця 5.4 Статистичні про простій вагонів у вантажоперероблювальній системі

№ п/п

, ваг.-год.

 

 

 

 

 

 

 

1

120

0,40

2

670

0,21

3

742

0,43

4

482

0,21

5

151

0,57

6

367

0,21

7

714

0,37

8

505

0,16

9

484

0,48

10

210

0,21

Розв’язок.

№ п/п

, ваг.-год.

 

 

 

 

 

 

 

11

396

0,58

12

498

0,35

13

651

0,13

14

420

0,38

15

815

0,12

16

413

0,13

17

493

0,12

18

567

0,15

19

860

0,10

20

422

0,22

1. Систематизація статистичного матеріалу. Для виконання цієї процедури використовуємо кореляційне поле (графічний спосіб систематизації) і кореляційну таблицю. Для побудови кореляційного поля увесь діапазон варіацій ознак розбиваємо на інтервалів і за формулою (5.1) визначаємо розміри інтервалів:

; .

Приймаємо , .

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 257

У системі координат (рис. 5.4) точками відмічаємо значення кожного спостереження і накреслюємо еліпс розсіяння.

y

 

 

 

 

 

 

 

800

 

 

 

 

 

 

700

 

 

 

 

 

 

600

 

 

 

 

 

 

500

 

 

 

 

 

 

400

 

 

 

 

 

 

300

 

 

 

 

 

 

200

 

 

 

 

 

 

100

 

 

 

 

 

 

0

0,0

0,1

0,2

0,3

0,4

0,5

x

 

 

Рис. 5.4. Поле кореляції і еліпс розсіяння

 

Складаємо кореляційну таблицю (табл. 5.5). За формою еліпса розсіяння і табл. 5.4 робимо висновок, що між досліджуваними ознаками існує зворотний кореляційний зв’язок.

 

 

 

 

 

 

Таблиця 5.5

 

 

Кореляційна таблиця

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

ваг.-год.

0–0,1

0,1–0,2

0,2–0,3

0,3–0,4

0,4–0,5

0,5–0,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 – 150

 

 

 

1

 

 

1

150 – 300

 

 

1

 

 

1

2

300 – 450

 

1

2

1

 

1

5

450 – 600

 

3

1

1

1

 

6

600 – 750

 

1

1

1

1

 

4

750 – 900

1

1

 

 

 

 

2

 

1

6

5

4

2

2

20

 

 

 

 

 

 

 

 

2. Кількісна оцінка щільності зв’язку. Оскільки вид зв’язку між змінними та невідомий, то необхідно обчислити за даними вибірки емпіричні значення коефі-

цієнта кореляції та кореляційного відношення.

Розрахунок коефіцієнта кореляції. Розрахунок виконуємо за формулою (5.13).

Складові формули обчислюємо окремо в табл. 5.6.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]