big_doc_LKG
.pdfОцінка стохастичних зв’язків між вхідними та вихідними ознаками 269
За допомогою кнопок ONE VARIABLE LIST та TWO LISTS задаються змінні для двох типів кореляційних матриць: квадратної та прямокутної. Після вибору змінних та натискання кнопки ОК на екрані з’являються результати розрахунку – матриця коефіцієнтів кореляції між змінними (у нашому прикладі прямокутна кореляційна матриця між двома списками змінних: x1– x5 та x6 – x10 ), як показано на рис. 5.7.
Рис. 7.7. Прямокутна кореляційна матриця
У кореляційній матриці червоним кольором автоматично виділяються коефіцієнти кореляції, які значимі на рівні . Саме на ці коефіцієнти слід звернути особливу увагу. Змінити рівень значимості можна за допомогою кнопки OPTIONS, розташованої під головним меню.
Кнопка 2D SCATTERP. дозволяє побудувати поле кореляції та графік парної лінійної регресії з 95% довірчими інтервалами між двома обраними змінними.
Вибір опції DETAILED TABLE OF RESULTS призводить до виведення в результатах розрахунку більш докладної інформації, зокрема: математичних очікувань та стандартних відхилень для всіх пар змінних, значення коефіцієнтів кореляції та детермінації, значення t-критерію, обсяги вибірок, коефіцієнти рівняння лінійної регресії між кожною парою змінних.
Кнопка MATRIX дає можливість отримати дуже зручне графічне представлення кореляційної матриці (рис. 5.8). У випадку квадратної кореляційної матриці по головній діагоналі будуть показані ескізи гістограми розподілу відповідних змінних. Це дає можливість швидко візуально оцінити, підлягають вони нормальному (чи іншим) закону розподілу чи ні.
|
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками |
271 |
||||||||||
|
|
|
|
|
|
|
|
|
Таблиця 5.10 |
|||
|
|
|
|
Вихідні дані (приклад 2) |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Номер |
|
|
|
|
Номер |
|
|
|
|
|
|
|
спосте- |
|
|
|
|
спосте- |
|
|
|
|
|
|
|
реження |
|
|
|
|
реження |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2,6 |
3 |
10 |
2,7 |
11 |
3,9 |
3 |
5 |
|
4,0 |
|
2 |
4,7 |
7 |
3 |
4,0 |
12 |
5,2 |
3 |
3 |
|
5,3 |
|
|
3 |
3,2 |
3 |
10 |
3,6 |
13 |
8,4 |
3 |
5 |
|
6,3 |
|
|
4 |
7,2 |
7 |
3 |
6,1 |
14 |
6,8 |
6 |
7 |
|
5,6 |
|
|
5 |
6,2 |
2 |
5 |
3,5 |
15 |
3,5 |
2 |
4 |
|
5,6 |
|
|
6 |
5,3 |
3 |
7 |
4,3 |
16 |
1,0 |
8 |
10 |
|
3,6 |
|
|
7 |
3,2 |
7 |
10 |
4,1 |
17 |
4,0 |
7 |
7 |
|
4,2 |
|
|
8 |
4,6 |
7 |
2 |
5,8 |
18 |
3,8 |
3 |
10 |
|
2,8 |
|
|
9 |
4,3 |
4 |
3 |
4,0 |
19 |
4,5 |
2 |
10 |
|
2,8 |
|
|
10 |
7,9 |
7 |
6 |
6,4 |
20 |
4,2 |
7 |
7 |
|
4,0 |
|
Розв’язок.
1. Попереднє опрацювання вихідних даних.
Обчислення статистичних характеристик виконуємо за допомогою ЕОМ у модулі BASIC STATISTICS/TABLES статистичного пакету STATISTICA. Результати обчислень наведені у табл. 5.11.
Таблиця 5.11 Основні статистичні характеристики досліджуваних ознак
Ознака |
Середнє вибіркове |
Стандартне |
Коефіцієнт |
|
відхилення |
варіації |
|||
|
|
|||
|
|
|
|
|
|
4,725 |
1,787 |
0,378 |
|
|
4,700 |
2,203 |
0,460 |
|
|
6,350 |
2,870 |
0,450 |
|
|
4,435 |
1,192 |
0,260 |
2. Перевірка на нормальність розподілу результативної ознаки .
Так як , то перевірку виконуємо за допомогою спеціального критерію розмаху варіювання (1.31). Для цього обчислюємо:
– величину розмаху |
|
|
|
|
|
|
|
; |
|
– статистику |
|
|
|
|
|
|
|
. |
|
Із табл. 1.13 для |
|
і рівня значимості |
визначаємо критичні грани- |
|
ці критерію |
, |
. |
|
|
Так як |
|
, |
то результативна ознака |
має нор- |
мальний розподіл. |
|
|
|
|
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 273
Необхідно проаналізувати ступінь впливу статичного коефіцієнта використання вантажопідйомності і типів автомобілів на середній виробіток одного автомобіля.
Розв’язок. Для вирішення поставленої задачі проведемо кореляційний аналіз і визначимо для кожної групи статичного коефіцієнта використання вантажопідйомності (, , ) відповідний коефіцієнт кореляції.
Характерною особливістю представленого статистичного комплексу є те, що в ньому одній із змінних (група ) відповідає декілька значень іншої змінної. У цьому випадку для обчислення коефіцієнта кореляції і аналізу даних статистичного комплексу зручно користуватися формулою
, |
(5.41) |
де – умовні групи випадкових змінних, яким присвоюються номери 0, 1, 2, ..., ;
– сума значень у даній клітинці комплексу;
– кількість значень у клітинці;
; |
, |
де – кількість спостережень у -й групі статистичного комплексу.
Для обчислення коефіцієнтів кореляції складаємо відповідні допоміжні таблиці
(табл. 5.14, 5.15, 5.16).
|
|
|
|
|
|
|
|
Таблиця 5.14 |
|
|
|
Нижча група завантаження ( |
|
) |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
0 |
0 |
|
30,8 |
11 |
|
0 |
0 |
|
0 |
1 |
1 |
|
11,0 |
11 |
|
11 |
11 |
|
11 |
2 |
4 |
|
13,4 |
11 |
|
22 |
44 |
|
26,8 |
|
|
55,2 |
33 |
|
33 |
55 |
37,8 |
||
|
|
|
|
; |
|
|
|
; |
|
|
|
|
|
; |
|
|
. |
|
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 275
5.3.4. Статистична оцінка зв’язку між якісними і кількісними ознаками. Поряд з кількісними ознаками у транспортних системах доводиться мати справу з якісними ознаками, які або зовсім не піддаються вимірюванню, або їх кількісна міра не потрібна. До таких ознак, наприклад, відносяться:
номенклатурний склад транспортних партій вантажів;
види вантажів;
типи транспортних засобів і засобів механізації вантажних робіт;
технології вантажопереробки;
рівень механізації, автоматизації і інформаційного забезпечення;
кваліфікаційний склад обслуговуючого персоналу;
типи універсального технологічного обладнання;
вимоги стандартизації і уніфікації обладнання тощо.
Випадкова величина результативної характеристики транспортнотехнологічного процесу змінюється в залежності від деяких ознак (факторів). При спостереженні досліджуваної величини фіксують дві якісні ознаки – наявність або відсутність ознаки. Результати спостережень цих ознак представляються у вигляді таблиці спряженості ознак. Необхідно встановити, чи існує зв’язок між цими ознаками, або, інакше кажучи, чи має зв’язок дія однієї ознаки з дією іншої ознаки.
Розглянемо методи оцінки зв’язку між якісними ознаками.
1. Оцінка зв’язку між двома ознаками. При дослідженні зв’язку між двома ознаками А та В таблиця спряженості називається таблицею 2 2, або чотирикомпонентною таблицею і має вигляд
В |
|
А |
|
– |
|
+ |
|
|
|
||
|
|
|
|
– |
|
|
|
+ |
|
|
|
Величини у таблиці спряженості означають:
– кількість елементів вибірки (відносні частоти), в яких відсутні обидві ознаки А та В;
– кількість елементів вибірки (відносні частоти), в яких присутня ознака А та відсутня ознака В;
– кількість елементів вибірки (відносні частоти), в яких присутня ознака В та відсутня ознака А;
Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 277
2. Оцінка зв’язку в статистичних комплексах з багатьма ознаками. Якщо результати спостережень можуть бути класифіковані за трьома і більше якісними ознаками, розглядаються таблиці спряженості (табл. 5.18).
Таблиця 5.18
Форма таблиці спряженості
В |
|
А |
|
||
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У цій таблиці – кількість результатів спостережень із загальної кількості , які мають -ту та -ту ознаки одночасно.
Для оцінки наявності зв’язку між ознаками та (або між та з градаціями двох ознак А та В) використовується статистика
. (5.47)
Ця статистика для незалежних ознак має -розподіл з ступенями вільності. Якщо на прийнятому рівні значимості , то слід визнати наявність зв’язку між досліджуваними ознаками. Кількісна оцінка зв’язку здійснюється за допомогою
коефіцієнта спряженості
. (5.48)
Коефіцієнт дорівнює 1 у випадку повного зв’язку при .