Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

big_doc_LKG

.pdf
Скачиваний:
17
Добавлен:
07.02.2016
Размер:
20.24 Mб
Скачать

268

Розділ 5

Величину в формулах (5.39) і (5.40) називають множинним коефіцієнтом детермінації. Вона показує, яка частина дисперсії результативної функції пояснюється варіацією лінійної комбінації факторів , , , .

5.3.2. Розрахунок і аналіз кореляційної матриці на ЕОМ. В модулі

BASIC STATISTICS AND TABLES – ОСНОВНІ СТАТИСТИКИ ТА ТАБЛИЦІ па-

кету STATISTICA можна обчислити кореляційну матрицю вибраних змінних. Для цього необхідно вибрати у меню стартового вікна цього модуля

рядок CORRELATION MATRCES – КОРЕЛЯЦІЙНІ МАТРИЦІ (рис. 5.5).

Рис. 5.5. Вибір процедури розрахунку кореляційної матриці

Після цього на екрані з’являється вікно PEARSON PRODUCT

MOMENT CORRELATION – КОРЕЛЯЦІЯ ПІРСОНА (рис. 5.6).

Рис. 5.6. Початкове вікно діалогу Кореляційні матриці

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 269

За допомогою кнопок ONE VARIABLE LIST та TWO LISTS задаються змінні для двох типів кореляційних матриць: квадратної та прямокутної. Після вибору змінних та натискання кнопки ОК на екрані з’являються результати розрахунку – матриця коефіцієнтів кореляції між змінними (у нашому прикладі прямокутна кореляційна матриця між двома списками змінних: x1– x5 та x6 – x10 ), як показано на рис. 5.7.

Рис. 7.7. Прямокутна кореляційна матриця

У кореляційній матриці червоним кольором автоматично виділяються коефіцієнти кореляції, які значимі на рівні . Саме на ці коефіцієнти слід звернути особливу увагу. Змінити рівень значимості можна за допомогою кнопки OPTIONS, розташованої під головним меню.

Кнопка 2D SCATTERP. дозволяє побудувати поле кореляції та графік парної лінійної регресії з 95% довірчими інтервалами між двома обраними змінними.

Вибір опції DETAILED TABLE OF RESULTS призводить до виведення в результатах розрахунку більш докладної інформації, зокрема: математичних очікувань та стандартних відхилень для всіх пар змінних, значення коефіцієнтів кореляції та детермінації, значення t-критерію, обсяги вибірок, коефіцієнти рівняння лінійної регресії між кожною парою змінних.

Кнопка MATRIX дає можливість отримати дуже зручне графічне представлення кореляційної матриці (рис. 5.8). У випадку квадратної кореляційної матриці по головній діагоналі будуть показані ескізи гістограми розподілу відповідних змінних. Це дає можливість швидко візуально оцінити, підлягають вони нормальному (чи іншим) закону розподілу чи ні.

270

Розділ 5

Рис. 5.8. Графічне представлення кореляційної матриці

У інших клітинках показано графічно поле кореляції та графік лінійної регресії між відповідними змінними, що містяться у даному рядку та стовпці. Кути нахилу прямої дають можливість зробити висновок про прямий чи обернений зв'язок між змінними, а розташування точок даних відносно лінії регресії – про щільність зв’язку між відповідними змінними.

Приклад 2. За даними статистичних спостережень проаналізувати стохастичний зв’язок між тривалістю формування транспортної партії вантажів (, год.) і такими факторами:

– номенклатурний склад транспортної партії (кількість видів вантажних одиниць);

– загальна кількість вантажних одиниць у транспортній партії;

– середня маса вантажної одиниці, кг.

Дані статистичних спостережень наведені у табл. 5.10.

 

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками

271

 

 

 

 

 

 

 

 

 

Таблиця 5.10

 

 

 

 

Вихідні дані (приклад 2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер

 

 

 

 

Номер

 

 

 

 

 

 

 

спосте-

 

 

 

 

спосте-

 

 

 

 

 

 

 

реження

 

 

 

 

реження

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2,6

3

10

2,7

11

3,9

3

5

 

4,0

 

2

4,7

7

3

4,0

12

5,2

3

3

 

5,3

 

3

3,2

3

10

3,6

13

8,4

3

5

 

6,3

 

4

7,2

7

3

6,1

14

6,8

6

7

 

5,6

 

5

6,2

2

5

3,5

15

3,5

2

4

 

5,6

 

6

5,3

3

7

4,3

16

1,0

8

10

 

3,6

 

7

3,2

7

10

4,1

17

4,0

7

7

 

4,2

 

8

4,6

7

2

5,8

18

3,8

3

10

 

2,8

 

9

4,3

4

3

4,0

19

4,5

2

10

 

2,8

 

10

7,9

7

6

6,4

20

4,2

7

7

 

4,0

 

Розв’язок.

1. Попереднє опрацювання вихідних даних.

Обчислення статистичних характеристик виконуємо за допомогою ЕОМ у модулі BASIC STATISTICS/TABLES статистичного пакету STATISTICA. Результати обчислень наведені у табл. 5.11.

Таблиця 5.11 Основні статистичні характеристики досліджуваних ознак

Ознака

Середнє вибіркове

Стандартне

Коефіцієнт

відхилення

варіації

 

 

 

 

 

 

 

4,725

1,787

0,378

 

4,700

2,203

0,460

 

6,350

2,870

0,450

 

4,435

1,192

0,260

2. Перевірка на нормальність розподілу результативної ознаки .

Так як , то перевірку виконуємо за допомогою спеціального критерію розмаху варіювання (1.31). Для цього обчислюємо:

– величину розмаху

 

 

 

 

 

 

 

;

 

– статистику

 

 

 

 

 

 

 

.

 

Із табл. 1.13 для

 

і рівня значимості

визначаємо критичні грани-

ці критерію

,

.

 

 

Так як

 

,

то результативна ознака

має нор-

мальний розподіл.

 

 

 

 

272

Розділ 5

3. Побудова і аналіз кореляційної матриці (див. розділ 1.3).

Обчислена на ЕОМ матриця парних коефіцієнтів кореляції наведена у табл. 5.12.

 

 

 

Таблиця 5.12

Аналіз даних табл. 5.12 пока-

 

 

 

зує, що між результативною

Матриця парних коефіцієнтів кореляції

ознакою

і фактором

 

 

 

 

 

зв’язок практично відсутній.

 

 

 

 

 

 

 

 

 

 

Тобто, номенклатура вантажів

 

 

 

 

 

 

1

–0,038

–0,426

0,668

 

не впливає

на тривалість фор-

 

 

1

–0,103

0,383

 

 

мування транспортних партій.

 

 

 

1

–0,550

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

5.3.3. Аналіз статистичних даних з неоднорідними ознаками. При дослідженні реальних виробничих систем доволі часто доводиться аналізувати такі статистичні дані, які містять в собі низку неоднорідних ознак. Наприклад, різні види вантажів, типи автомобілів, трудомісткість вантажопереробки тощо). В процесі їх вивчення необхідно оцінити весь комплекс різнорідних ознак у цілому. Процедуру аналізу пояснимо на прикладі.

Приклад 3. Автомобільний парк транспортного підприємства нараховує три типи автомобілів (, , ). У табл. 5.13 наведені статистичні дані, які представляють середній годинний виробіток одного автомобіля різних типів для окремих груп статичного коефіцієнта використання вантажопідйомності автомобіля .

Таблиця 5.13

Вихідні дані (приклад 3)

0,2–0,4 (нижча група)

Типи автомобілів

2,3

0,8

0,1

2,3

0,6

0,1

2,3

0,5

0,5

2,2

2,6

10,2

2,7

0,8

0,8

2,7

1,1

0,7

2,8

1,1

0,2

2,8

0,9

0,2

2,6

1,1

0,1

3,4

0,7

0,4

3,7

0,8

0,2

30,8

 

 

11,0

13,4

11

11

11

0,5–0,7 (середня група)

Типи автомобілів

7,4

0,9

1,0

5,0

1,0

1,5

6,0

1,0

0,9

5,9

1,0

1,3

4,5

1,4

1,9

5,4

1,8

0,7

5,4

0,9

0,7

4,3

1,0

0,2

6,1

1,6

1,7

– –

50,0

10,6

9,9

9

9

9

0,8–1,0 (вища група)

Типи автомобілів

9,9

0,8

2,5

19,2

1,4

8,9

10,6

0,9

1,8

9,9

0,3

2,2

8,0

1,6

2,4

9,8

1,0

1,0

8,7

1,9

1,2

9,8

0,2

1,3

9,6

0,7

1,9

– –

95,5

9,8

18,2

9

9

9

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 273

Необхідно проаналізувати ступінь впливу статичного коефіцієнта використання вантажопідйомності і типів автомобілів на середній виробіток одного автомобіля.

Розв’язок. Для вирішення поставленої задачі проведемо кореляційний аналіз і визначимо для кожної групи статичного коефіцієнта використання вантажопідйомності (, , ) відповідний коефіцієнт кореляції.

Характерною особливістю представленого статистичного комплексу є те, що в ньому одній із змінних (група ) відповідає декілька значень іншої змінної. У цьому випадку для обчислення коефіцієнта кореляції і аналізу даних статистичного комплексу зручно користуватися формулою

,

(5.41)

де – умовні групи випадкових змінних, яким присвоюються номери 0, 1, 2, ..., ;

– сума значень у даній клітинці комплексу;

– кількість значень у клітинці;

;

,

де – кількість спостережень у -й групі статистичного комплексу.

Для обчислення коефіцієнтів кореляції складаємо відповідні допоміжні таблиці

(табл. 5.14, 5.15, 5.16).

 

 

 

 

 

 

 

 

Таблиця 5.14

 

 

Нижча група завантаження (

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

30,8

11

 

0

0

 

0

1

1

 

11,0

11

 

11

11

 

11

2

4

 

13,4

11

 

22

44

 

26,8

 

 

55,2

33

 

33

55

37,8

 

 

 

 

;

 

 

 

;

 

 

 

 

 

;

 

 

.

 

274

Розділ 5

Коефіцієнт кореляції дорівнює

 

 

 

 

 

.

Щільність зв’язку у процентах

 

 

 

%.

 

 

 

 

 

 

 

 

 

 

 

Таблиця 5.15

 

 

Середня група завантаження (

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

50,0

9

 

0

 

0

 

0

1

1

 

10,60

9

 

9

 

9

 

10,6

2

4

 

9,90

9

 

18

 

36

 

19,8

 

 

70,5

27

 

27

45

30,4

 

 

 

 

;

 

 

 

 

;

 

 

 

 

 

;

 

 

 

.

 

Коефіцієнт кореляції дорівнює

 

 

 

 

 

.

Щільність зв’язку у процентах

 

 

 

%.

 

 

 

 

 

 

 

 

 

 

 

Таблиця 5.16

 

 

Вища група завантаження (

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

95,5

9

 

0

 

0

 

0

1

1

 

9,8

9

 

9

 

9

 

9,8

2

4

 

18,2

9

 

18

 

36

 

36,4

 

 

123,5

27

 

27

45

46,2

 

 

 

 

;

 

 

 

 

;

 

 

 

 

 

;

 

 

 

.

 

Коефіцієнт кореляції дорівнює

 

 

 

 

 

.

Щільність зв’язку у процентах

 

 

 

%.

 

 

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 275

5.3.4. Статистична оцінка зв’язку між якісними і кількісними ознаками. Поряд з кількісними ознаками у транспортних системах доводиться мати справу з якісними ознаками, які або зовсім не піддаються вимірюванню, або їх кількісна міра не потрібна. До таких ознак, наприклад, відносяться:

номенклатурний склад транспортних партій вантажів;

види вантажів;

типи транспортних засобів і засобів механізації вантажних робіт;

технології вантажопереробки;

рівень механізації, автоматизації і інформаційного забезпечення;

кваліфікаційний склад обслуговуючого персоналу;

типи універсального технологічного обладнання;

вимоги стандартизації і уніфікації обладнання тощо.

Випадкова величина результативної характеристики транспортнотехнологічного процесу змінюється в залежності від деяких ознак (факторів). При спостереженні досліджуваної величини фіксують дві якісні ознаки – наявність або відсутність ознаки. Результати спостережень цих ознак представляються у вигляді таблиці спряженості ознак. Необхідно встановити, чи існує зв’язок між цими ознаками, або, інакше кажучи, чи має зв’язок дія однієї ознаки з дією іншої ознаки.

Розглянемо методи оцінки зв’язку між якісними ознаками.

1. Оцінка зв’язку між двома ознаками. При дослідженні зв’язку між двома ознаками А та В таблиця спряженості називається таблицею 2 2, або чотирикомпонентною таблицею і має вигляд

В

 

А

 

+

 

 

 

 

 

 

 

 

 

+

 

 

 

Величини у таблиці спряженості означають:

– кількість елементів вибірки (відносні частоти), в яких відсутні обидві ознаки А та В;

– кількість елементів вибірки (відносні частоти), в яких присутня ознака А та відсутня ознака В;

– кількість елементів вибірки (відносні частоти), в яких присутня ознака В та відсутня ознака А;

276

Розділ 5

– кількість елементів вибірки (відносні частоти), в яких присутні обидві ознаки А та В.

Якщо результативна (залежна) ознака піддається кількісному вимірюванню (обсяг перевезень, енергетичні і трудові ресурси, собівартість, трудомісткість, рентабельність тощо), то величини a , b , c та d можна виразити через відсотки від загальної кількості досліджуваного показника. Для даної схеми зв’язок оцінюється за допомогою коефіцієнта кореляції

. (5.42)

Приклад 4. Досліджується робота автомобіля на маятниковому маршруті при перевезенні партіонних вантажів. За показник ефективності прийнятий виробіток автомобіля на маршруті, поставлений у залежність від завантаженості автомобіля (ознака А) і використання фонду робочого часу (ознака В).

Отримані такі результати: 25% вантажів від загального обсягу перевезень перевезено з неповним завантаженням автомобіля і неповним використанням фонду робочого часу; 8% вантажів перевезено з повним завантаженням автомобіля і неповним використанням фонду робочого часу; 60% вантажів перевезено з неповним використанням вантажопідйомності автомобіля і повним використанням фонду робочого часу; 7% вантажів перевезено з повним використанням вантажопідйомності і повним використанням фонду робочого часу.

Оцінити, як впливають зазначені техніко-експлуатаційні показники на виробіток автомобіля.

Розв’язок. Складемо матрицю спряженості (табл. 5.17).

 

 

 

Таблиця 5.17

 

Таблиця спряженості (приклад 4)

 

 

 

 

 

Використання фонду

Завантаження А

 

 

робочого часу В

неповне (–)

 

повне (+)

 

 

 

 

 

 

 

 

неповне (–)

 

 

 

 

 

повне (+)

 

 

 

 

Обчислюємо коефіцієнт кореляції

 

 

 

 

 

 

 

.

 

Коефіцієнт детермінації в процентах дорівнює

%.

Можна зробити висновок, що різниця між ступенями впливу використання вантажопідйомності і робочого часу на виробіток автомобіля незначна і складає 3,24%.

Оцінка стохастичних зв’язків між вхідними та вихідними ознаками 277

2. Оцінка зв’язку в статистичних комплексах з багатьма ознаками. Якщо результати спостережень можуть бути класифіковані за трьома і більше якісними ознаками, розглядаються таблиці спряженості (табл. 5.18).

Таблиця 5.18

Форма таблиці спряженості

В

 

А

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У цій таблиці – кількість результатів спостережень із загальної кількості , які мають -ту та -ту ознаки одночасно.

Для оцінки наявності зв’язку між ознаками та (або між та з градаціями двох ознак А та В) використовується статистика

. (5.47)

Ця статистика для незалежних ознак має -розподіл з ступенями вільності. Якщо на прийнятому рівні значимості , то слід визнати наявність зв’язку між досліджуваними ознаками. Кількісна оцінка зв’язку здійснюється за допомогою

коефіцієнта спряженості

. (5.48)

Коефіцієнт дорівнює 1 у випадку повного зв’язку при .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]