Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

big_doc_LKG

.pdf
Скачиваний:
18
Добавлен:
07.02.2016
Размер:
20.24 Mб
Скачать

208

Розділ 4

Поряд з головним і додатковими інколи беруться до уваги деякі «допоміжні» фактори, які особливо не цікавлять дослідника, але можуть в значній мірі вплинути на результативну ознаку. Допоміжні фактори за будь-якою постановкою дослідницької задачі не можуть бути «головними», тому їх доцільно виділити в окрему групу. Головні, додаткові і допоміжні фактори називаються основними.

4.2. Відбір суттєвих факторів методом дисперсійного аналізу

4.2.1. Задачі і сутність дисперсійного аналізу. У багатьох сферах практичної діяльності зустрічається об’єкти дослідження стан яких визначається вихідними змінними (факторами), які не мають кількісного опису. Такими факторами можуть бути некеровані і керовані змінні, які за деякими причинами не дозволяють виконувати їх вимірювання у даному експерименті, а також ті неконтрольовані змінні, рівні варіювання яких можна довільно вибирати і фіксувати за часом.

Для вивчення впливу факторів такого типу на вихідну (результативну) функцію об’єкта, їх загального оцінювання, ранжування і виділення серед них суттєвих, очевидно, непридатні всі методи відсіювання керованих кількісних факторів, оскільки ці методи передбачають вимірювання рівнів досліджуваних факторів.

Наведемо приклади таких ситуацій в транспортних системах.

1.Вимірювання декількома операторами якої-небудь фізичної величини (маса і розміри вантажоодиниці, швидкість автомобіля, витрати палива, показники транспортного процесу тощо) декількома пристроями (декількома методами), причому кожний оператор за допомогою кожного пристрою виконати деяку кількість паралельних вимірювань. Осереднення спостережень, що належать до кожного із всіх можливих сполучень оператор-пристрій, дає безліч середніх арифметичних. Їх розсіювання може бути пов’язаним із випадковою похибкою, систематичною (методичною) похибкою вимірювального пристрою і впливом оператора. Необхідно визначити, наскільки суттєвим є вплив на результат вимірювання двох факторів: пристрою

(методу) і оператора.

2.Аналогічна задача виникає при організації вантажопереробки паралельно на декількох об’єктах (вантажних пунктах, маршрутах,дільницях прийому і формування транспортних партій, зонах скла-

Оцінка впливу факторів на процес функціонування систем

209

дування тощо). Необхідно встановити однотипність характеристик транспортних партій, відповідність фактичних показників транспортного процесу і його окремих елементів нормативним і т. ін., тобто оцінити суттєвість фактора індивідуальних властивостей об’єкта на процес вантажопереробки.

3.При використанні замовником транспортних засобів декількох перевізників необхідно визначити суттєвість відмінностей показників транспортного процесу і надійності роботи транспорту.

4.При нестабільності величини вихідного показника за часом необхідно оцінити, наскільки суттєвим є вплив повільного часового дрейфу на фоні випадкових похибок спостережень.

Науково обґрунтоване розв’язання подібних задач за деяких припущень можливо отримати методом дисперсійного аналізу. За його допомогою можна виділити, вивчити і оцінити достовірність впливу не тільки кожного фактора окремо, але і їх сукупності у різних комбінаці-

ях. Обов’язковою вимогою застосування дисперсійного аналізу є проведення експерименту в однакових умовах.

У загальному вигляді постановку задачі можна представити таким чином.

Задається:

1) результативна (вихідна) ознака може залежати (за фізичними причинами) від незалежних керованих факторів , , , , ,

, які не мають кількісного опису, і їх парних взаємодій;

2)кожний фактор може варіюватися на рівнях;

3)повний факторний експеримент включає серій незалежних спостережень за кількістю всіх можливих неповторюваних сполучень рівнів факторів;

4) кожна -та серія має

спостережень , , ,

, ,

паралельних дослідів.

Необхідно: визначити, в якій мірі суттєвим на фоні випадкових похибок є вплив того чи іншого фактора або взаємодії факторів на результативну ознаку ; провести порівняння з іншими факторами і виділити з них найбільш суттєві.

Припущення:

1) спостереження результативної ознаки – нормально розподілена випадкова величина з центром розподілу . Таким чином, фактори визначають величину тільки у середньому,

210

Розділ 4

залишаючи простір для випадкових похибок, що підпорядковуються нормальному розподілу;

2) дисперсія одиничного спостереження , обумовлена випадковими похибками , постійна у всіх дослідах і не залежить від , , , , , , тобто дисперсії однакові (), а їх вибіркові оцінки однорідні – умова відтворюваності дослідів з одна-

ковою точністю.

Дисперсія характеризує розсіяння значень досліджуваного по-

казника всередині серій (груп), викликане випадковими похибками досліджень.

Із даних задачі і вказаних припущень очевидно, що чим більший вплив деякого фактора на результативну ознаку , тим більше ро-

зходження між собою середніх арифметичних результативного показника () в серіях паралельних дослідів, отриманих при різних рівнях варіювання фактора . Статистична значимість тако-

го розходження вказує на суттєвий вплив фактора.

За показник впливу фактора приймається величина, яка по аналогії із звичайною дисперсією називається дисперсією фактора . Нехай у відсутності похибок досліду () при варіюванні фактора

на різних рівнях отримані істинні значення , , , , ,

результативного показника . Тоді дисперсію фактора можна виразити залежністю

 

 

,

(4.1)

де

.

 

 

При цьому будемо мати на увазі, що значення

не є випадковими

і тому дисперсія

 

не пов’язана з жодною випадковою величиною,

так як ми вважаємо

.

 

При варіюванні фактора на рівнях в результаті спостережен-

ня (без проведення паралельних дослідів на кожному

-му

рівні)

отримуємо значення результативного показника , ,

, ,

, ,

розсіяння яких можна охарактеризувати вибірковою дисперсією

 

Оцінка впливу факторів на процес функціонування систем

211

(4.2)

з кількістю ступенів вільності .

Ця дисперсія характеризує відхилення окремих спостережень від загальної середньої результативної ознаки.

Якщо відмінність від не значима, то розкид спостере-

жень, який характеризує ця дисперсія, пов’язаний тільки з випадковими причинами і вплив фактора є несуттєвим. Якщо ж відмін-

ність від є значимою, то підвищений розкид спостережень

спричиняється не тільки випадковими причинами, але ще і впливом фактора , який тепер визнають суттєвим.

У цьому випадку загальну дисперсію можна представити як

. (4.3)

Після встановлення суттєвості впливу фактора необхідно з’ясувати, який із рівнів спричиняє найбільшу дію. Для цього додатково виконують попарне порівняння середніх між рівнями. Щоб знайти найкращі варіанти випробуваних факторів, як кожного окремо, так і в сукупності, слід порівняти результати дії різних варіантів випробуваних факторів для всіх можливих їх комбінацій.

Таким чином, сутність дисперсійного аналізу полягає в наступному. 1. Розкладання оцінки загального розсіяння результативного пока-

зника на складові, що залежать від:

випадкових причин;

кожного із розглядуваних факторів;

взаємодій факторів.

2. Оцінювання статистичної значимості дисперсій вищезазначених складових з урахуванням похибки відтворюваності досліду.

У загальному випадку дисперсійний аналіз дозволяє отримати відповідь на запитання: що призводить до зміни результативної ознаки досліджуваного процесу або явища – дія фактора , чи дія випадкових збурень.

212

Розділ 4

4.2.2. Однофакторний дисперсійний аналіз

4.2.2.1. Методика проведення аналізу. На результативний показ-

ник процесу функціонування системи діє тільки один фактор , який має постійних рівнів. На кожному рівні проводиться серія із спостережень досліджуваного показника. Ці вимірів розглядаються як випадкова вибірка із генеральної сукупності випадкової величини на кожному рівні. В результаті отримаємо значень досліджува-

ного показника , де – номер випробування (), – порядковий номер рівня фактора ().

Статистичний комплекс результатів такого експерименту буде мати такий вигляд (табл. 4.1).

Таблиця 4.1

Статистичний комплекс експерименту

Номер

 

 

Рівень фактора

спостереження

1

2

3

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

Групова

середня

Розглянемо два випадки аналізу.

Випадок 1. Рівнокількісні серії спостережень на всіх рівнях. У

цьому випадку . При розташуванні спостережень, поданому в табл. 4.1, розсіяння значень ознаки між рядками обумов-

люється похибкою відтворюваності, а розсіяння між стовпця-

ми – додатковою дією досліджуваного фактора. Порядок проведення дисперсійного аналізу. 1. Обчислюємо:

а) середні арифметичні серій із повторних спостережень для кожного -го рівня фактора за формулою:

Оцінка впливу факторів на процес функціонування систем

213

;

(4.4)

б) загальне середнє арифметичне для всієї сукупності

. (4.5)

Розсіяння окремих спостережень відносно загального середнього

обумовлено дією як випадкових причин, так і впливом фактора .

Дія фактора випадковості проявляється у розсіянні (з дисперсією ) спостережень серій паралельних дослідів на кожному рівні навколо середнього арифметичного своєї серії. Вплив фактора

дисперсією ) викликає підвищене розсіяння середніх арифметичних

серій відносно загального середнього . Кожне з цих трьох розсіянь можна охарактеризувати відповідною сумою квадратів відхилень.

в) загальну суму квадратів відхилень окремих спостережень від загального середнього за формулами

(4.6)

або

. (4.7)

Вона характеризує розсіяння спостережень в результаті дії як випадковості, так і досліджуваного фактора ;

г) суму квадратів відхилень «у середині серій» за формулами:

(4.8)

або

214

Розділ 4

. (4.9)

Вона характеризує залишкове розсіяння випадкових похибок,

тобто відтворюваність.

ґ) суму квадратів відхилення «між серіями» або розсіювання по рівнях фактора , тобто зважену з урахуванням кількості паралельних спостережень у кожній серії суму квадратів різниць між середніми

окремих серій і загальним середнім за всією сукупністю спостережень за формулами:

(4.10)

або

. (4.11)

Ця сума характеризує розсіяння середніх серій за рахунок випадкових причин (з дисперсією для середніх серій) і досліджуваного фактора (з дисперсією ).

д) оцінки дисперсій. У випадку, коли вплив фактора на результа-

тивну ознаку відсутній, то підтверджується нуль-гіпотеза про однорідність (). Тоді всі серій паралельних спостереже-

нь можна розглядати як випадкові вибірки із однієї і тієї ж нормальної генеральної сукупності і відповідні дисперсії визначаються за формулами:

незміщена загальна оцінка дисперсії відтворюваності по всіх спостереженнях

(4.12)

з кількістю ступенів вільності ;

Оцінка впливу факторів на процес функціонування систем

215

– вибіркова дисперсія розсіювання «всередині серій», або залишкова дисперсія відтворюваності

(4.13)

зкількістю ступенів вільності ;

вибіркова дисперсія середніх по серіях

(4.14)

з кількістю ступенів вільності .

Ця дисперсія є незміщеною оцінкою дисперсії , з якою норма-

льно розподілені незалежні одне від одного середні -их серій; Звідси отримуємо оцінку дисперсії відтворюваності у вигляді диспе-

рсії розсіювання «між серіями»

(4.15)

зкількістю ступенів вільності .

2.Оцінюємо вплив факторів. Для того, щоб вплив фактора був визнаний суттєвим, необхідно і достатньо, щоб оцінка дисперсії

значимо відрізнялась від . Перевірка нуль-гіпотези щодо однорідності цих вибіркових дисперсій зводиться до порівняння дисперсій.

Якщо , то нуль-гіпотеза про рівність групових середніх

підтверджується і, отже, вплив фактора на результативну ознаку вважається несуттєвим.

При невиконанні цієї умови () перевірка зводиться до порі-

вняння факторної і залишкової дисперсій за -критерієм Фішера, спостережне значення якого визначається як

. (4.16)

216

Розділ 4

Отримане значення критерію порівнюється з табличним , яке визначають за таблицями -розподілу (додаток Д8) для рівня значимості при ступені вільності чисельника та ступені вільності знаменника .

Якщо , то робиться висновок про суттєвий вплив фактора на результат процесу функціонування системи і оцінюється вплив його рівнів.

3. Оцінюємо вплив рівнів (серій). Оцінювання полягає у перевірці гіпотези про рівність середніх пари серій за допомогою -критерію Стьюдента. Для цього можна використати три різновиди -критерію:

– традиційний -критерій Стьюдента. Статистика критерію обчислюється за формулою:

,

(4.17)

де , – середні значення порівнюваних серій;

– стандартне відхилення.

Обчислена статистика порівнюється з табличним значенням на рівні значимості і кількості ступенів вільності . При нульова гіпотеза рівності середніх відхи-

ляється.

– модифікований критерій Стьюдента. Статистика критерію визначається як

 

,

 

(4.18)

де

і

– розмах порівнюваних

серій.

 

 

 

Величина

порівнюється з критичним значенням

для довірчої

ймовірності

(табл. 4.2 для

).

 

Якщо

, то гіпотеза рівності середніх підтверджується і,

отже, порівнювані серії не впливають на досліджувану результативну ознаку.

Оцінка впливу факторів на процес функціонування систем

217

Таблиця 4.2

Критичні значення модифікованого критерію Стьюдента для порівняння середніх по двох вибірках однакового обсягу для

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

3,427

7

0,426

13

0,243

18

0,187

3

1,272

8

0,373

14

0,228

19

0,179

4

0,813

9

0,334

15

0,216

20

0,172

5

0,613

10

0,304

16

0,205

 

 

6

0,499

12

0,260

17

0,195

 

 

– парний -критерій. Статистика критерію розраховується за формулою

,

(4.19)

де – середнє значення різниці пар серій.

Перевірка нульової гіпотези повністю аналогічна традиційному - критерію Стьюдента.

Випадок 2. Нерівнокількісні серії спостережень. За неоднакової кількості паралельних спостережень на різних -их рівнях використовуються такі залежності.

1. Загальна кількість спостережень

. (4.20) 2. Сумарне значення результативної ознаки по серіях

. (4.21)

3. Середнє значення в серіях

. (4.22)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]