Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

big_doc_LKG

.pdf
Скачиваний:
18
Добавлен:
07.02.2016
Размер:
20.24 Mб
Скачать

348

Розділ 7

2)натиснувши кнопку вибрати змінні для побудови регресії. Максимальна кількість змінних для розрахунку не повинна перевищувати чотирьох. Після вибору змінних слід натиснути кнопку ОК діалогового вікна для продовження аналізу;

3)у діалоговому вікні NON-LINEAR COMPONENTS REGRESSION

НЕЛІНІЙНІ КОМПОНЕНТИ РЕГРЕСІЇ встановити опцію перетворення натурального логарифму LN(X) (рис. 7.11) та натиснути кнопку ОК;

Рис. 7.11. Функції перетворення компонентів регресії

4) у вікні MODEL DEFINITION – ВИЗНАЧЕННЯ МОДЕЛІ (рис. 7.7) за допомогою кнопки вибрати залежну та незалежні змінні. Система STATISTICA після перетворення компонентів нелінійної регресії у відповідності з вказаною функцією натурального логарифму додає до списку змінних їх перетворення. Для нашого прикладу вікно вибору залежної та незалежних змінних має наступний вигляд

(рис. 7.12)

Рис. 7.12. Вікно вибору залежної та незалежних змінних нелінійної регресії

Апроксимація зв’язків багатофакторними регресійними моделями 349

До початкового списку з чотирьох змінних система додала чотири їх перетворення. Тобто, наприклад, значення змінної LN–V1 є значеннями логарифмів змінної Х1. Зауважимо, що у лівому списку залежних змінних можна вибирати декілька змінних. При побудові степеневої та показникової моделей необхідно вибирати замість залежної змінної Y її логарифмічне перетворення (у нашому випадку LN–V4).

Устепеневій залежності замість незалежних змінних Х1, Х2,…, Хn слід вказати їх логарифмічні перетворення (у нашому випадку відпові-

дно LN–V1, LN–V2, LN–V3).

Упоказниковій залежності незалежні змінні у відповідності до рівняння (7.43) використовуються без перетворення, тобто у правому списку незалежних змінних слід вибрати їх дійсні значення (у нашому прикладі Х1, Х2 та Х3);

5) після вибору залежної та незалежних змінних у діалоговому вікні MODEL DEFINITION – ВИЗНАЧЕННЯ МОДЕЛІ (рис. 7.7) слід вказати, чи необхідно включити до моделі вільний член у списку натиснути кнопку INTERCEPT – ВІЛЬНИЙ ЧЛЕН (рис. 7.8) та натиснути кнопку ОК;

6) викликавши вікно з електронною таблицею результатів розрахунку коефіцієнтів регресії аналогічно вищеописаному для лінійної моделі перейти від перетворених коефіцієнтів регресії до дійсних. Розглянемо порядок визначення дійсних коефіцієнтів регресії за степеневою та показниковою моделями для нашого прикладу.

Вікно результатів розрахунку коефіцієнтів регресії для степеневої моделі показане на рис. 7.13.

Рис. 7.13. Результати розрахунків коефіцієнтів регресії за степеневою моделлю

Таким чином, коефіцієнти при перетворених змінних у лінійованому рівнянні степеневої регресії (7.28) мають наступні значення (стовпчик В таблиці результатів на рис. 7.13):

;

;

;

.

350

Розділ 7

Переходячи до дійсних значень коефіцієнтів у рівнянні степеневої регресії отримаємо:

; ; ; .

Рівняння множинної регресії за степеневою моделлю буде мати наступний вигляд

.

Вікно результатів розрахунку коефіцієнтів регресії для степеневої моделі показане на рис. 7.14.

Рис. 7.14. Результати розрахунків коефіцієнтів регресії за показниковою моделлю

Таким чином, коефіцієнти при перетворених змінних у лінійованому рівнянні показникової регресії мають такі значення (стовпчик В таблиці результатів на рис. 7.14):

; ; ; .

Переходячи до дійсних значень коефіцієнтів у рівнянні показникової регресії отримаємо:

; ;

; .

Рівняння множинної регресії за показниковою моделлю буде мати наступний вигляд

.

Апроксимація зв’язків багатофакторними регресійними моделями 351

7.4.3. Оцінка якості регресійних залежностей. Якість побудова-

них рівнянь регресії можна оцінити за допомогою розрахункових показників, до яких відносяться:

коефіцієнт множинної кореляції (позначається як MULTIPLE R чи просто R);

коефіцієнт множинної детермінації (позначається як R2 чи RI);

стандартна помилка оцінювання регресії (позначається як STAN-

DARD ERROR OF ESTIMATE чи STD. ERROR OF ESTIMATE).

Результати розрахунку цих показників виводяться в процесі побудови регресійної моделі у верхній частині діалогового вікна MULTIPLE

REGRESSION RESULTS – РЕЗУЛЬТАТИ МНОЖИННОЇ РЕГРЕСІЇ (рис. 7.5)

та дублюються у верхній частині вікна результатів розрахунків коефіцієнтів регресії (рис. 7.6).

Регресійна модель буде кращою серед декількох розглянутих, якщо їй відповідають більші значення коефіцієнтів множинної кореляції та множинної детермінації та менші значення стандартної помилки оцінювання регресії.

7.4.3.1. Оцінка значимості рівняння та факторів регресії. Для перевірки значимості рівняння регресії та адекватності рівняння регресії вихідним даним використовується -критерій Фішера (F). Розрахунковий критерій Фішера виводиться у правому стовпчику верхньої частині діалогового вікна MULTIPLE REGRESSION RESULTS – РЕ-

ЗУЛЬТАТИ МНОЖИННОЇ РЕГРЕСІЇ (рис. 7.5) та для нашого прикладу дорівнює .

Нижче значення F виводиться кількість ступенів вільності меншої дисперсії та кількість ступенів волі більшої дисперсії (рядок DF). У нашому прикладі відповідно 3 та 36.

Ще нижче виводиться гранична імовірність прийняття гіпотези про адекватність регресійної моделі вихідним даним (у нашому прикладі p=0,000004).

У випадку, коли розрахункове значення граничної імовірності прийняття гіпотези про адекватність регресійної моделі вихідним даним не перевищує вибраний рівень значимості регресійна модель вважається значимою та адекватною вихідним експериментальним (статистичним) даним.

Для розглянутого прикладу при рівні значимості 0,05 лінійну множинну регресійну модель можна вважати значимою та адекватною ви-

хідним даним, так як p=0,000004 < 0,05.

Рис. 7.15. Вибір рівня значимості

352

Розділ 7

Для перевірки значимості факторів регресії використовують t- критерій Стьюдента.

Розрахункове значення t-критерію виводиться у відповідних рядках електронної таблиці результатів розрахунків коефіцієнтів регресії (рис. 7.6)

у стовпчику T-VALUE. У стовпчику P-LEVEL для факторів регресії виводиться значення граничної імовірності прийняття гіпотези про значимість коефіцієнта при відповідному факторі у рівнянні регресії.

Якщо розрахункове значення граничної імовірності P-VALUE не перевищує прийнятий рівень значимості 0,1 чи 0,05, регресійний коефіцієнт при факторі у рівнянні регресії, а, відповідно, і сам фактор вважається значимим.

Для розглянутого прикладу моделі лінійної множинної регресії при рівні значущості 0,05 фактори Х2 та Х3 вважаємо значимими (для них відповідно 0,0276 < 0,05 та 0,0290 < 0,05), а фактор Х1 є не значимим

(0.877 > 0.05).

Система STATISTICA дозволяє автоматично відбирати значимі фактори – вони підсвічуються червоним кольором у вікні результатів розрахунків MULTIPLE REGRESSION RESULTS – РЕЗУЛЬТАТИ МНО-

ЖИННОЇ РЕГРЕСІЇ (рис. 7.5) у верхній частині вікна під горизонтальною лінією. Рівень значимості, прийнятий для оцінки значимості факторів регресійної моделі, встановлюється у полі вводу ALPHA (DISPLAY) – РІВЕНЬ ЗНАЧИМОСТІ (ПОКАЗАТИ) того ж діалогового вікна (рис. 7.15). За необхідності його можна змінити на потрібне значення та натиснувши кнопку обновити підсвічення значимих факторів для щойно встановленого рівня значимості.

7.4.3.2. Аналіз залишків. Аналіз залишків проводиться з метою перевірки якості підгонки рівняння регресії. Залишки представляють собою різницю між фактичними значеннями залежної змінної та значеннями цієї ж змінної, обчисленими за отриманим рівнянням регресії для відповідних значень рядків незалежних змінних. Якщо регресійна модель підігнана добре, ряд залишків регресії має нормальний розподіл.

Для перевірки нормальності розподілу залишків слід побудувати гістограму залишків чи графік залишків на нормальному імовірнісному папері. Побудова гістограми розподілу залишків та графіку залишків на нормальному імовірнісному папері виконується таким чином:

Апроксимація зв’язків багатофакторними регресійними моделями 353

1) у вікні результатів розрахунків MULTIPLE REGRESSION RESULTS

РЕЗУЛЬТАТИ МНОЖИННОЇ РЕГРЕСІЇ (рис. 7.5) натиснути кнопку

– АНАЛІЗ ЗАЛИШКІВ, після чого на екрані з’являється діалогове вікно RESIDUAL ANALYSIS (рис. 7.16).

Рис. 7.16. Діалогове вікно аналізу залишків

2) для побудови графіку залишків на нормальному логарифмічному папері слід натиснути кнопку – ГРАФІК ЗАЛИШКІВ

НА НОРМАЛЬНОМУ ІМОВІРНІСНОМУ ПАПЕРІ. Такий графік для розгля-

нутого прикладу лінійної множинної регресії показаний на рис. 9.17.

Рис. 7.17. Графік залишків регресії на нормальному імовірнісному папері

354

Розділ 7

Якщо залишки мають нормальний розподіл, точки залишків досить добре «лягають» на пряму нормального розподілу графіка.

3) для побудови гістограми розподілу залишків слід натиснути кнопку – ГІСТОГРАМА ЗАЛИШКІВ, після чого у діалого-

вому вікні SELECT RESIDUAL FOR CASEWISE PLOT – ВИБІР ТИПУ ЗАЛИ-

ШКІВ ДЛЯ ПОБУДОВИ ГРАФІКА активізувати опцію RAW RESIDUALS

ЗАЛИШКИ РЯДКІВ (рис. 7.18) та натиснути кнопку ОК.

Рис. 7.18. Вибір типу залишків

На екрані з’явиться вікно з гістограмою розподілу залишків з накладеною на неї кривою нормального розподілу (рис. 7.19), що дає можливість візуально оцінити близькість розподілу залишків до нормального.

Рис. 7.19. Гістограма залишків рядків

Апроксимація зв’язків багатофакторними регресійними моделями 355

7.4.3.3. Розрахунок кореляційної матриці. Розрахунок кореляцій-

ної матриці дає можливість виявити, так звані, мультиколінеарні фактори, тобто пари факторів, між якими існує значимий кореляційний зв’язок (один фактор залежить від другого чи навпаки). Кореляційна матриця є квадратною та містить стільки рядків та стовпчиків, скільки незалежних змінних міститься у рівнянні регресії.

Для побудови кореляційної матриці слід натиснути у вікні MULTIPLE REGRESSION RESULTS – РЕЗУЛЬТАТИ МНОЖИННОЇ РЕГРЕСІЇ (рис.

9.5) кнопку – КОРЕЛЯЦІЙНІ ТА ОПИСОВІ СТАТИС-

ТИКИ, після чого на екрані з’явиться діалогове вікно REVIEW DESCRIPTIVE STATISTIC – ПЕРЕГЛЯД ОПИСОВИХ СТАТИСТИК (рис. 7.20).

Рис. 7.20. Діалогове вікно описових статистик

Надалі у цьому вікні слід натиснути кнопку – КОРЕЛЯЦІЯ. Вікно результатів розрахунку кореляційної матриці для вихідних даних нашого прикладу наведене на рис. 7.21.

Рис. 7.21. Кореляційна матриця

Значимі коефіцієнти кореляції підсвічуються червоним кольором на рівні значимості 0,05.

356

Розділ 7

7.5. Порядок побудови і оцінки багатофакторних регресійних моделей

Основні процедури апроксимації, математичне і програмне забезпечення представлені в табл. 7.2.

 

Таблиця 7.2

Алгоритм побудови багатофакторних моделей

 

 

Послідовність виконання

Математичне і програмне

операцій

забезпечення

 

 

1. Створення файлу вихідних

даних

 

2. Попереднє опрацювання ви-

 

хідних даних:

 

2.1. Обчислення вибіркових

Модуль BASIC STATISTI-

статистичних характеристик.

CAL/TABLES – ОСНОВНІ СТАТИ-

2.2. Виключення грубих ано-

СТИКИ / ТАБЛИЦІ

мальних спостережень.

 

2.3. Перевірка статистичної

Процедура T-TEST FOR INDE-

однорідності сукупності.

PENDENT SAMPLES T-ТЕСТ ДЛЯ

2.4. Перевірка досліджуваних

НЕЗАЛЕЖНИХ ВИБІРОК

ознак на нормальність розпо-

 

ділу.

 

3. Відбір факторів для включен-

 

ня в модель:

 

3.1. Розрахунок кореляційної

Процедура MULTIPLE REGRES-

матриці.

SION RESULTS– РЕЗУЛЬТАТИ

3.2. Аналіз кореляційної мат-

МНОЖИННОЇ РЕГРЕСІЇ.

риці та побудова концептуа-

Процедура REVIEW DESCRIPTIVE

льної моделі

STATISTIC – ПЕРЕГЛЯД ОПИСО-

 

ВИХ СТАТИСТИК.

4. Побудова регресійної моделі

 

4.1. Вибір форми зв’язку.

Типові моделі.

4.2. Ідентифікація парамет-

Модуль MULTIPLE REGRESSION

рів моделі

–Процедура МНОЖИННА РЕ-

4.3. Оцінка якості регресійних

ГРЕСІЯ.

залежностей.

 

4.4. Аналіз кращої моделі.

 

Апроксимація зв’язків багатофакторними регресійними моделями 357

Приклад 2. Проведені дослідження на трьох однотипних вантажних пунктах металургійного комбінату дали підстави стверджувати, що величина загального прос-

тою вагонів на комбінаті залежить від таких, апріорі вибраних, факторів:

– сумарної кількості вагонів, що надходять в систему за добу;

– частки вантажів, що надходять в критих вагонах;

– частки вантажів, що надходять в піввагонах;

– інтервалів між черговим прибуттям вагонів;

– коефіцієнта завантаження транспортної системи.

В табл. 7.3 наведені статистичні дані спостережень, зібрані на трьох однотипних вантажних пунктах.

Таблиця 7.3

Дані статистичних спостережень

 

 

 

Пункт 1

 

 

 

 

Пункт 2

 

 

 

Пункт 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

120

39

0,40

0,60

2,4

2,67

210

10

0,21

0,79

1,3

0,68

562

17

0,16

0,84

3,8

1,88

2

671

16

0,21

0,79

2,3

1,10

396

7

0,58

0,42

9,5

0,48

262

10

0,62

0,38

6,3

0,75

3

1119

19

0,35

0,65

4,5

1,30

498

17

0,35

0,65

3,0

1,16

434

17

0,10

0,90

3,8

1,33

4

742

22

0,15

1,00

4,0

1,50

651

15

0,13

0,87

3,8

1,00

638

9

0,33

0,67

3,8

0,68

5

651

15

0,58

0,42

4,3

1,00

420

20

0,38

0,62

3,3

1,37

203

4

0,59

0,41

11,0

0,30

6

482

14

0,21

0,79

2,7

0,96

815

18

0,12

0,88

2,3

1,23

312

8

0,52

0,48

3,5

0,60

7

151

5

0,57

0,43

6,0

0,34

413

13

0,13

0,87

4,4

0,89

357

8

0,21

0,79

4,8

0,60

8

367

14

0,21

0,79

3,6

0,96

493

10

0,12

0,88

4,3

0,68

120

7

0,58

0,42

6,3

0,53

9

714

20

0,37

0,63

3,0

1,37

567

22

0,15

0,85

3,2

1,65

337

8

0,37

0,63

3,0

0,60

10

505

6

0,12

1,00

5,3

0,41

859

20

0,06

0,94

3,6

1,37

625

14

0,32

0,68

5,7

1,10

11

484

5

0,48

0,52

2,0

0,34

422

10

0,08

1,00

4,6

0,60

662

34

0,28

0,72

3,3

2,56

12

126

5

0,69

0,31

5,3

0,34

1016

23

0,16

0,84

4,0

1,57

802

15

0,43

0,57

5,7

1,13

13

564

13

0,12

0,88

4,5

0,89

638

24

0,50

0,50

2,4

1,81

253

5

0,48

0,52

3,0

0,38

14

497

17

0,30

0,70

4,3

1,16

494

13

0,22

0,78

5,3

0,98

483

13

0,26

0,74

4,0

0,38

15

429

10

0,19

0,81

5,7

0,68

580

7

1,00

0,20

2,0

0,54

781

16

0,20

0,80

3,8

1,20

16

396

14

0,21

0,79

5,0

0,96

474

15

0,31

0,69

3,2

1,88

 

 

 

 

 

 

17

240

6

0,45

0,55

13,0

0,41

576

17

0,19

0,81

3,3

1,28

 

 

 

 

 

 

18

 

 

 

 

 

 

546

12

0,16

0,84

2,0

0,96

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Необхідно побудувати багатофакторну регресійну модель процесу переробки вагонів на металургійному комбінаті.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]