Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек№12 КМ ЗВТ.doc
Скачиваний:
10
Добавлен:
16.05.2015
Размер:
1.24 Mб
Скачать

6.4.2 Вибір виду рівняння регресії

Задача визначення функціональної залежності, що найкращим чином описує ЕД, пов'язана з подоланням ряду принципових труднощів. У загальному випадку для стандартизованих даних функціональну залежність показника від параметрів можна представити у вигляді

(6.13)

де f - заздалегідь не відома функція, яка підлягає визначенню; - помилка апроксимації ЕД.

Зазначене рівняння прийнято називати вибірковим рівнянням регресії y на u. Це рівняння характеризує залежність між варіацією показника і варіаціями факторів. А міра кореляції вимірює частку варіації показника, яка пов'язана з варіацією факторів. Інакше кажучи, кореляцію показника і факторів не можна трактувати як зв'язок їх рівнів, а регресійний аналіз не пояснює ролі факторів у створенні показника.

Ще одна особливість стосується оцінки ступеня впливу кожного фактора на показник. Регресійне рівняння не забезпечує оцінку роздільного впливу кожного фактора на показник, така оцінка можлива лише у випадку, коли всі інші фактори не пов'язані з досліджуваним. Якщо досліджуваний фактор пов'язаний з іншими, що впливають на показник, то буде отримана змішана характеристика впливу фактора. Ця характеристика містить як безпосередній вплив фактора, так і опосередкований вплив, який вчинила через зв'язок з іншими факторами та їх впливом на показник.

У регресійне рівняння не рекомендується включати фактори, слабко пов'язані з показником, але тісно пов'язані з іншими факторами. Не включають у рівняння і фактори, функціонально пов'язані один з одним (для них коефіцієнт кореляції дорівнює 1). Включення таких факторів призводить до виродження системи рівнянь для оцінок коефіцієнтів регресії і до невизначеності рішення.

Функція f повинна підбиратися так, щоб помилка в деякому розумінні була мінімальна. Існує нескінченна множина функцій, що описують ЕД абсолютно точно (= 0), тобто таких функцій, які для всіх значень параметрівприймають в точності відповідні значення показника. Разом з тим, для всіх інших значень параметрів, відсутніх в результатах спостережень, значення показника можуть приймати будь-які значення. Зрозуміло, що такі функції не відповідають дійсній зв'язку між параметрами і показником.

З метою вибору функціональної зв'язку заздалегідь висувають гіпотезу про те, до якого класу може належати функція f, а потім підбирають "кращу" функцію в цьому класі. Обраний клас функцій повинен володіти деякою "гладкістю", тобто "Невеликі" зміни значень аргументів повинні викликати "невеликі" зміни значень функції (ЕД містять деякі помилки вимірювань, а сама поведінка об'єкта піддається впливу перешкод, що маскують справжню зв'язок між параметрами і показником).

Простим, зручним для практичного застосування і відповідає зазначеним умовам є клас поліноміальних функцій

(6.14)

Для такого класу завдання вибору функції зводиться до задачі вибору значень коефіцієнтів Однак універсальність поліноміального представлення забезпечується тільки при можливості необмеженого збільшення ступеня полінома, що не завжди допустимо на практиці, тому доводиться застосовувати й інші види функцій.

Окремим випадком, широко застосовуваним на практиці, є поліном першого ступеня або рівняння лінійної регресії

. (6.15)

Це рівняння в регресійному аналізі слід трактувати як векторне, бо мова йде про матрицю даних

, i =1, 2, … , n. (6.17)

Зазвичай прагнуть забезпечити таку кількість спостережень, яке перевищувало б кількість оцінюваних коефіцієнтів моделі. Для лінійної регресії при кількість рівнянь перевищує кількість коефіцієнтів полінома, що підлягають визначенню. Але і в цьому випадку не можна підібрати коефіцієнти таким чином, щоб помилка в кожному скалярному рівнянні зверталася в нуль, так як до невідомих відносятьсяі, їх кількість, тобто завжди більше кількості рівнянь. Аналогічні міркування справедливі і для поліномів вище першого степеня.

Для вибору виду функціональної залежності можна рекомендувати наступний підхід:

в просторі параметрів графічно відображають точки із значеннями показника. При великій кількості параметрів можна будувати точки стосовно до кожного з них, отримуючи двовимірні розподілу значень;

по розташуванню точок і на основі аналізу сутності взаємозв'язку показника і параметрів об'єкта роблять висновок про приблизний вигляді регресії або її можливих варіантах;

після розрахунку параметрів оцінюють якість апроксимації, тобто оцінюють ступінь близькості розрахункових і фактичних значень;

якщо розрахункові і фактичні значення близькі у всій області завдання, то задачу регресійного аналізу можна вважати вирішеною. В іншому випадку можна спробувати вибрати інший вид полінома або іншу аналітичну функцію, наприклад періодичну.

Лінійні регресійні моделі. З метою досліджень часто буває зручно представити досліджуваний об'єкт у вигляді ящика, що має входи і виходи, не розглядаючи детально його внутрішньої структури. Звичайно, перетворення в ящику (на об'єкті) відбуваються (сигнали проходять по зв'язках і елементам, змінюють свою форму і т. п.), але при такому поданні вони відбуваються приховано від спостерігача.

За ступенем інформованості дослідника про об'єкт існує поділ об'єктів на три типи «ящиків»:

• «білий ящик»: про об'єкт відомо все;

• «сірий ящик»: відома структура об'єкта, невідомі кількісні значення параметрів;

• «чорний ящик»: про об'єкт невідомо нічого.

Чорний ящик умовно зображують як на рис. 6.5.

Рисунок 6.5 - Позначення чорного ящика на схемах

Значення на входах і виходах чорного ящика можна спостерігати і вимірювати. Вміст ящика невідомо.

Завдання полягає в тому, щоб, знаючи множину значень на входах і виходах, побудувати модель, тобто визначити функцію ящика, по якій вхід перетвориться в вихід. Така задача називається задачею регресійного аналізу.

В залежності від того, доступні входи досліднику для управління або тільки для спостереження, можна говорити про активний або пасивний експеримент з ящиком.

Нехай, наприклад, перед нами стоїть завдання визначити, як залежить випуск продукції від кількості споживаної електроенергії. Результати спостережень відобразимо на графіку (див. рис. 6.6). Всього на графіку n експериментальних точок, які відповідають n спостереженнями.

Рис. 6.6 - Графічний вид представлення результатів спостереження над чорним ящиком

Для початку припустимо, що ми маємо справу з чорним ящиком, який має один вхід і один вихід. Припустимо для простоти, що залежність між входом і виходом лінійна або майже лінійна. Тоді дана модель буде називатися лінійною одновимірною регресійною моделлю.

Рішення задачі регресійного аналізу доцільно розбити на декілька етапів:

попередня обробка ЕД;

вибір виду рівнянь регресії;

обчислення коефіцієнтів рівняння регресії;

перевірка адекватності побудованої функції результатами спостережень.