Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ms_prac

.pdf
Скачиваний:
37
Добавлен:
10.12.2018
Размер:
2.33 Mб
Скачать

ділиться на стандартне відхилення залишків). Дана процедура дозволяє легко побачити значення, що виходять за межі.

Графік підбору - отримання точкової діаграми вхідних значень Y щодо змінної X, а також графіка функції регресії. Дана діаграма відповідає точкової діаграмі з додаванням лінії тренду.

Графік нормальної ймовірності - дана опція в Excel реалізована не повністю, тому її включати не слід.

Після того, як заповнені вибрані вікна треба клацнути кнопкою ОК. Для більшої наочності отримані результати необхідно форматувати, тобто вибрати ширину комірок, розрядність чисел, читабельність заголовків.

Інтерпретація регресії

Для відповіді на запитання «Наскільки добре отримана функція регресії відповідає даним», використовуються чотири характеристики: стандартна помилка, R2, t-статистика та аналіз дисперсії.

В таблиці регресійна статистика приведені такі значення. Показник множинної кореляції R наведений в комірці J4 має значення 0.996, тобто практично рівний одиниці.

Величина R2, зазначена на діаграмі розсіювання, називається коефіцієнтом детермінації, що визначає частку зміни змінної Y в залежності від зміни X. Величина R2 знаходиться в межах від 0 до 1 і часто виражається у відсотках.

Якщо R2 > 0.95, то говорять про високу точність апроксимації (модель дуже добре описує явище). Якщо його значення лежать в діапазоні від 0.8 до 0.95, то вважають апроксимацію задовільною (модель в цілому відповідає описуваному явищу. Якщо R2 <0.6 прийнято вважати що точність апроксимації є недостатньою і модель потребує покращення (введення нових незалежних змінних, врахування нелінійностей тощо). В даному випадку R2 = 0.991, що свідчить про високий рівень адекватності рівняння регресії вхідним даним.

Значення R2 знаходиться в комірці J5 і становить приблизно 99%.

Значення «Нормований R-квадрат», наведене в комірці J6 має значення 0.981, використовується для порівняння з іншими моделями, що містять додаткові незалежні змінні. Стандартну помилку часто називають стандартною помилкою оцінки. Її можна інтерпретувати як стандартне відхилення залишків, яке показує, якої величини помилку в середньому ви допускаєте, коли замість фактичного значення Y використовуєте значення функції регресії. Стандартна помилка вимірюється в тих же одиницях, що і Y. У комірці J7 вказана величина стандартної помилки, яка рівна 1.153. Це означає, що фактичне значення відрізняється від обчисленого за допомогою отриманої функції регресії на 1.153. В разі нормального розподілу залишків, можна очікувати, що приблизно 2/3 точок даних знаходиться на відстані не більше ніж 1.153 вище або нижче прямої. В комірці J8 вказується кількість спостережень.

Якщо стандартна помилка оцінки є абсолютною мірою величини помилок, то коефіцієнт детермінації R2 є їх відносною мірою.

Далі, на листі відображено дві таблиці з загальною назвою «Дисперсійний аналіз». В першій з них відображені найбільш істотні параметри: K12 – регресійна сума квадратів, яка

 

 

n

 

 

 

 

 

 

обчислюється

за формулою

RSS fi y 2 ,

в якій

для зручності

розуміння і

загальності

 

 

i 1

 

 

 

 

 

 

значення обчислені з рівняння регресії позначені через

fi ; K13 – сума квадратів помилок регресії,

 

 

n

 

 

 

 

 

 

обчислена за

формулою

ESS yi fi

2 ;

K14

загальна сума

квадратів.

Її величина

i 1

n

визначається за формулою TSS RSS ESS yi y 2

i 1

51

В другій наведені коефіцієнти b0 , , b5 рівняння лінійної регресії, представлені в стовпці

Коефіцієнти. Коефіцієнт Y-перетин

-53.338 (комірка J17) є постійним членом рівняння, тобто це

b0 , а коефіцієнти X1 7.746, X2

14.351, X3 29.002, X4 5.949, X5 13.784 (комірки J18,

J19, J20, J21 і J22, відповідно) є

коефіцієнтами рівняння множинної регресії b1, , b5 . Таким

чином, рівняння регресії має вигляд:

yˆ – 53.338 7.746x1 14.351x2 29.002x3 5.949x4 13.784x5 .

Значення t -статистик, приведені в комірках L17 і L22, є частиною перевірок гіпотез про наявність залежності між змінними X і Y. Іншими словами вхідні дані 10 об'єктів Y розглядаються як вибірка з генеральної сукупності. Висувається нульова гіпотеза H0 про те, що залежність відсутня, тобто коефіцієнт регресії генеральної сукупності для змінних X дорівнює нулю, а, отже, їх зміна не впливає на значення змінної Y.

Загальна якість отриманої моделі, тобто її достовірність за рівнем значимості критерію Фішера – p , який має бути меншим за 0.5. в нашому прикладі в стовпчику «Значимість F»

значення p = 0.000324, що підтверджує значимість моделі. В стовпчику «Р-Значення» приведена достовірність відмінності відповідних коефіцієнтів від нуля. У випадках, коли p 0.05, коефіцієнт

можна вважати нульовим. Це означає, що відповідна незалежна змінна практично не впливає на залежну змінну і ця змінна разом з коефіцієнтом може бути вилучена з рівняння.

У таблиці ВИВІД ЗАЛИШКУ приведені дані щодо точності оцінок експериментальних значень залежних змінних. Зокрема, крім нумерації проведених дослідів (діапазон комірок І27:І36) в діапазоні комірок J27:J36 оцінювані значення для залежної змінної Y, а в діапазоні комірок K27:K36 – різниці оцінених і експериментальних значень залежної змінної Y. Іншими словами, в стовпчику Передбачені значення (діапазон J27:J36) є значеннями отриманої (теоретично) функції регресії, які оцінюють кожне з 10 Yі. а у стовпчику Залишки (діапазон K27:K36) вказані відхилення, що відповідають різниці між фактичними значеннями і значеннями функції регресії (підібраними значеннями).

52

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]