Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Statist.doc
Скачиваний:
28
Добавлен:
07.02.2016
Размер:
1.09 Mб
Скачать

5.3 Оцінка якості регресійних залежностей

Якість побудованих рівнянь регресії можна оцінити за допомогою розрахункових показників, до яких відносяться:

– коефіцієнт множинної кореляції (позначається як Multiple R чи просто R);

– коефіцієнт множинної детермінації (позначається як R2 чи RI);

– стандартна помилка оцінювання регресії (позначається як Standard error of estimate чи Std. Error of estimate).

Результати розрахунку цих показників виводяться в процесі побудови регресійної моделі у верхній частині діалогового вікна Multiple Regression Results – Результати множинної регресії (рис. 5.3) та дублюються у верхній частині вікна результатів розрахунків коефіцієнтів регресії (рис. 5.4).

Регресійна модель буде кращою серед декількох розглянутих, якщо їй відповідають більші значення коефіцієнтів множинної кореляції та множинної детермінації та менші значення стандартної помилки оцінювання регресії.

5.3.1 Оцінка значущості рівняння та факторів регресії

Для перевірки значущості рівняння регресії та адекватності рівняння регресії вихідним даним використовується F - критерій Фішера (F). Розрахунковий критерій Фішера виводиться у правому стовпчику верхньої частині діалогового вікна Multiple Regression Results – Результати множинної регресії (рис. 5.3) та для нашого прикладу дорівнює F=13.757.

Нижче значення F виводиться кількість ступенів волі меншої дисперсії та кількість ступенів волі більшої дисперсії (рядок df). У нашому прикладі відповідно 3 та 36.

Ще нижче виводиться гранична імовірність прийняття гіпотези про адекватність регресійної моделі вихідним даним (у нашому прикладі p=0.000004).

У випадку, коли розрахункове значення граничної імовірності прийняття гіпотези про адекватність регресійної моделі вихідним даним не перевищує прийнятий рівень значущості (зазвичай 0.1 чи 0.05), регресійна модель вважається значущою та адекватною вихідним експериментальним (статистичним) даним.

Для розглянутого прикладу при рівні значущості 0.05 лінійну множинну регресійну модель можна вважати значущою та адекватною вихідним даним, так як p=0.000004 < 0.05.

Для перевірки значущості факторів регресії використовують t - критерій Стьюдента. Розрахункове значення t - критерію виводиться у відповідних рядках електронної таблиці результатів розрахунків коефіцієнтів регресії (рис. 5.4) у стовпчику t-value. У стовпчику p-level для факторів регресії виводиться значення граничної імовірності прийняття гіпотези про значущість коефіцієнта при відповідному факторі у рівнянні регресії.

Якщо розрахункове значення граничної імовірності p-value не перевищує прийнятий рівень значущості (0.1 чи 0.05), регресійний коефіцієнт при факторі у рівнянні регресії, а, відповідно, і сам фактор вважається значущим.

Для розглянутого прикладу моделі лінійної множинної регресії при рівні значущості 0.05 фактори Х2 та Х3 вважаємо значущими (для них відповідно 0.0276 < 0.05 та 0.0290 < 0.05), а фактор Х1 є незначущим (0.877 > 0.05).

Рисунок 5.13 – Вибір рівня значущості

Система STATISTICA дозволяє автоматично відбирати значущі фактори – вони підсвічуються червоним кольором у вікні результатів розрахунків Multiple Regression Results – Результати множинної регресії (рис. 5.3) у верхній частині вікна під горизонтальною лінією. Рівень значущості, прийнятий для оцінки значущості факторів регресійної моделі, встановлюється у полі вводу Alpha (display) – Рівень значущості (показати) того ж діалогового вікна (рис. 5.13). За необхідності його можна змінити на потрібне значення та натиснувши кнопку обновити підсвічення значущих факторів для щойно встановленого рівня значущості.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]