- •Міністерство освіти і науки україни
- •Розділ 1 Структура основних модулів statistica Елементи інтерфейсу користувача
- •1.1 Загальна структура системи
- •1.2 Структура основних модулів та їх характеристика
- •1.3. Перемикач модулів. Вибір статистичного модуля
- •1.4 Загальна структура головного вікна системи statistica
- •Розділ 2 Робота з даними
- •2.1 Створення, відкриття та збереження файлу даних
- •2.2 Додавання та видалення змінних та випадків
- •2.3 Встановлення специфікацій змінної
- •Розділ 3 Модуль Basic Statistics/Tables – Основні статистики/Таблиці
- •3.1 Обчислення описових статистик
- •3.2 Перевірка статистичної однорідності вибіркових сукупностей
- •3.2.1 Перевірка статистичної однорідності незалежних вибірок
- •3.2.2 Перевірка статистичної однорідності залежних вибірок
- •3.2.3 Побудова графіків типу “ящик з вусами”
- •Розділ 4 Модуль Nonparametric/Distribution – Непараметричні статистики/Розподіли
- •4.1 Перевірка гіпотез про закони розподілу випадкових величин
- •4.2 Побудова гістограми розподілу
- •Розділ 5 Модуль Multiple Regression – Множинна регресія
- •5.1 Розрахунок коефіцієнтів лінійної множинної регресії
- •5.2 Побудова та розрахунок коефіцієнтів нелінійних регресійних залежностей
- •5.3 Оцінка якості регресійних залежностей
- •5.3.1 Оцінка значущості рівняння та факторів регресії
- •5.3.2 Аналіз залишків
- •5.3.3 Розрахунок кореляційної матриці
- •5.4 Швидка побудова графіків парної регресії та їх інтерактивний аналіз за допомогою засобу “пензель”
- •Література
5.3 Оцінка якості регресійних залежностей
Якість побудованих рівнянь регресії можна оцінити за допомогою розрахункових показників, до яких відносяться:
– коефіцієнт множинної кореляції (позначається як Multiple R чи просто R);
– коефіцієнт множинної детермінації (позначається як R2 чи RI);
– стандартна помилка оцінювання регресії (позначається як Standard error of estimate чи Std. Error of estimate).
Результати розрахунку цих показників виводяться в процесі побудови регресійної моделі у верхній частині діалогового вікна Multiple Regression Results – Результати множинної регресії (рис. 5.3) та дублюються у верхній частині вікна результатів розрахунків коефіцієнтів регресії (рис. 5.4).
Регресійна модель буде кращою серед декількох розглянутих, якщо їй відповідають більші значення коефіцієнтів множинної кореляції та множинної детермінації та менші значення стандартної помилки оцінювання регресії.
5.3.1 Оцінка значущості рівняння та факторів регресії
Для перевірки значущості рівняння регресії та адекватності рівняння регресії вихідним даним використовується F - критерій Фішера (F). Розрахунковий критерій Фішера виводиться у правому стовпчику верхньої частині діалогового вікна Multiple Regression Results – Результати множинної регресії (рис. 5.3) та для нашого прикладу дорівнює F=13.757.
Нижче значення F виводиться кількість ступенів волі меншої дисперсії та кількість ступенів волі більшої дисперсії (рядок df). У нашому прикладі відповідно 3 та 36.
Ще нижче виводиться гранична імовірність прийняття гіпотези про адекватність регресійної моделі вихідним даним (у нашому прикладі p=0.000004).
У випадку, коли розрахункове значення граничної імовірності прийняття гіпотези про адекватність регресійної моделі вихідним даним не перевищує прийнятий рівень значущості (зазвичай 0.1 чи 0.05), регресійна модель вважається значущою та адекватною вихідним експериментальним (статистичним) даним.
Для розглянутого прикладу при рівні значущості 0.05 лінійну множинну регресійну модель можна вважати значущою та адекватною вихідним даним, так як p=0.000004 < 0.05.
Для перевірки значущості факторів регресії використовують t - критерій Стьюдента. Розрахункове значення t - критерію виводиться у відповідних рядках електронної таблиці результатів розрахунків коефіцієнтів регресії (рис. 5.4) у стовпчику t-value. У стовпчику p-level для факторів регресії виводиться значення граничної імовірності прийняття гіпотези про значущість коефіцієнта при відповідному факторі у рівнянні регресії.
Якщо розрахункове значення граничної імовірності p-value не перевищує прийнятий рівень значущості (0.1 чи 0.05), регресійний коефіцієнт при факторі у рівнянні регресії, а, відповідно, і сам фактор вважається значущим.
Для розглянутого прикладу моделі лінійної множинної регресії при рівні значущості 0.05 фактори Х2 та Х3 вважаємо значущими (для них відповідно 0.0276 < 0.05 та 0.0290 < 0.05), а фактор Х1 є незначущим (0.877 > 0.05).
Рисунок 5.13 – Вибір рівня значущості |