- •7 Регресійний аналіз
- •7.1 Попередній аналіз даних
- •7.2 Припущення, які використовує регресійний аналіз
- •7.3 Вибір вигляду функції для монотонних процесів
- •7.4 Метод найменших квадратів для оцінки параметрів функції регресії
- •Властивості регресії
- •7.5 Оцінка якості моделі
- •7.6 Критерій Фішера для оцінки адекватності моделі
- •7.7 Перевірка значущості коефіцієнтів регресії
- •7.8 Функції Excel для побудови регресійних залежностей
- •Розв’язання
- •7.9 Парна регресія в матричній формі
- •7.10 Метод найменших квадратів при оцінюванні параметрів поліномів
- •Розв’язання
- •7.11 Множинний регресійний аналіз
- •7.11.1 Матричний спосіб оцінки параметрів множинної регресії
- •7.11.2 Перевірка значущості коефіцієнтів регресії
- •7.11.3 Перевірка якості моделі. Скоригований коефіцієнт детермінації
- •7.11.4 Парна й часткова кореляції
- •Розв’язання.
- •7.12 Методи побудови багатофакторної регресійної моделі
- •7.12.1 Вибір "найкращого" рівняння регресії
- •7.12.2 Метод усіх можливих регресій
- •7.12.3 Метод виключень
- •7.12.4 Кроковий регресійний метод
- •Питання і завдання до розділу 7
- •Лабораторна робота Тема. Парний регресійний аналіз
- •Лабораторна робота Тема. Множинний регресійний аналіз
- •8 Дисперсійний аналіз
- •8.1 Однофакторний дисперсійний аналіз
- •Розв’язання.
- •Питання і завдання до розділу 8
- •Лабораторна робота Тема. Однофакторний дисперсійний аналіз
- •9 Ранговий аналіз
- •9.1 Коефіцієнт рангової кореляції Кенделла (Кендалла)
- •9.2 Коефіцієнт рангової кореляції Спірмена
- •Розв’язок.
- •9.3 Коефіцієнт конкордації
- •Питання і завдання до розділу 9
7.12.3 Метод виключень
Цей метод більш економічний, ніж метод всіх регресій. Загальний алгоритм методу складається з 5 етапів.
1 На першому етапі розраховується регресійне рівняння, що включає всі фактори, які входять у модель. Якщо було відібрано р факторів, то базове регресійне рівняння має вигляд
![]()
2 На другому етапі обчислюється величина часткового F-критерію для кожного фактора.
3 Менше значення часткового F-критерію, що порівнюється із заздалегідь вибраним критичним значенням Fkp, позначається Fl.
4 Якщо Fl < Fkp , то відповідний фактор виключається з рівняння. Проводиться новий розрахунок регресійного рівняння вже без цього виключеного фактора й знову переходять до етапу 2.
5 Якщо Fl > Fkp, то регресійне рівняння залишають без змін.
У статистиці метод виключень є досить поширеним, оскільки дозволяє відразу побачити всі фактори в моделі.
У деяких комп'ютерних програмах замість часткового F-критерію використовується t-критерій, що є коренем квадратним від значення часткового F-критерію. Крім того, іноді використовується термін "F–критерій для виключення", ідентичний терміну "частковий F–критерій".
Частковий F–критерій побудований на порівнянні приросту факторної дисперсії, обумовленої впливом додатково включеного фактору, із залишковою дисперсією на один ступінь волі по регресійній моделі в цілому. У загальному вигляді для фактору xi частковий F–критерій визначається як
,
де
– коефіцієнт множинної детермінації
для моделі з повним набором факторів,
– той же показник, але без включення в
модель фактору xi,
n– число
спостережень, m –
число параметрів моделі (без
вільного члена).
Фактичне значення частки F–критерію порівнюється з табличним при рівні значущості α та кількості ступенів вільності k1= 1 та k2=n-m-1. Якщо фактичне значення Fxi перевищує Fkp(α; k1; k2), то додаткове включення фактора xi в модель статистично виправдане і коефіцієнт регресії аі при факторі xi статистично значущий. Якщо ж фактичне значення Fxi менше табличного, то додаткове включення в модель фактора xi не збільшує істотно частку поясненої варіації ознаки Y, отже, недоцільне його включення в модель; коефіцієнт регресії при даному факторі в цьому випадку статистично незначущий.
7.12.4 Кроковий регресійний метод
Кроковий регресійний метод діє у зворотному порядку порівняно з методом виключень. Фактори по черзі включаються в модель до того часу, поки вона не стане задовільною. Порядок включення вибирається за допомогою коефіцієнта кореляції як міри важливості факторів (незалежних змінних), які ще не включені в модель. Кроковий регресійний метод також зручно подати у вигляді узагальненого алгоритму, що умовно розіб'ємо на три етапи.
Алгоритм методу:
1
Спочатку обирається фактор
, що має найбільший коефіцієнт кореляції
з Y
(нехай це буде змінна
Х1).
Будується регресійне рівняння з однією
незалежною змінною
. Після цього перевіряємо, чи значуща
вона за частковим F-критерієм.
Якщо ні, то приймаємо
і припиняємо процес. Якщо так, то шукаємо
другу змінну, що має найменший коефіцієнт
кореляції з Y,
яку варто включити в модель. Нехай це
буде змінна X2.
2 Будується нове рівняння регресії
.
Аналізується зміна коефіцієнта кореляції R2 тa розраховуються часткові F-критерії для кожного фактора. Серед них обирається найменше його значення й порівнюється із заздалегідь вибраним критичним значенням F-розподілу. Відповідно до результатів перевірки змінна або залишається в моделі, або відкидається.
Може відбутися так, що фактор, який на певному із етапів був найкращим для включення, потім з моделі вилучається.
3 Після цього модель перераховується залежно від факторів, які залишилися.
Варто відмітити, що на першому етапі, крім перевірки за коефіцієнтом кореляції, фактор-претендент на включення може перевірятися також за частковим F-критерієм. Якщо він відповідає йому, то фактор включають у модель, якщо ні, то переходять до аналізу наступного фактора.
Процес побудови моделі припиняється, якщо ніякий фактор, що знаходиться в поточному рівнянні, не вдається виключити, а новий претендент на включення не відповідає частковому F-критерію. Кроковий метод є найпоширенішим на практиці.
