Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

КОНСПЕКТ ЛЕКЦИЙ КОДЭИ

.pdf
Скачиваний:
110
Добавлен:
14.03.2016
Размер:
28.31 Mб
Скачать

Метод обратного исключения

В отличие от метода прямого отбора в методе обратного исключения процесс начинается с полной модели, в которую включаются все доступные переменные. Эта процедура также содержит три шага:

1.Решается задача регрессии с помощью полной модели, в которой присутствуют все доступные переменные.

2.Для каждой переменной в модели вычисляется частная F-статистика. Предпочтение отдается переменной, для которой значение частной F- статистики будет наименьшим (Fmin).

12.03.13 Доцент С.Т. Касюк

17

3 Проводится тест значимости Fmin. Если статистика Fmin не указывает на достаточно высокую значимость, то связанная с ней переменная исключается из модели и происходит возврат к шагу 2. Если статистика Fmin указывает на высокую значимость, то алгоритм останавливается и формируется отчет о текущем состоянии модели. Если это первый проход алгоритма, то мы имеем полную модель и, следовательно, все доступные переменные являются значимыми. Если проход не первый, то модель уменьшается на одну или несколько переменных.

12.03.13 Доцент С.Т. Касюк

18

12.03.13 Доцент С.Т. Касюк

19

Метод последовательного отбора

Метод последовательного отбора представляет собой модификацию метода прямого отбора. Переменные, которые были введены в модель ранее, в процессе прямого отбора могут рассматриваться как незначащие, пока другие переменные не будут ведены в модель. Пошаговая процедура проверяет эту возможность путем выполнения на каждом этапе частного F-теста, используя частную сумму квадратов для каждой переменной в модели. Переменные с наименьшими частными F-статистиками удаляются из модели. Процедура прекращается, когда переменные, которые могут быть введены в модель или удалены из нее, заканчиваются.

12.03.13 Доцент С.Т. Касюк

20

12.03.13 Доцент С.Т. Касюк

21

12.03.13 Доцент С.Т. Касюк

22

Ограничения применимости регрессионных моделей

В настоящее время регрессионные модели являются одним из наиболее популярных методов решения различных классов задач. Эта популярность обусловлена тем, что регрессия сочетает в себе как высокую эффективность и универсальность, так и относительную простоту реализации, понимания интерпретации пользователем. Кроме того, аппарат регрессионного анализа включает множество методов оценки точности и достоверности полученных результатов.

12.03.13 Доцент С.Т. Касюк

24

Однако, как и большинство других статистических методов, линейную регрессию нельзя применять без учета особенностей конкретной задачи. Taкие особенности могут порождать ограничения применимости регрессионных игнорирование которых часто приводит к снижению точности результатов и к их полной недостоверности.

12.03.13 Доцент С.Т. Касюк

25

Ограничения, которые следует учитывать при построении регрессионной модели:

1.Никакая единственная независимая переменная за редким исключением не в состоянии хорошо объяснить изменения зависимой переменной.

2.Могут существовать несколько одинаково хороших и в то же время противоречивых регрессионных моделей.

3.Линейная форма связи примитивна.

4.Наличие на входе модели переменных, сильно коррелированных друг с другом, приводит к проблеме мультиколлинеарности.

12.03.13 Доцент С.Т. Касюк

26