Автоматизация процесса выбора переменных

Если вы не хотите тратить время на глубокие размышления над исследуемой ситуацией и предпочитаете автоматизировать процесс выбора Х-переменных на основе имеющихся у вас данных, в вашем распоряжении есть немало способов достижения требуемого результата. К сожалению, “наилучшего” во всех отношениях способа автоматизации выбора переменных не существует. Ученые продолжают поиск такого способа, однако уже сейчас имеются достаточно хорошие автоматические методы, позволяющие получить относительно компактный перечень Х-переменных, обеспечивающих вполне качественное прогнозирование Y.

Наилучшим методом автоматического выбора переменных является анализ всех подмножеств Х-переменных. Если, например, вы располагаете тремя независимыми Х-переменными, из которых вам нужно сделать свой выбор, тогда, как показано в табл. 12.2.8, необходимо исследовать восемь подмножеств этих переменных.

Таблица 12.2.8. Список всех возможных подмножеств Х-переменных для k=3

1	Пустое множество (для прогнозирования Y можно использовать только )
2	Х₁
3	Х₂
4	Х₃
5	Х₁Х₂
6	Х₁Х₃
7	Х₂Х₃
8	Х₁ Х₂ Х₃

Если вы располагаете десятью Х-переменными, придется исследовать уже 1024 (2^k) различных подмножеств. Даже если у вас есть возможность вычислить такое количество регрессий, как вы узнаете, какое из подмножеств является наилучшим? Ученые-статистики предложили ряд технических методов, основанных на формулах, которые учитывают как дополнительную информацию, содержащуюся в более крупных подмножествах, так и дополнительные сложности оценки.

Один из широко практикуемых подходов называется пошаговым выбором. На каждом шаге переменная либо добавляется в список, либо удаляется из списка — в зависимости от своей “полезности”. Этот процесс продолжается до тех пор, пока список переменных не стабилизируется. Эта процедура выполняется быстрее, чем анализ всех подмножеств переменных, но в некоторых случаях он может не привести к нужному результату. Вот некоторые подробности, касающиеся процедуры пошагового выбора.

Инициализация. Существует ли такая Х-переменная, которая помогает объяснить Y? Если нет, остановить процедуру пошагового выбора и сообщить о том, что полезных Х-переменных обнаружить не удается. Если же такую переменную удалось обнаружить, поместите эту наиболее полезную Х-переменную в список (это одна из тех переменных, которые характеризуются наибольшим абсолютным значением корреляции с Y).
Шаг включения переменной. Проанализируйте все Х-переменные, не включенные в список. Рассмотрите, в частности, ту Х-переменную, которая в наибольшей мере дополнительно объясняет Y. Если это объяснение кажется вам достаточно важным, включите соответствующую X- переменную в список.
Шаги удаления переменных. Имеется ли в созданном списке такая X- переменная, которая в данный момент (после пополнения списка новыми переменными) кажется вам бесполезной? Если такая переменная в списке имеется, удалите ее, однако учтите, что, возможно, ее придется включить в список в дальнейшем. Продолжайте удалять бесполезные Х-переменные до тех пор, пока их не останется в списке.
Повторное выполнение до завершения процедуры. Повторяйте действия, указанные в пп. 2 и 3 до тех пор, пока в список нечего будет добавить и нечего будет удалить.

Конечный результат процедуры пошагового выбора, как правило, представляет собой весьма полезный и достаточно компактный список независимых (“объясняющих”) Х-переменных, который можно использовать в множественном регрессионном анализе для объяснения Y.

<<< < Предыдущая 1 2 34 / 94 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.202574.83 Кб0Мистецтво 1 клас.docx
#
09.02.2015114.37 Кб12мифы.docx
#
20.04.20198.74 Mб116МКонспект_по_Деталям_Машин.doc
#
09.11.20192.51 Mб31ММТП 2011 - 1.doc
#
08.05.20192 Mб6МНК (Л.И. и Т.В.) итоговая 7.doc
#
01.07.20254.31 Mб0Множест. регрессия 2 (теория).docx
#
01.07.2025609.08 Кб0МОБС 24.09.14..docx
#
01.07.2025537.11 Кб0МОБС 28.09.14..docx
#
12.11.2019384.51 Кб14Моделирование ЦУ на ПЛИС.doc
#
07.07.2019471.04 Кб28модернизация РН Протон.doc
#
09.02.2015126.46 Кб272модудь 2 задача 3.doc