Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
метод ИСМ_ практика.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
846.85 Кб
Скачать

2.2. Методика построения моделей

Раcммотрим те из методов поиска наилучшего регрессионного уравнения, которые признаны наилучшими в условиях применения ЭВМ в случае множественного регрессионного анализа (этот вид анализа считается в [1] основным инструментом маркетолога). Если факторов несколько, может быть получено несколько различных уравнений. Задача исследователя - отыскать наилучшее уравнение. Процедуры поиска наилучшей модели весьма разнообразны, связаны с большим количеством вычислений и сильно зависят от числа факторов, влияние которых на отклик хотят исследовать. Любой метод выглядит как проведение серии сравнений для выбора полезных факторов.

Метод исключения и шаговый метод признаются наиболее эффективными при использовании ЭВМ. Поясним их.

2.2.1. Метод исключения

Метод исключения исследует не все, а только наилучшие регрессионные уравнения, в чем и состоит его экономичность. На первом этапе рассчитывается уравнение, включающее все . независимые переменные. Затем, рассматривая корреляционную матрицу, находят в ней независимую переменную, имеющую самую слабую (по модулю) связь с зависимой, (т. е. с наименьшим по модулю значением коэффициента корреляции), и исключают ее из уравнения. Заново пересчитывают уравнение с меньшим числом независимых переменных. Если по сравнению с предыдущим расчетом значимость уравнения в целом (Fp) и коэффициент детерминации (R2) повысились, то исключение сделано правильно. Далее отыскивают в корреляционной матрице следующую независимую переменную с наименьшим значением коэффициента корреляции и поступают аналогичным образом. Исключения независимых переменных (по одной) и пересчеты уравнений продолжают до тех пор, пока не обнаружат снижение значимости уравнения и доли объясненной вариации (R2) по сравнению с последним предшествующим расчетом. Это служит сигналом нецелесообразности последнего исключения.

2.2.2. Шаговый метод

Шаговый метод - это попытка прийти к тем же результатам, действуя в противоположном направлении, начиная с однофакторной модели. При этом, как и в предыдущем методе, обязательно ориентируются на данные корреляционной матрицы. Т. е. при шаговом методе на первом шаге расчета в уравнение включают не все, а только один фактор с наибольшим по модулю значением коэффициента корреляции между независимой и зависимой переменной. На каждом следующем шаге из оставшихся не включенными в уравнение независимых переменных в предыдущую модель добавляют только одну независимую переменную, наиболее связанную с зависимой, и заново пересчитывают все параметры регрессии. После пересчета сравнивают полученные оценки нового уравнения с оценками предшествующего шага. Так продолжают до тех пор, пока не получат наилучшее уравнение с наибольшими расчетными значениями F и R .

При поддержке множественного регрессионного анализа средствами Excel можно отслеживать очередность исследовательских шагов, записывая для каждого шага: номер шага, набор независимых переменных, вид уравнения, главные оценочные данные: коэффициенты Фишера (F расчетный и F критический) и детерминации R2.

Умение использовать t-статистику служит дополнительным резервом для повышения эффективности поиска наилучшего уравнения и контроля предположений об исключении независимой переменной из уравнения. В некоторых регрессионных программах, базирующихся на методе исключения, может использоваться не (-критерий, а частный F-критерий. (-критерий представляет собой корень квадратный из величины частного F-критерия, (F=t2). Таким образом, возведя в квадрат (-критерий, можно получить серию частных значений F для отдельных параметров уравнения и проверить решение об исключении бесполезной переменной, принятое другим способом.

Для корректного использования t-статистики необходимо иметь при себе публикуемую статистическую таблицу значений t-критерия Стьюдента (приложена в конце главы). Критическое значение t выбирается из этой таблицы и сравнивается с расчетным.

t-статистика разработана для малых выборок, т. е. выборок, состоящих из сравнительно небольшого числа наблюдений - одного-двух десятков. Распределение Стьюдента не очень значительно отличается от нормального. Это отличие тем меньше, чем больше п, и при п>30 практически быстро исчезает.