
- •Указания по использованию компьютерной техники при решении заданий
- •1. Кодировка экономической информации
- •2. Корреляционно-регрессионный анализ
- •2.1. Этапы корреляционно-регрессионного анализа
- •2.1.1. Сбор данных
- •2.1.2. Корреляционный анализ
- •2.1.3. Расчет параметров и построение регрессионных моделей
- •2.1.4. Оценка статистической значимости модели
- •2.2. Методика построения моделей
- •2.2.1. Метод исключения
- •2.2.2. Шаговый метод
- •2.2.3. Инструментарий Microsoft Excel 2000 для решения множественной регрессионной задачи
- •3. Оптимизационный анализ
- •3.1. Особенности загрузки оптимизатора
- •3.2. Инструментальные средства Microsoft Excel 2000
- •4. Прогнозирование на основе трендов
- •4.1. Сущность и виды трендов
- •4.2. Инструментарий прогнозирования в Microsoft Excel 2000
- •4.2.1. Основные Excel-инструменты для работы с динамическими рядами
- •4.2.2. Технология построения трендов в Microsoft Excel 2000
- •4.2.3. Анализ полученных трендов и прогнозирование
- •Условия контрольных и практических заданий
- •Тестовые задания
- •Список рекомендуемой литературы
- •Учебное издание
- •Родченко Владимир Борисович
2.2. Методика построения моделей
Раcммотрим те из методов поиска наилучшего регрессионного уравнения, которые признаны наилучшими в условиях применения ЭВМ в случае множественного регрессионного анализа (этот вид анализа считается в [1] основным инструментом маркетолога). Если факторов несколько, может быть получено несколько различных уравнений. Задача исследователя - отыскать наилучшее уравнение. Процедуры поиска наилучшей модели весьма разнообразны, связаны с большим количеством вычислений и сильно зависят от числа факторов, влияние которых на отклик хотят исследовать. Любой метод выглядит как проведение серии сравнений для выбора полезных факторов.
Метод исключения и шаговый метод признаются наиболее эффективными при использовании ЭВМ. Поясним их.
2.2.1. Метод исключения
Метод исключения исследует не все, а только наилучшие регрессионные уравнения, в чем и состоит его экономичность. На первом этапе рассчитывается уравнение, включающее все . независимые переменные. Затем, рассматривая корреляционную матрицу, находят в ней независимую переменную, имеющую самую слабую (по модулю) связь с зависимой, (т. е. с наименьшим по модулю значением коэффициента корреляции), и исключают ее из уравнения. Заново пересчитывают уравнение с меньшим числом независимых переменных. Если по сравнению с предыдущим расчетом значимость уравнения в целом (Fp) и коэффициент детерминации (R2) повысились, то исключение сделано правильно. Далее отыскивают в корреляционной матрице следующую независимую переменную с наименьшим значением коэффициента корреляции и поступают аналогичным образом. Исключения независимых переменных (по одной) и пересчеты уравнений продолжают до тех пор, пока не обнаружат снижение значимости уравнения и доли объясненной вариации (R2) по сравнению с последним предшествующим расчетом. Это служит сигналом нецелесообразности последнего исключения.
2.2.2. Шаговый метод
Шаговый метод - это попытка прийти к тем же результатам, действуя в противоположном направлении, начиная с однофакторной модели. При этом, как и в предыдущем методе, обязательно ориентируются на данные корреляционной матрицы. Т. е. при шаговом методе на первом шаге расчета в уравнение включают не все, а только один фактор с наибольшим по модулю значением коэффициента корреляции между независимой и зависимой переменной. На каждом следующем шаге из оставшихся не включенными в уравнение независимых переменных в предыдущую модель добавляют только одну независимую переменную, наиболее связанную с зависимой, и заново пересчитывают все параметры регрессии. После пересчета сравнивают полученные оценки нового уравнения с оценками предшествующего шага. Так продолжают до тех пор, пока не получат наилучшее уравнение с наибольшими расчетными значениями F и R .
При поддержке множественного регрессионного анализа средствами Excel можно отслеживать очередность исследовательских шагов, записывая для каждого шага: номер шага, набор независимых переменных, вид уравнения, главные оценочные данные: коэффициенты Фишера (F расчетный и F критический) и детерминации R2.
Умение использовать t-статистику служит дополнительным резервом для повышения эффективности поиска наилучшего уравнения и контроля предположений об исключении независимой переменной из уравнения. В некоторых регрессионных программах, базирующихся на методе исключения, может использоваться не (-критерий, а частный F-критерий. (-критерий представляет собой корень квадратный из величины частного F-критерия, (F=t2). Таким образом, возведя в квадрат (-критерий, можно получить серию частных значений F для отдельных параметров уравнения и проверить решение об исключении бесполезной переменной, принятое другим способом.
Для корректного использования t-статистики необходимо иметь при себе публикуемую статистическую таблицу значений t-критерия Стьюдента (приложена в конце главы). Критическое значение t выбирается из этой таблицы и сравнивается с расчетным.
t-статистика разработана для малых выборок, т. е. выборок, состоящих из сравнительно небольшого числа наблюдений - одного-двух десятков. Распределение Стьюдента не очень значительно отличается от нормального. Это отличие тем меньше, чем больше п, и при п>30 практически быстро исчезает.