- •Указания по использованию компьютерной техники при решении заданий
- •1. Кодировка экономической информации
- •2. Корреляционно-регрессионный анализ
- •2.1. Этапы корреляционно-регрессионного анализа
- •2.1.1. Сбор данных
- •2.1.2. Корреляционный анализ
- •2.1.3. Расчет параметров и построение регрессионных моделей
- •2.1.4. Оценка статистической значимости модели
- •2.2. Методика построения моделей
- •2.2.1. Метод исключения
- •2.2.2. Шаговый метод
- •2.2.3. Инструментарий Microsoft Excel 2000 для решения множественной регрессионной задачи
- •3. Оптимизационный анализ
- •3.1. Особенности загрузки оптимизатора
- •3.2. Инструментальные средства Microsoft Excel 2000
- •4. Прогнозирование на основе трендов
- •4.1. Сущность и виды трендов
- •4.2. Инструментарий прогнозирования в Microsoft Excel 2000
- •4.2.1. Основные Excel-инструменты для работы с динамическими рядами
- •4.2.2. Технология построения трендов в Microsoft Excel 2000
- •4.2.3. Анализ полученных трендов и прогнозирование
- •Условия контрольных и практических заданий
- •Тестовые задания
- •Список рекомендуемой литературы
- •Учебное издание
- •Родченко Владимир Борисович
2.2.3. Инструментарий Microsoft Excel 2000 для решения множественной регрессионной задачи
В русифицированной версии EXCEL 97 для корреляционно-регрессионного анализа используются средства специального статистического модуля. Microsoft заказывала разработку этого модуля фирме, специализирующейся на программном обеспечении математико-статистических задач. Модуль включает в себя два вида средств математико-статистического анализа: функции и инструменты. Мы отдаем предпочтение сложным инструментам, обеспечивающим более высокий уровень автоматизации расчетов, комплексности, графического моделирования и организации результатов. Однако некоторые пользователи в определенных случаях вполне обоснованно могут предпочесть функции.
Множественный корреляционно-регрессионный анализ в основном ориентирован на средства дополнительного пакета Анализ данных. Активизация команды Сервис Анализ данных открывает окно Инструменты анализа, предоставляющее 19 статистических инструментальных средств. Среди них - Корреляция и Регрессия, непосредственно и эффективно поддерживающие простой и множественный корреляционно-регрессионный анализ
Эти сложные инструменты доступны в том случае, если они предварительно загружены через команду Сервис / Надстройки. В открывшемся окне дополнений следует пометить флажок слева от позиции пакет анализа, и затем щелкнуть по кнопке ОК. После повторного обращения к команде Сервис, позиция Анализ данных появится в конце меню. Если же команда Анализ данных и в этом случае отсутствует в меню Сервис, то необходимо запустить программу установки Microsoft Excel. После установки пакета анализа его необходимо активизировать с помощью команды Надстройки.
С помощью инструмента Корреляция, можно получить корреляционную матрицу парных коэффициентов за один прием. Для этого, после выбора Сервис/Анализ данных/Корреляция, следует определить в качестве входного все поле имеющихся исходных данных, корреляционные связи которых изучают. Затем следует уточнить с помощью флажков, по столбцам или по строкам размещены переменные. Если поле содержит заголовочную строку (или столбец), то в диалоге активизируют графический флажок Метки (Labels). После выбора графической кнопки выполнения (ОК), корреляционная матрица автоматически выводится на новый лист той же электронной таблицы, начиная с клетки А1. Если матрицу желают вывести на какой-либо конкретный лист и начиная с клетки, определяемой пользователем, то делают соответствующие установки в окне «Выходной интервал» диалогового окна инструмента Корреляция.
Вид корреляционной матрицы, полученной в результате определения входного поля представлен в таблице:
|
А |
B |
C |
D |
E |
1 |
|
Х1 |
Х2 |
Х3 |
Х4 |
2 |
X1 |
1 |
|
|
|
3 |
Х2 |
k12 |
1 |
|
|
4 |
Х3 |
k13 |
k21 |
1 |
|
5 |
Х4 |
k14 |
k22 |
k34 |
1 |
Можно осуществить преобразование корреляционной матрицы копированием в нее формулы для диагностики связей по модулю коэффициента корреляции.
Вспомогательная диагностирующая формула.
=ЕСЛИ(АВS(В3)<0,1 ;"Нет связи";ЕСЛИ(АВS(В3)<0,3;"Слабая";
ЕСЛИ(АВS(В3)<0,5;"Умеренная";ЕСЛИ(АВS(В3)<0,7;"Заметная";
ЕСЛИ(АВS(В3)<0,9;"Сильная";ЕСЛИ(АВS(В3)<=0,99;
"Весьма сильная";"Полная"))))))
Эта формула (для одной клетки) преобразует числовые значения коэффициентов корреляции, полученные в корреляционной матрице, в их текстовые смысловые эквиваленты. Преобразование осуществляется по модулю коэффициента корреляции. При ручном копировании формулы следует соблюдать следуют требования:
1. Матрица должна быть автоматически записана на новый рабочий лист по умолчанию, т е. начиная с клетки А1.
2. Матрица должна быть скопирована на тот же лист, ниже оригинала на одну-две строки, без смешения столбцов. Оригинал матрицы перемещать нельзя. Оригинал и копия существуют одновременно.
3. Открыть рабочую книгу, в известной клетке которой содержится оригинал диагностирующей формулы одним пробелом перед знаком равенства. Занести формулу в буфер для копирования.
4. Перейти в окно той книги и на тот ее лист, где создана и скопирована оригинальная корреляционная матрица.
5. Установить курсор в ту клетку матрицы-копии, куда скопировано значение клетки ВЗ из оригинала матрицы. Выполнить вставку из буфера (щелкнуть по пиктограмм вставки)
6. В режиме редактирования убрать пробел перед знаком равенства в формуле, нажать Еntеr. Выбрать клетку формулы и скопировать ее ("протянуть") по вертикали до последней строки матрицы, а затем каждую клетку - по горизонтали, не копируя на диагональные клетки с единицами. Можно копировать иначе.
Числовая и текстовая матрицы содержат информацию для принятия решений of отборе факторов и планирования дальнейших вычислений (см. приведенные выше матрицы 1 и 3). Числовую корреляционную матрицу следует форматировать до 2-3. десятичных знаков, т. к. для принятия решений не требуется большего количества знаков.
Работая непосредственно с Мicrosoft Excel 2000, вы можете получать информацию о параметрах этого окна из стандартной справки.
Входной интервал Y — здесь требуется задать состоящий из одного столбца диапазон анализируемых зависимых данных.
В нашей задаче это столбец значений Y. Такая установка одинакова для всех четырех уравнений, запланированных нами к исследованию.
Входной интервал Х - здесь требуется определить диапазон подлежащих анализу / смежных рядов независимых данных (не более 16 независимых). Программа разместит независимые переменные заданного диапазона слева направо.
Метки - здесь требуется установка флажка, если первая строка или первый столбец входного интервала содержит заголовки. Если заголовков нет, то флажок надо снять.
Рекомендуется всегда включать метки во входной интервал, и поэтому не забывать щелкать по флажку "метки". Если мы забудем включить этот флажок при наличии меток, то вместо расчета получим прерывание и сообщение "Входной интервал содержит нечисловые данные".
Уровень надежности - по умолчанию применяется уровень 95%. Установите флажок, если хотите включить в выходной диапазон дополнительный уровень, а в поле (рядом) введите уровень надежности, который будет использован дополнительно к применяемому.
Мы решаем задачу на уровне, предложенном по умолчанию. Однако итоговое уравнение можно повторно просчитать на уровне 99%, чтобы по значению F выяснить, не будет ли оно значимым и на более надежном уровне.
Константа - ноль — этот флажок необходимо пометить только в том случае, если вы хотите получить уравнение без свободного члена а0, чтобы линия регрессии прошла через начало координат.
Выходной диапазон - здесь требуется определить левую верхнюю ячейку выходного диапазона. Необходимо минимум семь столбцов для итогового диапазона, который будет включать в себя: результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.
Целесообразно воспользоваться этой возможностью, если задача небольшая, например, однофакторная, и вы хотите видеть на одном рабочем листе и данные, и корреляционную матрицу, и регрессию. В случае же сложной задачи, как в нашем примере, такое уплотнение материалов может создать еще большие сложности в пользовании ими. Поэтому при решении задачи 9, где требуется получить четыре результата исследования уравнений, лучше воспользоваться возможностью размещения каждого из четырех результатов на новом рабочем листе.
Новый лист — здесь требуется установить переключатель для открытия нового листа е книге под результаты анализа, начиная с ячейки А1. Можно ввести имя нового листа в поле напротив переключателя.
Новая книга - этот переключатель необходимо активизировать только в случае, если необходимо открыть новую книгу и вставить на ее первом листе результаты анализа, начиная с ячейки А1.
Остатки - установкой этого флажка заказывается включение остатков в выходной диапазон.
Советуем активизировать этот и все описанные ниже флажки диалогового окна для получения максимума информации в ходе сложного исследования. Конечно, в этом случае мы заняли позицию "перестраховщиков" и тех статистиков, которые любят видеть все, чтобы "чего-то не упустить". Выполняя серьезное маркетинговое исследование, и готовя к распечатке обстоятельный отчет по нему, вы, скорее всего, будете поступать так же. Однако, в ситуации дефицита времени, рискуя "что-то упустить" из внимания, можно все же ограничиться заказом графика остатков и (обязательно!) графика подбора.
Стандартизированные остатки — установите флажок для включения стандартизированных остатков в выходной диапазон.
График остатков — чтобы построить диаграмму остатков для каждой независимой переменной, установите этот флажок.
График подбора — это важнейший график, а точнее серия графиков, показывающих насколько хорошо теоретическая линия регрессии (т.е. предсказания) подобрана к наблюдаемым данным. Строится для каждой независимой отдельно. Активизируйте этот флажок, если желаете получить эту графическую информацию.
График нормальной вероятности - установите флажок для построения диаграммы нормальной вероятности.
Каждый график подбора остатка показывает, насколько теоретические значения Y, вычисленные как отклики отдельного фактора, совпадают с исходными (наблюденными) значениями Y. Если, например, красные точки теоретических (прогнозных) значений Y хорошо накладываются на синие точки исходных данных, это визуально свидетельствует об удачном уравнении (при условии отсутствия закономерностей в остатках, т.е. их случайном разбросе).
Когда переменных много, сначала полезно построить линейную диаграмму всех исходных данных, чтобы попытаться увидеть некоторые сильные или функциональные зависимости. Если масштабы данных весьма различны, то строят несколько диаграмм с разными шкалами. Управление шкалами Х и Y выполняется через опции X-Axis и Y-Axis. Линейная диаграмма исходных данных к задаче 9 визуализирует имеющиеся связи. Это облегчает познание связей, делая их зримыми.
Важно: когда при расчете множественной регрессии в окне Регрессия заказан График подборки, то по числу независимых переменных автоматически выводится серия точечных графиков корреляции, на которые вторым цветом нанесены точки теоретических значений отклика.
Рассмотрев все созданные исследовательские расчетно-графические материалы, делают окончательные выводы о пригодности модели (для предсказания неизвестных значений зависимой переменной) с точки зрения здравого смысла, т. е. знания о сущности моделируемых явлений, поскольку любая модель - это загрубление данных.
