Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОЭИ_мет_1_2_4.doc
Скачиваний:
4
Добавлен:
02.09.2019
Размер:
754.18 Кб
Скачать

Контрольные вопросы:

  1. Что представляет собой математическая модель решения задач оптимизации?

  2. Что означают и как взаимосвязаны термины: критерий оптимизации, допустимые решения, оптимальное решения?

  3. Какие имеются варианты назначения целевой функции?

  4. Как вводятся ограничения? Для каких ячеек допускается вводить ограничение целочисленности?

  5. Что показывают параметры «Нормированная стоимость» и «Теневая цена» в отчете по устойчивости

  6. Составьте математическую модель одной из задач (по указанию преподавателя).

Лабораторная работа № 4

Средства регрессионного анализа в ms Excel

Цель работы: научиться проводить анализ взаимосвязи зависимой и независимых переменных, определять коэффициенты линейной, экспоненциальной и полиномиальной регрессии, оценивать их достоверность, прогнозировать.

Методические рекомендации

Регрессионный анализ — это статистический метод, позволяющий найти уравнение, которое наилучшим образом описывает статистическую зависимость между сериями значений каких-либо величин. В электронных таблицах Excel реализованы три способа регрессионного анализа: 1) инструмент Регрессия из надстройки «Анализ данных»; 2) трендовые модели; 3) статистические функции.

Функция ЛИНЕЙН возвращает коэффициенты линейной регрессии вида и дополнительную регрессионную статистику. В данной формуле: mi — коэффициенты при независимых переменных xi, n — количество независимых переменных, b — константа.

Аргументы функции:

1) известные значения Y — диапазон зависимой переменной;

2) известные значения X — диапазон п независимых переменных;

3) конст = 1, чтобы константа b вычислялась обычным образом;

4) статистика = 1, чтобы выводилась дополнительная регрессионная статистика.

Функция вводится как табличная. Для получения результата выделяется 5 строк (чтобы выводилась дополнительная регрес­сионная статистика) и п + 1 столбцов. Структура результата представлена в таблице:

тп

тп-1

т1

b

 [тп ]

 [тп-1 ]

 [т1 ]

 [b]

R2

 [y]

#н/д

#н/д

#н/д

F

df

#н/д

#н/д

#н/д

SSreg

SSresid

#н/д

#н/д

#н/д

В первой строке таблицы выводятся значения коэффициентов mi и b; во второйсреднеквадратические отклонения коэффициентов при независимых переменных [тi ] и константы [b]; затем располагаются следующие величины:

  • коэффициент детерминированности R2, который изменяется в пределах [0; 1]. Это величи­на, характеризующая степень взаимосвязи между зависимой и независимыми переменны­ми. Качественную оценку взаимосвязи можно провести по шкале Чеддока;

R2

0,1—0,3

0,3—0,5

0,5—0,7

0,7—0,9

0,9—0,99

Характеристика силы связи

слабая

умеренная

заметная

высокая

весьма высокая

  • среднеквадратическое отклонение зависимой переменной [y] ;

  • F-статистика, используемая для оценки достоверности полученного уравнения;

  • число степеней свободы df ;

  • регрессионная SSreg и остаточная SSresid суммы квадратов.

Функция ЛГРФПРИБЛ определяет параметры экспоненциального уравнения регрессии вида и дополнительную регрессионную статистику.

ЛГРФПРИБЛ имеет такие же аргументы, правила ввода и аналогичную структуру результата с функцией ЛИНЕЙН, но в отличие от ЛИНЕЙН во второй строке таблицы результата вместо среднеквадратических отклонений коэффициентов вычисляются их натуральные логарифмы, т.е. ln [тi ] и ln [b].

Функция FРАСП возвращает F-распределение вероятности и используется, чтобы определить, имеют ли два множества данных различные степени разброса результатов. В регрессионном анализе с помощью этой функции оценивается достоверность уравнения — F.

При заполнении аргументов функции FРАСП используются данные полученные с помощью функции ЛИНЕЙН или ЛГРФПРИБЛ:

1) X = F;

2) Степени_свободы1 (числитель степеней свободы) = n;

3) Степени_свободы2 (знаменатель степеней свободы) = df.

Тогда F = 1 – FРАСП (F; n; df )

Функция СТЬЮДРАСП возвращает вероятность для t-распределения Стьюдента. В регрессионном анализе с помощью двустороннего распределения Стьюдента оценивается достоверность коэффициентов — t .

При заполнении аргументов функции СТЬЮДРАСП используются данные полученные с помощью функции ЛИНЕЙН или ЛГРФПРИБЛ:

1) X = t , причем значение t-статистики предварительно вычисляется для каждого коэффициента по формулам:

a) для линейной и полиномиальной регрессии

b) для экспоненциальной регрессии

2) Степени_свободы = df ;

3) Хвосты = 2.

Тогда t = 1 – СТЬЮДРАСП (| t | ; df ; 2)

Инструмент Регрессия используется для нахождения коэффициентов линейной регрессии и оценки их достоверности. При заполнении диалога Регрессия следует:

  1. Входной интервал Y — указать диапазон значений зависимой переменной (1 столбец);

  2. Входной интервал X — указать диапазон значений независимых переменных (до 16 столбцов);

  3. Установить флажки Остатки, График остатков;

  4. Выходной интервал — указать верхнюю левую ячейку для вывода результата.

Результаты регрессионного анализа выводятся в четырех таблицах:

1) Вывод итогов — содержит значения среднеквадратического отклонения Y — [y], коэффициента корреляции Пирсона R, коэффициента детерминированности R2;

2) Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

n

SSreg

SSreg / n

MSreg/MSresid

1 – F

Остаток

df

SSresid

SSresid / df

3) Параметры модели

Коэффи­циенты

Стандартная ошибка

t-статистика

P-значение

Нижние 95%

Верхние 95%

Y-пересечение

b

 [b]

tb

1 – tb

нижняя граница доверительного интервала для b и

mi при уровне значимости 95%

верхняя граница доверительного интервала для b и

mi при уровне значимости 95%

Переменная Х1

m1

 [m1]

tm1

1 – tm1

Переменная Хn

mn

 [mn]

tmn

1 – tm1

4) Вывод остатков — содержит расчетные (предсказанные) значения Y и остатки (разность между расчетным и фактическим Y).

Примечание. Смысл буквенных обозначений в таблицах Дисперсионный анализ и Параметры модели пояснен на стр. 21-22 при рассмотрении статистических функций. Смысл параметров Значимость F и Р-значение — это вероятность того, что уравнение регрессии и коэффициенты не достоверны, т.е. Значимость F = FРАСП (F; n; df ) и Р-значение = СТЬЮДРАСП (| t | ; df ; 2).

Инструмент Регрессия и функция ЛИНЕЙН могут также использоваться для нахождения коэффициентов полиномиальной регрессии. Например, чтобы получить уравнение зависимости y = f (х1, х2) в виде полинома 2-й степени, нужно предварительно в смежных с х1 и х2 столбцах вычислить х12, х22, х1 х2 и рассматривать их как отдельные переменные. Таким образом, полиномиальная регрессия двух независимых переменных приводится к линейной регрессии пяти переменных:

.

В случае парной регрессии, если имеется одна зависимая и одна независимая переменная, применим регрессионный анализ по диаграмме, который заключается в построении линий тренда. Порядок его выполнения:

  1. По исходным данным построить диаграмму. Если независимая переменная (х) является временным рядом или ее значения меняются на фиксированный шаг, то тип диаграммы выбирается Гистограмма, График, С областями. Если значения х меняются на произвольный шаг, то строится Точечная диаграмма.

  1. Выполнить команду Диаграмма — Добавить линию тренда.

  1. В диалоге на закладке Тип выбрать способ аппроксимации (линейный, экспоненциальный, полиномиальный, логарифмический, степенной), а на закладке Параметры задать:

  1. имя линии тренда;

  2. на сколько шагов делать прогноз вперед и назад (если это требуется);

  3. установить флажки Показывать уравнение на диаграмме и Поместить на диаграмму величину R2.

Пример 4.1. Определить, используя соответствующую функцию, уравнение линейной зависимости затрат на ремонт от возраста оборудования и дополнительную регрессионную статистику по данным, расположенным в диапазоне А3:В12. Спрогнозировать по полученному уравнению величину затрат на ремонт для данного возраста оборудования.

Решение:

1) Для вычисления коэффициентов линейной регрессии и дополнительной регрессионной статистики используется функция ЛИНЕЙН, которая возвращает массив результатов. Необходимо поэтому:

  1. выделить 2 столбца, так как одна независимая переменная, и 5 строк (E2:F6);

  2. вставить функцию ЛИНЕЙН и заполнить ее аргументы (см. стр. 21). Диапазон зависимой переменной — В3:В12; диапазон независимой переменной А3:А12;

  3. не нажимая кнопку ОК, нажать комбинацию клавиш Ctrl + Shift + Enter. Диапазон E2:F6 будет заполнен данными (см. рисунок), по которым можно составить линейное уравнение —

2) Для прогнозирования затрат на ремонт (Yпр) нужно подставить имеющиеся значения возраста оборудования (Х) в полученное уравнение (см. формулу и значения на рисунке в столбце С).

Пример 4.2. Оценить степень взаимосвязи, достоверность уравнения и коэффициентов, найденных в примере 4.1.

Решение:

1) Из результатов предыдущего примера видно, что R2 = 0,889. По шкале Чеддока (см. стр. 21) это соответствует высокой силе связи между переменными.

2) Для оценки достоверности уравнения используется величина F = 64,04 (ячейка Е5) и df = 8 (ячейка F5). Результат вычисления достоверности уравнения и формула (см. стр. 22) приведены на рисунке в ячейках F8 и G8.

3) t-статистика для коэффициентов вычисляется в ячейках E11:F11 как отношение значения коэффициента к его среднеквадратическому отклонению.

4) Для оценки достоверности коэффициентов используется t-статистика и df. Результат вычисления достоверности коэффициентов и формула (см. стр. 22) приведены на рисунке в ячейках Е12:G12.

5) Из полученных результатов следует, что уравнение и коэффициенты имеют высокую достоверность, так как значения F и t близки к 1.

Пример 4.3. Построить линейную трендовую модель зависимости затрат на ремонт от возраста оборудования по исходным данным примера 4.1.

Решение:

1) Выделить диапазон А3:В12 и построить точечную диаграмму зависимости затрат на ремонт от возраста оборудования с помощью мастера диаграмм.

2) В меню Диаграмма выбрать команду Добавить линию тренда.

3) В открывшемся окне выбрать тип аппроксимации — линейная и задать параметры линии тренда, как показано на рисунке:

4) В результате на диаграмме появится линия тренда, коэффициент детерминирован­ности R2 и линейное уравнение, совпадающее с полученным в примере 4.1.

Пример 4.4. Определить уравнение линейной регрессии, оценить степень взаимосвязи, достоверность уравнения и коэффициентов (исходные данные примера 4.1), используя инструмент Регрессия.

Решение:

1) Выполнить команду Сервис—Анализ данных—Регрессия и заполнить открывшийся диалог:

2) После нажатия ОК, начиная с ячейки А17, будут выведены 4 таблицы, которые более компактно представлены на рисунке:

3) столбцы F и t с помощью инструмента не выводятся и вычислены дополнительно по формулам F = 1 – Значимость F и t = 1 – Р-значение.

Задания:

I. Создать файл на основе шаблона «ОЭИ_Лаб_4.xlt» (см. приложение 1). На листе «Задача 1» даны производительность и цена различных моделей оборудования. Требуется провести регрессионный анализ данных по соответствующим функциям:

1. Определить коэффициенты, дополнительную регрессионную статистику и составить уравнения линейной и экспоненциальной регрессии, устанавливающие зависимость цены (экономического параметра) от производительности (технического параметра).

2. Оценить степень взаимосвязи между зависимой и независимой переменными, достоверность полученных уравнений и коэффициентов.

3. Спрогнозировать цену для моделей оборудования с производительностями Пр1, Пр2 и Пр3 двумя способами: 1) по соответствующим функциям; 2) используя полученные уравнения регрессии.

Вариант

1

2

3

Пр1

230

510

420

Пр2

415

250

570

Пр3

700

680

690

II. На листе «Задача 2» приведены некоторые экономические показатели по Беларуси.

1. Определить уравнение зависимости величины прибыли в бюджет от остальных показателей, используя инструмент Регрессия.

2. По полученным таблицам оценить степень взаимосвязи между зависимой и независимыми переменными, достоверность полученного уравнения и коэффициентов.

3. На листе «Задача 2_New» оставить столбцы с двумя переменными:

а) переменную, имеющую наиболее достоверный коэффициент;

б) переменную ХХХ.

Вариант

1

2

3

ХХХ

х2

х5

х6

Используя инструмент Регрессия, найти уравнение в виде полинома 2-й степени, описывающее зависимость прибыли от этих переменных.

4. Оценить степень взаимосвязи между зависимой и независимыми переменными, достоверность полученного уравнения и коэффициентов. Вычислить значение средней ошибки аппроксимации.

III. На листе «Задача 3» определить зависимость цены квартиры от ее характеристик, используя инструмент Регрессия.

  1. По полученным таблицам составить уравнение регрессии, оценить степень взаимосвязи между зависимой и независимыми переменными, достоверность полученного уравнения и коэффициентов.

  2. На листе «Проверка» вычислить цены квартир по полученному уравнению. Сравнить вычисленные цены с фактическими, отобразив скрытый столбец К.

  3. Перейти на лист «Задача 3» и определить уравнение экспоненциальной зависимости цены квартиры от ее характеристик по соответствующей функции.

  4. Спрогнозировать экспоненциальный рост для квартир на листе «Проверка» на основании регрессионного анализа квартир на листе «Задача 3».

  5. Сравнить полученные цены с фактическими и с вычисленными по линейной регрессионной модели.

IV. На листе «Задача 4» построить трендовые модели изменения курса доллара:

а) линейную;

b) экспоненциальную;

с) полиномиальную (2-я степень).

Для каждой линии тренда вывести на диаграмме уравнение, R2, сделать прогноз вперед на 3 периода.

По наиболее приемлемому уравнению вычислить курс доллара вперед на 3 периода (на начало ноября, декабря, января).