- •2. Табличный процессор ms excel
- •2.1. Краткие сведения
- •2.2. Графический интерфейс среды Excel и его объекты
- •2.3. Основные объекты документа электронных таблиц
- •2.4. Операции с рабочими листами
- •2.5. Адресация ячейки
- •2.6. Ввод данных в ячейку и их редактирование
- •2.7. Ввод формулы в ячейку
- •Работа 7. Организация расчетов в табличном процессоре ms excel
- •Работа 8. Подбор параметра. Организация обратного расчета
- •Работа 13. Построение диаграмм
- •Типы диаграмм
- •Задание 13.2. Построение и настройка круговой диаграммы по данным одного листа
- •Работа 14. Построение графиков с помощью Мастера функций и Мастера диаграмм
- •Задания по построению графиков функций
- •Работа 15. Построение уравнения регрессии Постановка задачи. Метод наименьших квадратов
- •Линия тренда. Прогноз и анализ тенденций
- •Виды аппроксимирующих функций и их описание
- •Задание 15.1. Построение линий тренда и поиск подходящего уравнения регрессии
- •Расчет прогнозируемых значений
- •Задания по построению уравнений регрессии
Задание 15.1. Построение линий тренда и поиск подходящего уравнения регрессии
Имеются две наблюдаемые величины х и у, например, объемы потребления некоторого вида продукции за последние несколько месяцев (х – месяц, y – объем потребления). Необходимо найти математическую модель, наилучшим образом описывающую наблюдаемые значения.
Алгоритм поиска подходящего уравнения регрессии.
1. Разместите на рабочем листе в виде таблицы наблюдаемые величины: х, у (как это сделано на рис. 2.82).
Рис. 2.82. Исходные данные
2. Постройте график функции у=f(x) по значениям этих величин (рис. 2.83).
Рис. 2.83. График функции y=f(x)
3. Постройте несколько линий тренда для исходных значений. С этой целью выделите диаграмму с графиком и выполните команду меню Диаграмма/Добавить линию тренда, либо воспользуйтесь соответствующей командой контекстного меню.
В окне Линия тренда отметьте ряд, для которого строится линия тренда, и откройте вкладку Тип. Для каждого типа аппроксимирующей кривой (линейной, степенной, логарифмической и полиномиальной) выбрав вкладку Параметры установите флажки в поля Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации (R^2). После установки параметров линии тренда нажмите кнопку ОК. Построенные линии тренда приведены на рис. 2.84.
Рис. 2.84. Линии тренда для исходного графика y=f(x)
5. Задайте интервал прогнозирования и определите историю данных (т. е. продлить линии тренда за исходную область данных). Интервал прогнозирования устанавливается с помощью кнопок Вперед на: и Назад на: (с шагом в полпериода) в поле Прогноз диалогового окна Линия тренда либо с клавиатуры (с любой дробностью).
6. Делается вывод о выборе того или иного типа аппроксимации и выписать аппроксимирующее уравнение линии, выделив коэффициенты. Исходя из результатов расчета, для описания данных наблюдаемых величин наиболее достоверной представляется линейная модель
y = 1,8857x + 5,4; R2 = 0,9723.
Замечание. Часто для аппроксимации произвольной выборки и разброса данных подходит полиномиальное уравнение той или иной степени. Однако при прогнозировании уравнениями таких линий следует иметь в виду, что возможны большие ошибки в прогнозах и истории данных. В таких случаях, если находится другая функция с близким коэффициентом корреляции, следует учесть ее уравнение регрессии.
Расчет прогнозируемых значений
В ряде случаев ставится задача получения численных значений аппроксимирующей функции для новых значений xi в интервале прогнозирования. Эта задача решается с помощью маркера автозаполнения (квадратик в нижнем правом углу селектора таблицы) или посредством встроенных функций.
Прогнозирование с помощью маркера производится в следующей последовательности. Выделяются ячейки B3:B8 (с известными значениями y). Затем, с помощью маркера производится протягивание данных вниз по месяцам 7, 8, 9. Полученные в ячейках B9:B11 данные, служат для прогноза реализации продукции в ближайшие три месяца.
Прогнозирование также можно выполнить с помощью контекстного меню. Выделяются исходные данные (ячейки B3:B8). Затем производится заполнение с помощью маркера, но при нажатой правой кнопке мыши. В открывшемся меню следует выбрать или "Линейное приближение", или "Экспоненциальное приближение".
Прогнозирование можно выполнить и с помощью встроенных функций. Воспользуемся функцией ЛИНЕЙН (известные_значения_у, известные_значения_х, конст, статистика). В нашем случае известные_значения_у находятся в диапазоне В3:В8, а известные_значения_х – в диапазоне А3:А8. Два последних аргумента логические. Если конст – ИСТИНА или опущено, то свободный член b в регрессионном уравнении
y = mx + b
может быть любым, а если конст – ЛОЖЬ, то b принудительно полагается равным нулю. Если последний аргумент статистика – ЛОЖЬ или опущен, то вычисляются только коэффициенты т и b, а если ИСТИНА, то выдаются дополнительные статистические характеристики. Вместо слов ИСТИНА и ЛОЖЬ в функции можно вводить аргументы 1 и 0, что намного удобнее.
Так
как функция возвращает сразу несколько
значений, формулу с этой функцией надо
вводить как табличную. Если нужно
вывести полную статистику, то надо
выделить блок ячеек из шести строк и
двух столбцов. Выделим блок F3:G7,
щелкнем по кнопке
,
в Мастере функций выберем в категории
"Статистические" функцию ЛИНЕЙН.
Первым аргументом укажем блок В3:В8,
вторым аргументом – блок А3:А8, в третьем
и четвертом поле ввода проставим 1. Не
щелкаем по кнопке "ОК", а нажимаем
Ctrl+Shift+Enter
(находясь в диалоговом окне)! Получим
следующую таблицу (рис. 2.85).
Рис. 2.85. Расчет линейной регрессии с помощью функции ЛИНЕЙН
В ячейку F3 записан коэффициент m, в G3 – коэффициент b. Под этими коэффициентами записаны стандартные отклонения (т.е. среднеквадратичные отклонения, или корни квадратные из дисперсий) для этих коэффициентов.
В ячейку F5 записан так называемый коэффициент детерминации R2. Этот коэффициент лежит на отрезке [0; 1]. Считается, что чем ближе этот коэффициент к 1, тем лучше регрессионное уравнение описывает зависимость. Ниже мы убедимся, что к такой интерпретации надо относиться с осторожностью.
В ячейке G5 находится стандартная ошибка для оценки у. В ячейку F6 записано значение F-статистики, а в G6 – количество степеней свободы. Число степеней свободы нужно для расчета критических значений F-статистики (этого вопроса мы касаться не будем).
В последней строке таблицы записаны регрессионная сумма квадратов (62,22857) и остаточная сумма квадратов (1,771429). Последнее число это сумма квадратов разностей ei=yi – f(xi).
Можно
и не вычислять коэффициенты регрессионного
уравнения (если не требуется знать
значения F-статистики),
а воспользоваться одной из двух
статистических функций ПРЕДСКАЗ и
ТЕНДЕНЦИЯ, которые возвращают значения
для новых значений xi
с применением линейной аппроксимации
по методам линейного приближения
(ПРЕДСКАЗ) и наименьших квадратов
(ТЕНДЕНЦИЯ). Порядок применения этих
функций аналогичен порядку применения
функции ЛИНЕЙН.
