Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб_раб_2.docx
Скачиваний:
14
Добавлен:
27.09.2019
Размер:
196.26 Кб
Скачать

2.6. Аппроксимация экспериментальных данных. Линия тренда

На практике часто приходится сталкиваться с задачей сглаживания экспериментальных зависимостей или задачей аппроксимации. Аппроксимацией называется процесс подбора эмпирической формулы (х) для установленной из опыта функциональной зависимости y f(x). Эмпирические формулы служат для аналитического представления опытных данных и позволяют, с некоторой долей вероятности, строить соответствующие прогнозы. Обычно (х) следует выбирать так, чтобы минимизировать сумму квадратов разностей между наблюдаемыми и теоретическими значениями зависимой переменной. В Excel аппроксимация экспериментальных данных осуществляется путем построения их графика (х — отвлеченные величины) или точечной диаграммы (х — имеет конкретные значения) с последующим подбором подходящей функции (линии тренда).

Excel предоставляет 5 видов функций:

  • Линейнаяy = ax + b (а и b — константы). Это простейшая функция, отражающая рост и убывание данных с постоянной скоростью.

  • Полиномиальнаяy = a0 + a1x + a2x2 + … + anxn (ai — константы, n ≤ 6). Используется для описания данных, попеременно возрастающих или убывающих. Степень полинома определяется количеством экстремумов (максимумов или минимумов) кривой. Полином 2-й степени может иметь 1 экстремум, 3-й степени — до 2-х экстремумов, 4-й степени — до 3-х и т.д.

  • Логарифмическаяy = alnx + b (а и b — константы). Используется для описания данных, которые сначала быстро растут или убывают, а затем постепенно стабилизируются.

  • Степеннаяy = bxа (а и b — константы). Используется для описания данных с постоянно увеличивающейся (или убывающей) скоростью роста. Данные не должны иметь нулевых или отрицательных значений.

  • Экспоненциальнаяy = beax (а и b — константы, е — основание натурального логарифма). Применяется в случае, если скорость изменения данных непрерывно возрастает. Для нулевых и отрицательных данных этот вид приближения неприемлем.

Алгоритм поиска подходящей функции для экспериментальных данных следующий:

  • разместить на рабочем листе наблюдаемые величины;

  • построить график функции y f(x) для этих величин;

  • построить несколько линий тренда для исходных значений;

  • задать прогнозирование и/или историю данных, т.е. продлить линию тренда за исходную область данных;

  • сделать вывод о выборе того или иного типа аппроксимации.

Для построения линии тренда надо выделить на диаграмме ряд данных, выбрать команду: Макет  группа Анализ  Линия тренда  Дополнительные параметры линии тренда (или в контекстном меню команду Добавить линию тренда), в окне Формат линии тренда на вкладке Параметры линии тренда выбрать тип аппроксимации, установить флажки Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации (R^2), на вкладках Цвет линии, Тип линии и Тень установить параметры отображения линии тренда.

Степень близости аппроксимации экспериментальных данных выбранной функцией оценивается коэффициентом детерминации R2. Чем ближе этот коэффициент к 1, тем более достоверна используемая модель. Часто для аппроксимации произвольной выборки подходит полиномиальное уравнение той или иной степени, но при прогнозировании возможны ошибки. В таких случаях, если находится другая функция с близким коэффициентом детерминации, то следует использовать эту функцию.

Тренд можно строить для диаграмм типа: график, гистограмма, линейчатая диаграмма, диаграмма с областями, точечная диаграмма, биржевая диаграмма, пузырьковая диаграмма. При добавлении линии тренда к ряду данных она связывается с этим рядом. Любые изменения значений точек ряда данных автоматически отражаются на линии тренда — происходит ее пересчет. Если ряд данных удаляется, то удаляется также и линия тренда. Если тип диаграммы для ряда данных заменяется другим, который не входит в перечень допустимых, то линия тренда удаляется.

Пример 2.9. Построить функцию, наилучшим образом отражающую зависимость продаж от рекламы, заданную следующими статистическими данными для некоторой фирмы (табл. 2.1). Оценить продажи для рекламных вложений в 6 тыс. руб.

Таблица 2.1

Реклама (тыс. руб.)

1,5

2

2,5

3

3,5

4

4,5

5

5,5

6

Продажи (тыс. шт.)

3

13

25

33

40

45

48

50

53

Подготовим на рабочем листе Excel таблицу с исходными данными, построим по этим данным Точечную диаграмму, выделим на диаграмме ряд данных. Затем вызовем команду контекстного меню Добавить линию тренда (или Макет  группа Анализ  Линия тренда  Дополнительные параметры линии тренда) и на вкладке Параметры линии тренда диалогового окна Формат линии тренда выберем тип аппроксимации Линейная, установим флажки, отображающие на графике уравнение и коэффициент детерминации, выполним прогноз на 0,5 периода вперед. После нажатия кнопки Закрыть получаем результат. Коэффициент детерминации R2 = 0,925, что является неплохой степенью близости подбираемой функции. Аналогично построим другие линии тренда: экспоненциальную, логарифмическую, полиномиальную и степенную (рис. 2.18).

Полиномиальная функция второй степени аппроксимирует исходную зависимость с большой степенью близости (R2 = 0,997), но при прогнозировании наблюдается ошибка — продажи уменьшаются с увеличением рекламных вложений. Для описания исходных данных наиболее достоверной представляется логарифмическая модель: y = 39,853 * ln(х) – 12,365 с коэффициентом детерминации R2 = 0,988. По графику видно, что при рекламных вложениях в 6 тыс. руб. продажи составят  59 тыс. шт. Сумма продаж, вычисленная по формуле =39,853*LN(6)–12,365, равна 59,042 тыс. шт. Коэффициенты детерминации других аппроксимирующих функций (линейной, степенной, экспоненциальной) имеют худшие значения по сравнению с логарифмической функцией.

Рис. 2.18

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]