- •Лабораторная работа №10. Анализ данных вExcel.
- •Требования к содержанию, оформлению и порядку выполнения
- •Теоретическая часть
- •Анализ Парето
- •2. Анализ данных в Excelс помощью функции подбора параметра
- •3. Поиск решения. Решение задач оптимизации.
- •4. Построение прогнозов в Excel
- •Список индивидуальных данных
- •Вариант 1,20,22
- •Вариант 2,19,21
- •Вариант 3,18,24
- •Вариант 4,17,23
- •Вариант 5,16,26
- •Вариант 6,15,25
- •Вариант 7,14,28
- •Вариант 8,13,27
- •Вариант 9,12,30
- •Вариант 10,11,29
- •Пример выполнения работы
- •Контрольные вопросы к защите
4. Построение прогнозов в Excel
Прогнозирование– это метод научного исследования, ставящей своей целью предусмотреть возможные варианты тех процессов и явлений, которые выбраны в качестве предмета анализа.
Одним из методов прогнозирования является метод экстраполяции. Метод экстраполяции заключается в нахождении значений, лежащих за пределами данного статистического ряда: по известным значениям статистического ряда находятся другие значения, лежащие за пределами этого ряда.
При экстраполяции переносится выводы, сделанные при изучении тенденций развития явления в прошлом и настоящем, на будущее, т.е. в основе экстраполяции лежит предположение об определенной стабильности факторных признаков, влияющих на развитие данного явления.
Чем более устойчивый характер носит прогнозируемые процессы и тенденции, тем дальше может быть отодвинут горизонт прогнозирования. Как показывает практика, интервал наблюдения должен быть в три и более раз длиннее интервала упреждения. Как правило, этот период – довольно короткий. Метод экстраполирования не работает при скачкообразных процессах.
Метод экстраполяции легко реализуется на персональном компьютере. Использование современных табличных процессоров, таких как MSExcelпозволяет оперативно проводить прогнозирование различных процессов с использованием экстраполяционного метода.
Для повышения точности прогноза, необходимо учитывать зависимость прогнозируемой величины Y, от внешних факторов Х.Совокупность изучаемых величин подвержена, как правило, воздействию случайных факторов. В связи с этим зависимость прогнозируемой величины Y, от внешних факторов Х чаще всего статистическая, или – корреляционная.
Статистическойназывается зависимость случайных величин, при которой каждому значению одной их них соответствует закон распределения другой, то есть изменение одной из величин влечет изменение распределения другой.
Корреляционнойназывается статистическая зависимость случайных величин, при которой изменение одной из величин влечет изменение среднего значения другой.
Мерой корреляционной зависимости двух случайных величин Х и Y служит коэффициент корреляции r, который является безразмерной величиной, и поэтому он не зависит от выбора единиц измерения изучаемых величин.
Свойства коэффициента корреляции:
1) Если две случайные величины Х и Y независимы, то их коэффициент корреляции равен нулю, т.е. r=0.
2) Модуль коэффициента корреляции не превышает единицы, т.е. |r|1, что эквивалентно двойному неравенству:1r1.
3) Равенство коэффициента -1 или +1 показывает наличие функциональной (прямой) связи. Знак «+» указывает на связь прямую (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака), знак «-» - на связь обратную (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака).
После определения наиболее существенных факторных признаков влияющих прогнозируемую величину, не менее важно установить их математическое описание (уравнение), дающее возможность численно оценивать результативный показатель через факторные признаки.
Уравнение, выражающее изменение средней величины результативного показателя в зависимости от значений факторных признаков, называется уравнение регрессии.
Линии на координатной плоскости, соответствующие уравнениям регрессии называются линиями регрессии.
Корреляционные зависимости могут выражаться уравнениями регрессии различных видов: линейной, параболической, гиперболической, показательной и т.д.
Линейная регрессия
Уравнением линейной регрессии(выборочным)YнаХназывается зависимость от наблюдаемых значений величины Х, выраженная линейной функцией: , где величина называется коэффициентом линейной регрессии YнаХ, b- константа.
Линейная аппроксимация хорошо описывает изменение величин, происходящее с постоянной скоростью.
Если коэффициент корреляции двух величин ХиYравенr=1, то эти величины связаны линейной зависимостью. Коэффициент корреляции служит мерой силы (тесноты) линейной зависимости измеряемых величин. На практике, если коэффициент корреляции двух величинХиY|r|>0.5, то считают, что есть основания предполагать наличие линейной зависимости между этими величинами. Однако ориентироваться при выборе типа линии регрессии (линейной или нелинейной) лучше по виду эмпирической зависимости величинХиY.
Параболическая и полиномиальная регрессии.
Параболическойзависимостью величиныYот величиныХназывается зависимость, выраженная квадратичной функцией (параболой 2-ого порядка):. Это уравнение называетсяуравнением параболической регрессииYнаХ. Параметрыа,b,сназываютсякоэффициентами параболической регрессии.
Уравнение параболической регрессии является частным случаем более общей регрессии, называемой полиномиальной. Полиномиальнойзависимостью величиныYот величиныХназывается зависимость, выраженная полиномомn-ого порядка: ,где числааi(i=0,1,…,n) называютсякоэффициентами полиномиальной регрессии.
Полиномиальная аппроксимация используется для описания величин, попеременно возрастающих и убывающих.
Степенная регрессия.
Степеннойзависимостью величиныYот величиныХназывается зависимость вида: . Это уравнение называетсяуравнением степенной регрессииYнаХ. Параметрыаиbназываютсякоэффициентами степенной регрессии.
Степенная аппроксимация полезна для описания монотонно возрастающей либо монотонно убывающей величины, например расстояния, пройденного разгоняющимся автомобилем. Использование степенной аппроксимации невозможно, если данные содержат нулевые или отрицательные значения.
Показательная регрессия.
Показательной(илиэкспоненциальной) зависимостью величиныYот величиныХназывается зависимость вида: (или )
Это уравнение называется уравнениемпоказательной(илиэкспоненциальной)регрессииYнаХ. Параметрыа(илиk) иbназываютсякоэффициентами показательной(илиэкспоненциальной)регрессии.
Экспоненциальная аппроксимация полезна в том случае, если скорость изменения данных непрерывно возрастает. Однако для данных, которые содержат нулевые или отрицательные значения, этот вид приближения неприменим.
Логарифмическая регрессия.
Логарифмическойзависимостью величиныYот величиныХназывается зависимость вида:.Это уравнение называетсяуравнением логарифмической регрессииYнаХ. Параметрыаиbназываютсякоэффициентами логарифмической регрессии.
Логарифмическая аппроксимация полезна для описания величины, которая вначале быстро растет или убывает, а затем постепенно стабилизируется. Логарифмическая аппроксимация использует как отрицательные, так и положительные величины.
Гиперболическая регрессия.
Гиперболическойзависимостью величиныYот величиныХназывается зависимость вида: . Это уравнение называетсяуравнением гиперболической регрессии YнаХ. Параметрыаиbназываютсякоэффициентами гиперболической регрессии.
Проведение регрессионного анализа можно разделить на три этапа: выбор формы зависимости (вида уравнения) на основе статистических данных, вычисление коэффициентов выбранного уравнения, оценка достоверности выбранного уравнения.
Использование табличного процессора позволяет легко выполнить все этапы регрессионного анализа.
Использование функции ТЕНДЕНЦИЯ
Для прогнозирования процессов, изменение которых носит линейный характер можно использовать функцию ТЕНДЕНЦИЯ.
Эта функция позволяет находить значения в соответствии с линейным трендом. Она аппроксимирует прямой линией (по методу наименьших квадратов) массивы известных значений Yи известных значения Х. Находит новые значенияY, в соответствии с этой прямой для новых значений Х. Например, если у нас есть данные изменения цены на энергоносители за несколько последних лет, то с помощью функции ТЕНДЕНЦИЯ мы можем получить прогноз на цену на энергоносители на будущий год. При этом если зависимость цены от времени близка к линейной, то результат будет удовлетворительным.
Предварительно, перед использованием функции ТЕНДЕНЦИЯ необходимо ввести (в столбец или в строку) массивы XиY, взаимосвязанных величин, а также значенияXдля которых будет спрогнозирована величинаY.
Затем, вызываем статистическую функцию ТЕНДЕНЦИЯ. Для этого необходимо вызвать Мастер функций, щелкнув на кнопке строки формул или отдав команду Вставка/Функция.В окне Мастера функций выберите категориюСтатистическиеи в полеВыберите функцию выберите из списка функцию ТЕНДЕНЦИЯ. В появившемся диалоговом окнеАргументы функции (рис.5.8) в соответствующие поля внесите ссылки на диапазоны ячеек в которых хранятся известные значения величинYиX, новые значения Х, для которых ТЕНДЕНЦИЯ возвращает соответствующие значенияY. С помощью поляКонст можно указать вычислять ли константу b или принять равной 0. Если это поле имеет значение ИСТИНА или опущено, то b вычисляется обычным образом, если ЛОЖЬ – то b полагается равным 0, и значенияподбираются таким образом, чтобы выполнялось соотношениеy = x.
Рис. 8. Фрагмент диалогового окна Аргументы функции.
После ввода всех необходимых аргументов функции необходимо нажать на кнопке ОК.
Быстрое построение линий регрессии в Excel: линия тренда.
В Excel имеется быстрый и удобный способ построить график линейной регрессии, а также основных видов нелинейных регрессий. Это можно сделать следующим образом:
Выделить столбцы с данными X и Y (они должны располагаться именно в таком порядке!).
Вызвать Мастер диаграмм (используя инструмент или команду Вставка/Диаграмма) и в открывшемся окне Мастер диаграмм выбрать в группе Тип – Точечная и сразу нажать Готово.
Не сбрасывая выделения с диаграммы, выбрать появившейся пункт основного меню Диаграмма, в котором следует выбрать пункт Добавить линию тренда.
В открывшемся диалоговом окне Линия тренда во вкладке Тип выбрать тип. Можно выбрать одну из шести зависимостей: линейная, степенная, логарифмическая, экспоненциальная, полиномиальная и линейная фильтрация. Для полиномиальной аппроксимации можно указать степень. При линейной фильтрации (скользящее среднее) элементы данных усредняются, и полученный результат используется в качестве среднего значения для приближения. Так, если шаг линейной фильтрации равен 2, первая точка сглаживающей кривой определяется как среднее значение первых двух элементов данных, вторая точка – как среднее следующих двух элементов и так далее.
Рис.5.9. Вкладка Линия тренда.
.