- •Содержание
- •Введение
- •Понятие, задачи, принципы и методы прогнозирования и планирования
- •1. Понятие, задачи и принципы прогнозирования и планирования
- •Экстраполяционные методы прогнозирования
- •Статистические методы прогнозирования
- •2. Анализ и прогноз рядов наблюдений
- •2.1. Основные типы линий тренда
- •1. Линейная (прямая)
- •2. Парабола второго порядка
- •3. Экспонента
- •2.2. Построение линии тренда расходов на продукты питания в зависимости от уровня дохода семьи Построение линии тренда
- •2.4. Использование процедуры «поиск решения» для подбора коэффициентов функции аппроксимации данных наблюдений
- •Подбор коэффициентов функции аппроксимации
- •1. Сначала представьте имеющиеся данные в виде непрерывного ряда наблюдений и по этим данным постройте график и линию тренда изменения товарооборота за период 2002-2004гг.
- •2. После того, как данные наблюдений представлены в виде непрерывного ряда, постройте диаграмму (рис. 2.34) и найдите уравнение линии тренда (как было описано выше).
- •3. Для исследования временных изменений ряда наблюдений, например, сезонных, выполните следующие действия:
- •3. Статистический анализ и прогноз рядов наблюдений
- •3.1. Линейная и экспоненциальная аппроксимация данных
- •3.2. Функции линейн() и лгрфприбл()
- •Задание 5. Прогнозирование с помощью функций линейн() и лгрфприбл(),
- •3.3. Функции прогноза тенденция() и рост()
- •Задание 6. Прогнозирование с помощью функций тенденция() и рост()
- •Контрольные задания
- •Порядок выбора варианта и данных
- •Задание № 1
- •Задание № 2
- •Литература
3. Статистический анализ и прогноз рядов наблюдений
Excel позволяетпользователю использовать более 70 функций Рабочего листа8(практически готовых решений) для оценки статистических характеристик ряда наблюдений. Используя их различные сочетания можно решить практически любую задачу статистического анализа, применяя в качестве помощника, Мастер функций.
Ниже будут рассмотрены только те функции, которые могут быть полезны для целей построения линии (уравнения) тренда и прогноза и, прежде всего, функции линейного и экспоненциального сглаживания рядов наблюдений, наиболее часто встречающиеся в практике анализа хозяйственной деятельности торговых предприятий.9
3.1. Линейная и экспоненциальная аппроксимация данных
Для вычислений коэффициентов уравнения прямой линии, которая наилучшим образом аппроксимирует данные наблюдений используется функция ЛИНЕЙН ().Уравнение для прямой линии имеет вид
Y=m1*x1+m2*x2+.....b или Y=m*x+b (3.1)
Для вычисления коэффициентов уравнения экспоненциальной кривой, используемой для сглаживания данных наблюдения используется функция ЛГРФПРИБЛ().Уравнение кривой имеет вид
Y = (b*(m1^x1)*(m2^x2)*.....) или Y =b*m^x (3.2)
где Y(зависимое значение) является функцией независимого значениях.
Значения m- это коэффициенты, соответствующие каждой независимой переменнойх, аb- это постоянная величина (кривая может не проходить через начало координат)
Функции аппроксимации ЛИНЕЙН()иЛГРФПРИБЛ()позволяют вычислить прямую или экспоненциальную кривую, наилучшим образом описывающую ваши данные наблюдений. Однако вам самим необходимо решить, какой из полученных результатов вас удовлетворяет в большей степени.
Проводя регрессионный анализ, Excel вычисляет для каждой точки:
Квадрат разности между рассчитанным и фактическим значением Y. Сумма квадратов этих разностей называетсяостаточной суммой квадратов.
Сумму квадратов разностей между фактическими значениями Y и средним значением Y, которая называетсяобщей суммой квадратов (регрессионная сумма квадратов + остаточная сумма квадратов).
Внимание. Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента детерминированности (корреляции)R2, который показывает, насколько полученное регрессионное уравнение соответствует фактическим наблюдениям (насколько тесно связаны переменные).
3.2. Функции линейн() и лгрфприбл()
Рассчитывают статистику для ряда с применением метода наименьших квадратов, чтобы вычислить прямую или логарифмическую линии, которые наилучшим образом аппроксимирует имеющиеся данные. Функции возвращают массив, который описывает полученную прямую.
Внимание.Поскольку возвращается массив значений, функция должна задаваться в виде формулы массива.
Создание формулы массива10
Выделите диапазон ячеек, в которые следует ввести формулу.
Наберите формулу.
Нажмите клавиши CTRL+SHIFT+ENTER.
Уравнение для прямой линии имеет следующий вид:
Y = mx + b или (3.3)
Y = m1x1 + m2x2 + ... + b (в случае нескольких диапазонов
значений x),
где: зависимое значение y — функция независимого значения x,
значения m — коэффициенты, соответствующие каждой независимой переменной x,
а b — постоянная.
Заметим, что y, x иmмогут быть векторами. ФункцияЛИНЕЙН()возвращает массив{mn;mn-1;...;m1;b}.ФункцияЛИНЕЙН()может также возвращать дополнительную регрессионную статистику
Синтаксис функций
ЛИНЕЙН() (известные значенияY; известные значенияХ; константа; статистика).
ЛГРФПРИБЛ() (известные значенияY; известные значенияХ; константа; статистика).
Аргументы функции
"Известные значения Y"- это множество уже известных (заданных) значенийY.
Если массив "Известные значения Y" имеет один столбец (строку), то каждый столбец (строка) массива "Известные значения Y" интерпретируется как отдельная переменная.
"Известные значения Х"- это необязательное11множество уже известных (заданных) значенийХ.
Массив данных "Известные значения Х"может содержать одно или несколько множеств переменных, В том случае, если используется только одна переменная (зависимость видаY=b+mxилиY=b*m^x), то массивы "Известные значения Y"и "Известные значения X"могут иметь любую форму (но обязательно одну размерность).Если же в уравнение входят несколько переменных, то массив "Известные значения Y"должен быть представлен в виде вектора (занимать интервал ячеек в одной строке или столбце).
Константа-это логическое значение, которое указывает, требуется ли, чтобы константаbбыла равна нулю.
Внимание. Если"Константа"имеет значение "1"(истина), тоbвычисляется обычным образом.
Если "Константа"имеет значение "0"(ложь), то b приравнивается нулю и рассчитываются коэффициенты для уравнения кривой, проходящей через начало координат.
Статистика - это логическое значение, которое указывает, требуется ли вывести (вернуть) на рабочем листе Excel дополнительную статистику по уравнению регрессии (линии тренда)
Внимание. Если "Статистика"имеет значение "1"(истина), то на рабочем листе (в выделенном диапазоне ячеек) выводится дополнительная статистика (табл. 3.1) по уравнению регрессии в виде массива(mn; mn-1;...m1; b;sen;sen-1; ....se1; seb; r2; sey; F; df; ssreg; ssresid).
Если "Статистика"имеет значение "0"(ложь) или опущена, рассчитываются только коэффициентыmиb
Табл. 3. 1
Дополнительная статистика
m1; m2; mn;b |
Коэффициенты уравнения регрессии |
se1;se2,.....sen |
Стандартные значения ошибок для коэффициентовm1;m2;...mn |
seb |
Стандартное отклонение ошибки для постоянной b(если "константа" имеет значение "Ложь", то выводится признак ошибки "#Н.Д") |
r2 |
Коэффициент детерминированности. Сравниваются фактические значения y и значения, получаемые из уравнения прямой. По результатам сравнения вычисляется коэффициент детерминированности, нормированный от 0 до 1. Если он равен 1, то имеет место полная корреляция с моделью, т. е. нет различия между фактическим и оценочным значениямиy. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значенийy. |
see |
Стандартная ошибка для оценки Y |
F |
F - статистика (Критерий Фишера).Используется для оценки того, является ли связь между зависимой и независимой переменными случайной. Оценка производится найденной величины F с табличным значением при заданном количестве степеней свободы. |
df |
Степени свободы. Степени свободы полезны для нахождения F-критических значений в статистической таблице. Для определения уровня надежности модели нужно сравнить значения в таблице с F-статистикой, возвращаемой функциейЛИНЕЙН(). |
ssreg |
Регрессионная сумма квадратов |
ssresid |
Остаточная сумма квадратов |
Дополнительная регрессионная статистика выводится в виде таблицы в предварительно выделенном интервале ячеек (табл. 3.2)
.Табл. 3. 2
Таблица вывода дополнительной регрессионной статистики
mn |
mn |
.... |
m2 |
m1 |
b |
sen |
sen-1 |
.... |
se2 |
se1 |
seb |
r |
sey |
|
|
|
|
F |
df |
|
|
|
|
ssrtg |
ssresid |
|
|
|
|
Внимание. Методы, которые используются для проверки уравнений, полученных с помощью функцииЛГРФПРИБЛ(), такие же, как и для функцииЛИНЕЙН().Однако, дополнительная статистика, которую возвращает функцияЛГРФПРИБЛ(),основана на следующей линейной модели:
ln y = х1* ln (m1) + ... + xт *ln(mn) + ln(b) (3.4)
Это следует помнить при оценке дополнительной статистики, особенно значений sei и seb, которые следует сравнивать с ln(mi) и ln (b), а не с mi и b. Для получения более подробной информации можно посмотреть любой справочник по математической статистике.
Внимание. Формулы, которые возвращают массивы, должны быть введены как формулы массивов.12