Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИСЭ_КонтрРаб_Заочники.doc
Скачиваний:
29
Добавлен:
11.06.2015
Размер:
2.62 Mб
Скачать

3. Статистический анализ и прогноз рядов наблюдений

Excel позволяетпользователю использовать более 70 функций Рабочего листа8(практически готовых решений) для оценки статистических характеристик ряда наблюдений. Используя их различные сочетания можно решить практически любую задачу статистического анализа, применяя в качестве помощника, Мастер функций.

Ниже будут рассмотрены только те функции, которые могут быть полезны для целей построения линии (уравнения) тренда и прогноза и, прежде всего, функции линейного и экспоненциального сглаживания рядов наблюдений, наиболее часто встречающиеся в практике анализа хозяйственной деятельности торговых предприятий.9

3.1. Линейная и экспоненциальная аппроксимация данных

Для вычислений коэффициентов уравнения прямой линии, которая наилучшим образом аппроксимирует данные наблюдений используется функция ЛИНЕЙН ().Уравнение для прямой линии имеет вид

Y=m1*x1+m2*x2+.....b или Y=m*x+b (3.1)

Для вычисления коэффициентов уравнения экспоненциальной кривой, используемой для сглаживания данных наблюдения используется функция ЛГРФПРИБЛ().Уравнение кривой имеет вид

Y = (b*(m1^x1)*(m2^x2)*.....) или Y =b*m^x (3.2)

где Y(зависимое значение) является функцией независимого значениях.

Значения m- это коэффициенты, соответствующие каждой независимой переменнойх, аb- это постоянная величина (кривая может не проходить через начало координат)

Функции аппроксимации ЛИНЕЙН()иЛГРФПРИБЛ()позволяют вычислить прямую или экспоненциальную кривую, наилучшим образом описывающую ваши данные наблюдений. Однако вам самим необходимо решить, какой из полученных результатов вас удовлетворяет в большей степени.

Проводя регрессионный анализ, Excel вычисляет для каждой точки:

  • Квадрат разности между рассчитанным и фактическим значением Y. Сумма квадратов этих разностей называетсяостаточной суммой квадратов.

  • Сумму квадратов разностей между фактическими значениями Y и средним значением Y, которая называетсяобщей суммой квадратов (регрессионная сумма квадратов + остаточная сумма квадратов).

Внимание. Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента детерминированности (корреляции)R2, который показывает, насколько полученное регрессионное уравнение соответствует фактическим наблюдениям (насколько тесно связаны переменные).

3.2. Функции линейн() и лгрфприбл()

Рассчитывают статистику для ряда с применением метода наименьших квадратов, чтобы вычислить прямую или логарифмическую линии, которые наилучшим образом аппроксимирует имеющиеся данные. Функции возвращают массив, который описывает полученную прямую.

Внимание.Поскольку возвращается массив значений, функция должна задаваться в виде формулы массива.

Создание формулы массива10

  • Выделите диапазон ячеек, в которые следует ввести формулу.

  • Наберите формулу.

  • Нажмите клавиши CTRL+SHIFT+ENTER.

Уравнение для прямой линии имеет следующий вид:

Y = mx + b или (3.3)

Y = m1x1 + m2x2 + ... + b (в случае нескольких диапазонов

значений x),

где: зависимое значение y — функция независимого значения x,

значения m — коэффициенты, соответствующие каждой независимой переменной x,

а b — постоянная.

Заметим, что y, x иmмогут быть векторами. ФункцияЛИНЕЙН()возвращает массив{mn;mn-1;...;m1;b}.ФункцияЛИНЕЙН()может также возвращать дополнительную регрессионную статистику

Синтаксис функций

ЛИНЕЙН() (известные значенияY; известные значенияХ; константа; статистика).

ЛГРФПРИБЛ() (известные значенияY; известные значенияХ; константа; статистика).

Аргументы функции

"Известные значения Y"- это множество уже известных (заданных) значенийY.

Если массив "Известные значения Y" имеет один столбец (строку), то каждый столбец (строка) массива "Известные значения Y" интерпретируется как отдельная переменная.

"Известные значения Х"- это необязательное11множество уже известных (заданных) значенийХ.

Массив данных "Известные значения Х"может содержать одно или несколько множеств переменных, В том случае, если используется только одна переменная (зависимость видаY=b+mxилиY=b*m^x), то массивы "Известные значения Y"и "Известные значения X"могут иметь любую форму (но обязательно одну размерность).Если же в уравнение входят несколько переменных, то массив "Известные значения Y"должен быть представлен в виде вектора (занимать интервал ячеек в одной строке или столбце).

Константа-это логическое значение, которое указывает, требуется ли, чтобы константаbбыла равна нулю.

Внимание. Если"Константа"имеет значение "1"(истина), тоbвычисляется обычным образом.

Если "Константа"имеет значение "0"(ложь), то b приравнивается нулю и рассчитываются коэффициенты для уравнения кривой, проходящей через начало координат.

Статистика - это логическое значение, которое указывает, требуется ли вывести (вернуть) на рабочем листе Excel дополнительную статистику по уравнению регрессии (линии тренда)

Внимание. Если "Статистика"имеет значение "1"(истина), то на рабочем листе (в выделенном диапазоне ячеек) выводится дополнительная статистика (табл. 3.1) по уравнению регрессии в виде массива(mn; mn-1;...m1; b;sen;sen-1; ....se1; seb; r2; sey; F; df; ssreg; ssresid).

Если "Статистика"имеет значение "0"(ложь) или опущена, рассчитываются только коэффициентыmиb

Табл. 3. 1

Дополнительная статистика

m1; m2; mn;b

Коэффициенты уравнения регрессии

se1;se2,.....sen

Стандартные значения ошибок для коэффициентовm1;m2;...mn

seb

Стандартное отклонение ошибки для постоянной b(если "константа" имеет значение "Ложь", то выводится признак ошибки "#Н.Д")

r2

Коэффициент детерминированности. Сравниваются фактические значения y и значения, получаемые из уравнения прямой. По результатам сравнения вычисляется коэффициент детермини­рованности, нормированный от 0 до 1. Если он равен 1, то имеет место полная корреляция с моделью, т. е. нет различия между фактическим и оценочным значениямиy. В противоположном случае, если коэф­фициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значенийy.

see

Стандартная ошибка для оценки Y

F

F - статистика (Критерий Фишера).Используется для оценки того, является ли связь между зависимой и независимой переменными случайной. Оценка производится найденной величины F с табличным значением при заданном количестве степеней свободы.

df

Степени свободы. Степени свободы полезны для нахождения F-крити­ческих значений в статистической таблице. Для определения уровня надежности модели нужно сравнить значения в таблице с F-статистикой, возвращае­мой функциейЛИНЕЙН().

ssreg

Регрессионная сумма квадратов

ssresid

Остаточная сумма квадратов

Дополнительная регрессионная статистика выводится в виде таблицы в предварительно выделенном интервале ячеек (табл. 3.2)

.Табл. 3. 2

Таблица вывода дополнительной регрессионной статистики

mn

mn

....

m2

m1

b

sen

sen-1

....

se2

se1

seb

r

sey

F

df

ssrtg

ssresid

Внимание. Методы, которые используются для проверки уравнений, полученных с помощью функцииЛГРФПРИБЛ(), такие же, как и для функцииЛИНЕЙН().Однако, дополнительная статистика, которую возвращает функцияЛГРФПРИБЛ(),основана на следующей линейной модели:

ln y = х1* ln (m1) + ... + xт *ln(mn) + ln(b) (3.4)

Это следует помнить при оценке дополнительной статистики, особенно значений sei и seb, которые следует сравнивать с ln(mi) и ln (b), а не с mi и b. Для получения более подробной информации можно посмотреть любой справочник по математической статистике.

Внимание. Формулы, которые возвращают массивы, должны быть введены как формулы массивов.12