Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
26-50 вопросы.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
266.64 Кб
Скачать

33. Использование корреляционного анализа в прогнозировании

Технологии прогнозирования деятельности предприятия с помощью Microsoft Excel.

Основные понятия.

Технологии прогнозирования основываются на двух важнейших методах составления прогноза:

· Анализ временных рядов;

· Корреляция и регрессионный анализ

В основе АНАЛИЗА ВРЕМЕННЫХ РЯДОВ – допущение о наличии информации за ряд прошлых периодов. Эти данные позволяют выявить долгосрочные тенденции и повторяющиеся циклы.

При отсутствии данных за прошлые периоды прибегают к КОРРЕЛЯЦИИ: рассматривают показатели с целью выявления возможной взаимосвязи между ними. И далее применяют технику проведения РЕГРЕССИОННОГО АНАЛИЗА для построения уравнения, описывающего выявленную взаимосвязь.

Прогнозирование на основе зависимости между двумя переменными (корреляция и регрессия).

В регрессионном анализе изучается односторонняя зависимость переменной Y от одной или нескольких переменных Х1 …., Хk. Основная задача регрессионного анализа – установление формы зависимости между зависимой (Y) и независимыми (Х1 …., Хk) переменными и анализ достоверности параметров этой зависимости. Такие переменные, как расходы на рекламу, транспорт, численность населения и т.п. являются независимыми переменными, а те переменные, которые мы пытаемся оценить (например, объем продаж), являются зависимыми переменными.

Схема составления прогноза заключается в сборе данных о значениях зависимых и независимых переменных, их анализе на предмет наличия связи (корреляция) и выведении математического уравнения, описывающего эту связь (регрессия).

Первая стадия корреляционного анализа – сбор данных о значениях переменных и составления точечных диаграмм (ХY-диаграммы). Точечные диаграммы имеют различный вид:

Так, на рис. а пример абсолютной отрицательной корреляции, на рис.б – сильной положительной корреляции. На рис. в – взаимосвязь между значениями не усматривается, на рис. г взаимосвязь наличествует, но это не линейная зависимость, а параболическая.

Предположение наличия линейной зависимости между двумя переменными основывается на значении коэффициента корреляции r, который рассчитывается по формуле:

где n – число пар значений переменных, а Σ символ суммирования.

Значение коэффициента корреляции колеблется от -1 ( в случае абсолютной отрицательной корреляции) до +1 (в случае абсолютной положительной корреляции). Такие диаграммы как показаны на рис. в, г, дадут коэффициенты корреляции почти равные нулю. Хотя на рис. г точки взаимосвязаны между собой, но там зависимость параболическая, а коэффициент корреляции измеряет тесноту линейной связи. Это свидетельствует о важности не только расчетов, но и рассмотрения точечной диаграммы, поскольку даже при r близким к нулю возможно тесная взаимосвязь, но не линейная, а, например, параболическая как показано на рис. г.

Если установлена тесная линейная корреляция между переменными, то можно вывести уравнение прямой и использовать её для прогнозирования поведения зависимой переменной в будущем. Этот процесс носит название ЛИНЕЙНОЙ РЕГРЕССИИ.

Уравнение прямой (линейной) регрессии имеет общий вид:

Y = a + b*x,

где y – результативный показатель; х – независимая переменная (фактор); a и b представляют собой константы, их значения определяют положение и направленность прямой в осях координат.

Константа а называется точкой пересечения прямой с осью ординат и её значение представляет собой значение у, когда х=0. Константу b называют коэффициентом при х.

Задача регрессионного анализа заключается в экспериментальном определении коэффициентов регрессии, путем наблюдения за характером изменения входных параметров (факторов) и выходной величины (результативного показателя). Линейная модель уравнения регрессии строится по методу наименьших квадратов. Этот критерий минимизирует сумму квадратов вертикальных отклонений точек от прямой регрессии.

В реальных процессах зависимость результативного показателя у зависит от целого ряда переменных (факторов) х1, х2, …,хk. – и это будет множественная регрессия. Модель множественной регрессии имеет следующий вид:

j ≠ i,

где bi – линейные коэффициенты, bii – нелинейные коэффициенты, bij- коэффициенты, учитывающие взаимное влияние факторов.

Для анализа общего качества регрессии используют коэффициент детерминации (определенности) R2. Он характеризует долю вариации (разброса) зависимой переменной, объясненной с помощью данного уравнения. Т.е. с увеличением объясняемой доли разброса R2 à1.

Значимость уравнения регрессии определяют, используя критерий Фишера (F-критерий). Расчетное значение Fв сравнивается с критическим значением (Fкр), определяемого по таблице критических точек распределения Фишера: Fкр = k/n–k – 1; где k - число факторов, (n-k-1) – число степеней свободы знаменателя и n – это число параллельных опытов. Если Fв > Fкр - то полученное уравнение регрессии значимо, т.е. хотя бы один из коэффициентов уравнения не равен нулю.

Значимость коэффициентов регрессии проверяется с помощью t-критерия, основанного на распределении Стьюдента. Если вычисленный t-критерий коэффициента bi ( çtbi ê) больше tкр., то коэффициент значимый и влияние соответствующего фактора значимо. tкр определяют по уровню значимости и числу степеней свободы f = n-k-1.

В табличном процессоре MS Excel значения статистических функций удобно вычислять при помощи мастера функций. Для выполнения статистического анализа имеется набор средств анализа данных, называемый Пакет анализа. Для работы с дополнением Пакет анализа следует задать Сервис-Анализ данных. При отсутствии в меню этой команды следует задать Сервис - Надстройки и в появившемся диалоговом окне Надстройки включить переключатель Пакет анализа, нажать кнопку ОК. Начнет загружаться пакет Анализ данных.

В пакете Анализ данных инструмент Регрессия предлагает линейный регрессионный анализ, который заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Для вычисления коэффициентов регрессии, определяющих нелинейную зависимость и взаимное влияние факторов необходимо факторы переобозначить. Например, выходной параметр Y зависит от трех факторов: y = f(x1, x2, x3).

Записываем значения этих факторов, квадраты факторов, их взаимные произведения и переобозначаем их: x1® x1, x2® x2, x3®x3, ® x4, x®x, x®x, x®x, x®x, x®x, x®x. В результате можно построить линейную модель с использованием уравнения (1.2) вида:

y = b0+ b1x1 + b2x2 + b3x3 + b4x4 + b5x5 + b6x6 + b7x7 + b8x8 + b9x9 + b10x10.

Проведя обратные переобозначения, получим модель, учитывающую нелинейность и взаимное влияние факторов:

y = b0+ b1x1 + b2x2 + b3x3 + b11x + b22 x + b33x + b12x1x2 + b13x1x3 + b23x2x3 + b123x1x2x3.