Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по АРМ для заочников 2013-2014.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
633.28 Кб
Скачать

Вопрос 3.2: Определение параметров уравнения регрессии.

Для проведения регрессионного анализа MS EXCEL обеспечивает эффективную поддержку следующими возможностями:

  • 15 функций рабочих листов, созданных для этой цели

  • Инструмент анализа Регрессия

  • Команда меню Правка Заполнить Прогрессия

  • Построение линий тренда на графиках, с помощью которых удобнее применять конкретные регрессионные вычисления.

Множественная регрессия предполагает, что зависимость между у и х1, х2, … хп выглядит следующим образом:

Y = Константа + В1Х1 + В2Х2 + … + ВnХn

пример 3: колбасный цех райпо производит 4 наименования колбасных изделий. Нужно определить наилучший прогноз ежемесячных текущих расходов:

Ежемесячные текущие расходы = Константа + b1*(Объем изделия А) ++ b 2*(Объем изделия Б) + b 3*(Объем изделия В) + b 4*(Объем изделия Г)

Период

времени

Текущие расходы, тыс. р.

Производство, кг

изделия А

изделия Б

изделия В

изделия Г

Январь

4439

515

541

928

1132

Февраль

4396

929

692

711

1065

Март

4873

800

875

824

1191

Апрель

4951

979

1147

758

1134

Май

5017

1165

939

635

1708

Июнь

4868

851

798

901

864

Июль

5166

997

1020

750

1812

Август

5283

1042

1085

738

2096

Сентябрь

5399

1048

1136

725

2296

Октябрь

4996

983

869

713

1265

Ноябрь

5033

991

909

701

1189

Декабрь

5750

1006

1204

689

2371

Необходимо проделать следующие итерации:

  • выбрать в меню Сервис команду Анализ Данных и выберите в списке пункт Регрессия.

  • Щелкните ОК и затем заполните диалоговое окно Регрессия.

  • Задайте Входной интервал Y – зависимой переменной, которую собираемся прогнозировать, вместе с заголовком столбца.

  • Задайте Входной интервал Х – независимые переменные, которые собираемся использовать при прогнозировании, вместе с заголовками столбцов.

  • Установите флажок Метки, т.к. Входной интервал Y и Входной интервал Х включают заголовки.

  • Укажите выходной интервал (Выходной интервал – указать ячейку; Новый рабочий лист; Новая рабочая книга) и Уровень надежности – 95 %

  • Щелкните ОК

В нашем примере имеем следующие результаты:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,93384

R-квадрат

0,87205

Нормированный R-квадрат

0,79894

Стандартная ошибка

167,983

Наблюдения

12

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

4

1346266,2

336566,5

11,927

0,003036

Остаток

7

197528,05

28218,29

Итого

11

1543794,2

 

 

 

 

 

Коэффи-циенты

Стандартная ошибка

t-ста-тистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

2891,345

1579,4730

1,8306

0,1099

-843,5152

6626,2052

изделия А (х1)

0,1520

0,8218

0,1849

0,8585

-1,7914

2,0953

изделия Б (х2)

1,1358

0,4859

2,3374

0,0520

-0,0132

2,2848

изделия В (х3)

0,5860

1,3187

0,4444

0,6702

-2,5323

3,7043

изделия Г (х4)

0,3146

0,1468

2,1432

0,0693

-0,0325

0,6618

Таким образом из полученных данных делаем вывод, что наилучшим уравнением является:

У = 2891,345 + 0,152*х1 + 1,136*х2 + 0,586*х3 + 0,3146*х4

Для определения полезности того или иного фактора для прогноза, выраженного через уравнение регрессии, руководствуются данными Р-значения. Любая независимая переменная, Р-значение которой меньше или равно 0,15 считается полезной. Чем меньше Р-значение, тем выше влияние на прогноз этой независимой переменной.

Пример: Р-значение независимой переменной х2 (Произведено Изделия Б) равно 0,052. Это значит, что если при прогнозировании ежемесячных текущих расходов мы используем переменную х4 (Произведено Изделия Г) то существует вероятность, равная 94,8 % (1 - 0,052), что переменная х2 (Произведено Изделия Б) улучшит прогноз.

Р-значения независимых переменных х1 = 0,8585 и х3 = 0,6702 свидетельствует о том, что они не добавляют прогнозной способности уравнению, без этих параметров можно обойтись.

Если переменная не добавляет заметной прогнозности другим переменным, входящим в уравнение, можно не применять ее в качестве независимой переменной в прогнозе.

По коэффициенту корреляции R можно судить о правомерности использования линейного уравнения регрессии. Если он лежит в диапазоне от 0,9 до 1, то данную зависимость можно использовать для предсказания результата.

Значение R2 (коэффициент детерминации) объясняет совместное влияние независимых переменных на результирующий фактор. Например: если R2 = 0,872, то все переменные х, входящие в уравнение, объясняют 87,2 % изменений результата У.

Стандартная ошибка регрессии показывает величину разброса исходных данных относительно линии регрессии. В нашем примере мы можем ожидать, что примерно 68% наших прогнозов на основе уравнения регрессии окажутся точными в пределах одной стандартной ошибки (168 тыс. р.), и 95% наших прогнозов будут точными в пределах двух стандартных ошибок (168*2=336 тыс.р.).

Для каждой из независимых переменных средство Регрессия уже определило 95%-ный доверительный интервал для каждого коэффициента b. Так как для каждой независимой переменной коэффициент b имеет отрицательное значение в нижней границе и положительное значение в верхней границе, мы не можем исключать, что истинное значение b может быть равным нулю.

Это означает, что если колбасный цех не произведет ни одного кг колбасных изделий, то текущие ежемесячные расходы составят 2891,345 тыс. р.