Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по АРМ для заочников 2013-2014.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
633.28 Кб
Скачать

Вопрос 3.1: Построение моделей множественной регрессии. Выбор формы связи, отбор факторных признаков.

Одной из часто встречающихся практических задач является установление вида зависимости между параметрами объекта исследования. Зависимость между двумя переменными хорошо помогают понять кривые тренда. Тем не менее, часто требуется определить зависимость больше, чем между двумя переменными, когда определяется значение зависимой переменной от независимых переменных х12, … хn. Каждый фактор в отдельности не определяет изучаемое явление во всей полноте. Более широкое представление о характере изучаемого объекта или явления дает комплекс взаимосвязанных факторов.

Корреляция (обычно ее обозначают буквой r) между двумя переменными (х и у) – это безразмерная линейная зависимость между х и у. Корреляция между любыми двумя переменными всегда находится в диапазоне от -1 до +1.

Интерпретация корреляции между двумя переменными:

Значение

корреляции

Зависимость

между х и у

Интерпретация

зависимости

Пример

близкая к +1

значительная положительная линейная зависимость

если х превышает среднее значение, то у тоже стремится к превышению среднего значения и наоборот

r = 0,9; х – число произведенных единиц товара; у – себестоимость производства.

близкая к -1

значительная отрицательная линейная зависимость

если х превышает среднее значение, то у стремится быть ниже среднего значения и наоборот

r = - 0,85; х – цена товара; у – спрос на товар

близкая к 0

линейная зависимость слабая

информация о том, больше или меньше х своего среднего значения, практически ничего не скажет о том, будет ли у больше или меньше своего среднего значения

r = 0,003; х – опыт продаж; у – количество продаваемых единиц товара. Т.е. при среднем стаже 10 лет, продажи могут быть как низкими, так и высокими. Это распространяется и на опыт меньше 10 лет.

Для определения взаимосвязей различных факторов можно воспользоваться корреляциями.

пример 1: имеется информация о ежемесячной доходности отдельных видов продукции по колбасному цеху райпо:

Период времени

Наименование изделия А

Наименование изделия Б

Наименование изделия В

Наименование изделия Г

Январь

0,056

0,0970

0,0063

0,0298

Февраль

0,048

0,0985

0,0008

0,0875

Март

0,026

0,0874

-0,0340

0,0657

Апрель

0,061

0,1108

-0,0285

0,0336

Май

0,059

0,0996

0,0078

0,0984

Июнь

0,064

0,1217

0,0062

0,1125

Чтобы найти корреляцию между каждым наименованием колбасных изделий необходимо:

  • выбрать в меню Сервис команду Анализ Данных и выберите в списке пункт Корреляция.

  • Щелкните ОК и заполните диалоговое окно Корреляция.

  • Задайте входной интервал

  • Установите флажок Метки в первой строке, если первая строка входного интервала содержит метки

  • Укажите выходной интервал (Выходной интервал – указать ячейку; Новый рабочий лист; Новая рабочая книга)

  • Щелкните ОК

В нашем примере имеем следующие результаты:

 

Изделие А

Изделие Б

Изделие В

Изделие Г

Изделие А

1

 

 

 

Изделие Б

0,79863

1

 

 

Изделие В

0,59249

0,29280

1

 

Изделие Г

0,10821

0,31496

0,45290

1

Мы видим, что корреляция между Изделием А и Изделием Б составляет 0,797, между Изделием А и Изделием В – 0,592, т.е. доходность по этим наименованиям колбасных изделий наиболее тесно взаимосвязана. Это значит, что если стоимость одних из видов колбасных изделий превысит среднее значение (однако утверждать это точно нельзя), то и по другим видам этих изделий стоимость увеличится.

Между ежемесячной доходностью изделий А и Г практически нет корреляции, т.е. когда цена колбасных изделий А превысит среднее значение, мы не можем сказать, превысит ли цены на колбасные изделия Г средние значения или наоборот подешевеют.

Альтернатива использованию инструмента Корреляция Пакета Анализа – использование функции КОРРЕЛ.

пример 2: нужно ввести формулу КОРРЕЛ(C4:C9;D4:D9) и мы получим корреляционную зависимость между изделиями А и Б, равную 0,79863.

Помочь в анализе намного больших данных способен регрессионный анализ, который представляет собой основу для исследования и понимания взаимосвязей между переменными. Его можно применять при принятии решений по многим вопросам, начиная от финансирования видов деятельности и отдельных операций, и заканчивая проведением маркетинговых исследований.

Зависимости между параметрами объекта исследования могут быть теоретическими и статистическими.

Из-за сложности исследуемого объекта теоретические зависимости между параметрами бывают известны далеко не всегда. Если теоретические зависимости отсутствуют, то необходимые соотношения можно определять на основании имеющихся статистических данных.

Для определения статистических зависимостей необходимо выполнить 2 шага:

  • на основании физического смысла статистических данных принять вид аналитических зависимостей, например, полином 2-й степени, экспонента, линейная зависимость и т. д.

  • с помощью метода наименьших квадратов по имеющимся статистическим данным найти значения величин, определяющих конкретный вид принятых зависимостей.

Полученные аналитические зависимости называются уравнениями регрессии. Изучение связи между тремя и более взаимосвязанными признаками называется множественной или многофакторной регрессии и в общем случае они имеют вид у = f(x1, x2,..., xn)..

Уравнения регрессии классифицируют по следующим признакам:

  1. по числу переменных: парная и непарная.

  2. по виду зависимости: линейная и нелинейная

Регрессия называется парной, если она описывает зависимость между функцией и одной переменной и имеет вид y=f(x).

Регрессия называется множественной, если она описывает зависимость функции от нескольких переменных и имеет вид y=f(x1, x2,...,xn).

Если эти зависимости являются линейными, то регрессия называется линейной, в противном случае регрессию называют нелинейной.

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект анализа, можно пренебречь. Попытка выявить влияние сразу нескольких объясняющих факторов на результат приводит к построению модели множественной регрессии. В этом случае коэффициенты регрессии являются частными производными оцениваемой переменной по соответствующим объясняющим факторам.

Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый (результирующий) показатель.

Спецификация модели включает два круга вопросов: отбор факторов и выбор вида уравнения регрессии.

Следует отметить специфику построения модели множественной регрессии, связанную с отбором факторов для включения их в уравнение регрессии. Факторы, включаемые в модель, должны отвечать следующим требованиям:

- должны быть количественно измеримы;

- не должны быть интеркоррелированы1 и тем более находиться в прямой функциональной связи.

Включаемые во множественную регрессию факторы должны объяснить вариацию зависимой переменной. Если строится модель с набором n факторов, то для нее рассчитывается коэффициент детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии n факторов.

Трудности в использовании модели множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон.

Как и в парной зависимости, возможны линейные и нелинейные виды уравнений множественной регрессии. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации.

Условия применения корреляционно-регрессионного анализа:

    • качественная однородность совокупности исследуемых признаков;

    • приемлемость по хозяйствующим субъектам и периодам времени;

    • наличие достаточно большого количества наблюдений о величине исследуемых факторов и результативных показателей в динамике или за текущий год по совокупности однородных объектов;

    • исследуемые факторы должны иметь количественное измерение и найти отражение в тех или иных источниках информации.