Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1371.pdf
Скачиваний:
9
Добавлен:
07.01.2021
Размер:
1.09 Mб
Скачать

1.КОРРЕЛЯЦИОННО-РЕГРЕССИОННАЯ МОДЕЛЬ

 

1.1. Построение множественной

С

корреляционно-регрессионной модели

 

Цель работы: изучить основные методы и принципы построения

множественной корреляционно-регрессионной модели.

 

1.1.1. Основные понятия

исследован

 

корреляционно-регрессионного анализа

При построен множественной корреляционно-регрессионной модели на первых этапах определяются количественные характеристики

изучаемыхбАявлен й, т.е. измереяется влияния факторов на результаты

деятельности. Использование корреляционно-регрессионного анализа при процессов дает точный результат и придает выводам обоснованность, спользуется при прогнозировании и планировании, так как основан на лог ке массовых явлений и точно измеряет связь между

наблюдаемыми явлениями.

Задачи, решаемые методами корреляционно-регрессионного анализа:

1. Определение формы связи между изучаемыми явлениями (задача

регрессионного анализа).

2. Количественное описание взаимосвязей (т.е. измерение интенсивности связи между явлениями), характеризующих силу влияния факторных признаков на результативный показатель (задача

корреляционного анализа).

И

При изучении процессов возникает два вида зависимостей:

функциональная

и

корреляционнаяД. Функциональная

связь

рассматривается как корреляционная с предельно высокой теснотой зависимости. При функциональной зависимости каждой переменной х по некоторому закону ставится в соответствие определенное значение у. Особенность данного вида связи – в каждом случае известны все факторы, влияющие на результативный показатель и точный механизм их влияния (например: S = πr2). Это абстрактные связи. При изучении техноэкономических процессов используются корреляционные связи. При корреляционной зависимости числовому значению какого-либо фактора х соответствует не конкретная величина, а групповая средняя результативного показателя у. На изменение результативного показателя

4

влияют факторный признак и частично другие факторы. Корреляционная связь проявляется во всей совокупности, по всем эмпирическим данным,

получаемым при статистическом наблюдении, а не в каждой единице.

При статистическом изучении корреляционной связи используется

способ научной абстракции, т.е. определяется влияние выбранных

С

 

факторов, а прочие игнорируются.

Результаты корреляционных расчетов используются в углубленном

техноэконом ческом анализе, прогнозировании, планировании и

управлен стро тельным производством.

модели

 

1.1.2. Основные этапы построения

 

корреляционно-регрессионной модели

которых производитсяотобранныхор, – генеральной. Генеральная совокупность

Подготов тельный этап построения корреляционно-регрессионной состо т в определении цели исследования, системы показателей

(факторов), подлежащ

исследованию, определении достаточного числа

наблюден й в вы орке, формировании выборочной совокупности.

Часть

ъектов из генеральной совокупности является

объединяет большоеАчисло на людений. ля того чтобы по отобранным значениям некоторого количественного показателя можно было достаточно уверенно судить обоДвсей совокупности, полученная выборка должна быть репрезентативной (представительной), т.е. правильно отражать пропорции генеральной совокупности. Репрезентативность выборки обеспечивается случайностью отбора объектов в выборку. Основные способы формирования выборочной совокупности: индивидуальный отбор (собственно случайныйИ, механический, стратифицированный) и серийный отбор.

выборочной совокупностью (вы оркой), а вся совокупность единиц, из

Адекватность означает совпадение основных свойств построенной математической модели и изучаемого явления

Коэффициент корреляции лежит в пределах –1 r ≤+1. Знак плюс означает прямую, а знак минус – обратную связь. Если х и у связаны точной линейной зависимостью, то r =–1, если прямая связь, и r = –1 – если обратная. В зависимости от рассчитанного коэффициента корреляции определяется интенсивность связи между экономическими явлениями (табл. 1.1).

5

Таблица 1.1

Практическая значимость коэффициента корреляции

От 0 до ±0,4

От ±0,4 до ±0,6

От ±0,6 до ±0,8

От ±0,8 до ±0,9

От ±0,9 до ±1

 

 

 

 

 

 

вязь

от-

Средняя зави-

Высокая зави-

Очень высокая

Полная зави-

сутствует

 

симость

симость

 

симость

 

 

 

 

 

 

Выбор адекватной модели затрудняется тем, что, используя математ ческ й аппарат, теоретически зависимость между признаками может быть выражена большим числом различных функций.Для выбора наиболее адекватной модели рассчитывается показатель средней ошибки

аппрокс мац :

 

 

 

 

 

 

 

 

С

 

 

~

 

 

 

 

 

 

 

1

| yi

yi

|

100%,

(1.1)

 

 

yi

 

где n

 

n

 

 

 

 

 

yi – фактические

 

кол чество

~

в

 

 

 

;

значения

результат

вного пр знака;

значенич

результативного

признака,

yi

единиц

 

 

 

 

 

 

 

 

выборке

 

 

 

полученные путем подстановки значений факторного признака х в уравнен регресс .

При изучении техноэкономическихАпроцессов на результирующий показатель влияет не один, а несколько взаимосвязанных факторов. Поэтому более эффективно изучение множественных зависимостей. В моделях, если эти модели претендуют на адекватность, необходимо учитывать совокупное влияниеДнескольких факторов. Это совокупное влияние факторов определяется методами множественной корреляции.На практике чаще всего возникает необходимость исследовать зависимость результативного показателя от нескольких факторных признаков. В этом случае статистическая модель представляется уравнением регрессии с

1.Определение количественной оценкиИвзаимосвязи между результативным показателем и факторными признаками.

2.Выбор множественного уравнения регрессии.

Сложным этапом построения множественной регрессии являются отбор и последующее включение факторов в модель, так как почти все экономические показатели взаимосвязаны [1]. Определение оптимального числа факторных признаков является одной из основных проблем построения множественного уравнения регрессии. Чем больше факторов

6

включено в уравнение, тем оно лучше описывает явление. Но модель с большой размерностью сложно реализуема. Сокращение размерности модели за счет исключения статистически несущественных факторов способствует простоте и качеству ее реализации.

Факторами являются любые экономические, технические,

С

 

 

 

климатические, организационные, социальные и другие показатели,

оказывающие количественное влияние на какой-либо результирующий

показатель.

Для

построения

множественной

корреляционно-

регресс онной модели с целью определения комплексного воздействия факторов в услов ях их независимости друг от друга отбираются факторы в два этапа. На первом отбираются факторы в зависимости от

независдолжны тесно связаны между собой. Для определения мости факторов строится матрица парных коэффициентов

целей сследован я, меющие логические связи с результативным показателем. На втором этапе проверяется критерий

мульт колл неарности между отобранными факторами, т.е. они не

корреляц r с использованием Excel: «Сервис/Анализ данных/Корреляц я». По корреляционной матрице легко выявить

зависимые и независимые факторы: два фактора являются коллинеарны-

ми, т.е. зависимымибыть, если r 0 ,7

. В этом случае в модель

x i x j

 

включается только один фактор. Для исключения мультиколлинеарности

между факторами можно использовать эмпирический подход [1]

r

 

r

 

Д

 

 

А

xiy

xixj

 

y rx x

 

. Если данная система неравенств выполняется, то оба фактора

rx

j

 

j

 

i

 

результативным показателем. Окончательный вывод при отборе факторов в модель должен быть сделан в соответствии с содержанием и логикой взаимосвязи конкретных факторов.

включаются в модель. При невыполнении хотя бы одного из неравенств из модели исключается фактор xi или xj, имеющийИменее тесную связь с

Практическая значимость регрессионной модели оценивается с помощью количественной оценки тесноты связи между факторами и результативным показателем. Для любых видов зависимостей рассчитывается множественный коэффициент корреляции R и его квадрат

– коэффициент детерминации R2:

 

 

 

 

S2

Ryx x

...x

 

1

ост

,

 

1 2

m

 

Sy2

7

где Sост2 – остаточная дисперсия; Sy2 – дисперсия результативного

признака.

Он определяет то же самое, что и коэффициент корреляции, рассчитанный для парной зависимости: интенсивность связи только уже

между рядом факторов (x1, x2,…,xm) и результативным показателем y. Изменяется в пределах от –1 до +1. Коэффициент корреляции, рассчитанный для модели, после включения дополнительных факторов

Сувелич ваться. Так же, как и в парной зависимости, чем ближе признаковкоэфф ц ент детерм нации к единице, тем меньше влияние на результат вный показатель факторов, не вошедших в модель.

должен с каждым разом (после включения очередного фактора)

Дополн тельный показатель 1–R2 определяет долю влияния факторных , не вошедших в модель, но оказывающих влияние на

результат вный показатель.

Показатели множественной корреляционно-регрессионной модели аналог чно показателям парной модели подвержены влиянию случайных факторов. Проверка на адекватность осуществляется с помощью

проверки соответствующих критериев значимости.

Для оценки значимости множественного коэффициента корреляции R применяется F-критерий Фишера, вычисляемый по формуле

Fрасч

 

 

R2

 

 

n k

,

 

(1.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Д

 

 

(1

 

R

2

)

k 1

 

 

 

где n – количествобединицАв выборке; k – число коэффициентов в

множественной модели. Если

Fрасч

превышает

некоторое

критическое

значение Fтабл (прил. 2) для данных n и k с вероятностью 95%, то величина R считается существенной, т.е. в генеральной совокупности коэффициент корреляции отличен от нуля.

где bi – коэффициенты множественной регрессииИ.

Аналитическая форма выражения связи результативного показателя и ряда факторных признаков называется множественным уравнением

регрессии:

y b1x1 ... bmxm a,

(1.3)

Коэффициенты множественной регрессии bi определяют среднее изменение результативного показателя с изменением фактора на одну единицу при неизменном значении других факторов, закрепленных на среднем уровне. Они вычисляются аналогично коэффициентам парной регрессии методом наименьших квадратов при помощи систем

8

нормальных уравнений. Это достаточно трудоемкий процесс. С использованием Excel возможен расчет параметров множественной

линейной

зависимости

с

использованием

возможностей

Excel:« ервис»/Анализ данных» /«Регрессия».

 

Проверка адекватности корреляционно-регрессионной модели, построенной на основе уравнения регрессии, осуществляется с помощью проверки значимости каждого коэффициента регрессии по t-критерию тьюдента

С

tрасч

 

 

bi

 

 

 

,

 

(1.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sb2

 

 

 

 

 

 

 

i

2

– дисперсия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sb

где bi – коэфф ц енты множественной регрессии;

 

 

 

 

 

 

 

 

 

 

 

i

 

определенного коэфф циента регрессии. Коэффициенты регрессии

считаются стат ст чески значимыми, если выполняется условие tpасч≥tтабл.

Теорет ческое значен

е tта

определяется по таблице

распределения

СтьюдентаЕсли(см. пр л. 1).

tта л ≥ tрасч, то в генеральной совокупности

коэфф ц енты регресс и могут равняться нулю с 95%-ной вероятностью.

По полученным

показателям

 

 

множественной

регрессии нельзя

определитьбстепень влиянияАфакторных признаков на результативный показатель, так они могут измеряться в различных единицах измерения. Для оценки доли влияния каждого фактора в суммарном влиянии факторов, включенных в уравнение регрессиии для определения степени сравнительной связи между факторами, и резервов, заложенных в них, определяются относительные показатели:

1. Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется результативный показатель у с изменением фактора хi на 1% при фиксированном положении других

где bi – коэффициент множественной регрессииИпри i-м факторе; xi – среднее арифметическое значения соответствующего факторного показателя; y – среднее арифметическое значение результативного показателя.

факторов:

Д

 

 

 

 

Эi

bi

xi

,

(1.5)

 

 

 

 

 

y

 

 

2. -коэффициенты (бэта-коэффициенты) показывают, на какую часть среднеквадратического отклонения изменится результативный показатель у с изменением соответствующего фактора х на величину среднеквадратического отклонения. Этот коэффициент позволяет

9

сравнивать влияние колеблемости различных факторов на вариацию исследуемого показателя, что позволяет выявить факторы, в развитии которых заложены наибольшие резервы изменения результативного показателя:

С

 

i

bi

S x

 

 

 

 

 

 

 

 

 

 

 

 

i

,

 

(1.6)

 

 

 

 

 

 

S y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

Sx

i

-

среднеквадратическое отклонение соответствующего фактора;

и2

 

 

 

 

 

 

 

 

 

S y

- среднеквадрат

ческое отклонение результативного показателя.

 

3. -коэфф ц енты (дельта-коэффициенты):

 

 

 

 

 

 

 

 

 

i

 

rxiy i

,

 

 

 

(1.7)

 

 

 

 

 

 

 

 

R2

 

 

 

 

 

 

где

rx

y

 

бА

соответствующий

 

– парные коэффициенты корреляции; i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

бэта-коэфф ц ент; R – множественный коэффициент детерминации.

 

Содержательный анализ моделей в целях уточнения приоритетности

фактора

 

опирается

на

сравнение

перечисленных

коэффициентов.

При большом количестве факторов, включенных в уравнение

регрессии, производится ранжирование факторов по величинам Э, , ,

рассчитывается средний ранг и отбираются факторы, имеющие

наибольшее влияние на результативный показатель.

 

 

 

 

 

 

 

 

 

Д

 

1.1.3. Алгоритм построения множественной корреляционно-

 

 

 

 

 

регрессионной модели

 

 

 

Множественная корреляционно-регрессионная модель строится по

алгоритму:

 

 

 

 

 

 

 

 

 

 

 

1. Для всех факторов и результативного показателя найти средние

арифметические значения

(в Excel:

функция СРЗНАЧ

в категории

«Статистические»),

значения

 

средних

 

квадратических

отклонений

(функция

СТАНДОТКЛОН),

 

коэффициентов

вариации

(ν=СТАНДОТКЛОН/СРЗНАЧ*100%).

 

 

 

И

2. Подсчитать все парные коэффициенты корреляции (табл. 1.2) и их значения занести в корреляционную матрицу (в Excel:«Сервис/Анализ данных/Корреляция»).

10

 

 

 

 

 

 

 

Корреляционная матрица

 

Таблица 1.2

 

 

 

 

 

 

 

 

 

 

 

 

 

Факторы

 

y

 

x1

 

 

 

x2

 

 

x3

 

 

x4

x5

 

 

 

 

y

 

1

 

 

rx1y

 

 

rx2y

 

 

rx3y

 

 

rx4y

rx5y

 

 

 

 

x1

 

ry x1

 

1

 

 

rx2x1

 

 

rx3x1

 

 

rx4x1

rx5x1

 

 

С

ry x2

 

rx1x2

 

 

1

 

 

rx3x2

 

 

rx4x2

rx5x2

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

x3

 

ry x3

 

rx1x3

 

 

rx2x3

 

1

 

 

rx4x3

rx5x3

 

 

 

 

x4

 

ry x4

 

rx1x4

 

 

rx2x4

 

 

rx3x4

 

 

1

rx5x4

 

 

 

 

x5

 

ry x5

 

rx1x5

 

 

rx2x5

 

 

rx3x5

 

 

rx4x5

1

 

 

 

 

коэффициенты

 

 

 

 

 

 

 

 

 

 

 

 

 

3.Провер ть кр тер й мультиколлинеарности. Сделать выводы.

 

 

 

 

4.Определ ть

множественный

коэффициент

корреляции

и

 

 

множественные

 

 

 

 

 

регрессии (в Excel: «Сервис/Анализ

 

 

 

табл

 

 

 

 

 

 

 

 

 

 

 

данных/Регресс я»).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5.Подсч тать относительные коэффициенты: эластичности, бета,

 

 

дельта [формулы (1.5)–(1.7)].

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6.Проранж ровать меющиеся факторы с помощью относительных

 

 

коэффициентов (

А

 

 

 

 

 

 

л. 1.3).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7.Из

. 1.3

вы рать факторы с наименьшим рангом, не

 

 

противоречащие критерию мультиколлинеарности и построить

 

 

многофакторную регрессионно-корреляционную модель.

 

 

 

 

 

 

8.Для выбранных факторов определить множественный коэффициент

 

 

 

 

 

 

 

 

 

Д

 

 

 

 

 

корреляции и множественные коэффициенты регрессии.

 

 

 

 

 

 

9.Определить долю влияния выбранных факторов на результирующий

 

 

показатель с помощью коэффициента детерминации.

 

Таблица 1.3

 

 

 

 

Ранжирование относительных коэффициентов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значения коэффициентов

 

 

 

И

 

 

 

 

 

Ранг факторов по величине

 

 

 

 

 

Факторы

 

 

 

 

 

 

 

 

 

 

 

коэффициентов

Средний

 

 

 

 

 

Эi

 

 

βi

 

i

 

 

Эi

 

βi

 

i

ранг

 

 

 

 

X1

 

Э1

 

 

β1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

X2

 

Э2

 

 

β2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

X3

 

Э3

 

 

β3

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

X4

 

Э4

 

 

β4

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

X5

 

Э5

 

 

β5

 

5

 

 

 

 

 

 

 

 

 

 

 

10.Проверить на адекватность корреляционно-регрессионную модель с помощью проверки множественного коэффициента корреляции по F-критерию Фишера (1.2) и каждого коэффициента регрессии по t-критерию Стьюдента (1.4). Сделать выводы.

11

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]