Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Uchebnoe_posobie1TEA.doc
Скачиваний:
20
Добавлен:
10.11.2019
Размер:
1.02 Mб
Скачать

Тема 8 Методы стохастического факторного анализа

Вопросы

8.1 Способы изучения стохастических взаимосвязей

8.2. Алгоритм расчетов

8.1 Способы изучения стохастических взаимосвязей

Если связь между показателями не является строго детерминированной, то она корреляционная. Корреляционная (стохастическая) связь – это неполная, вероятностная зависимость между показателями, которая проявляется только в массе наблюдений. Она характеризуется тем, что помимо изучаемых основных факторов на результативный показатель оказывают влияние и побочные факторы, искажающие влияние основного.

Обязательным условием применения корреляционного метода является массовость значений изучаемых показателей, позволяющая выявить тенденцию, закономерность развития. Форма взаимосвязи между факторами и результативным показателем выявляется только тогда, когда для исследования используется большое количество наблюдений, тогда влияние других факторов сглаживается, нейтрализуется.

Для определения влияния каждого фактора на результативный показатель используют способы корреляционного, дисперсионного, компонентного, современного многомерного факторного анализа.

Виды корреляций:

  • парная – это связь между двумя показателями, один из которых, является факторным, другой – результативным показателем;

  • множественная – связь между несколькими факторами и одним результативным показателем.

С помощью корреляции решаются следующие задачи:

  • устанавливается теснота связи, которая измеряется корреляционным отношением;

  • дается количественная оценка влияния факторов на результа­тивный показатель.

Общая формула корреляционного отношения (формула 62):

(62)

где – среднее квадратическое отклонение у от теоретических значений ух, ух определяется на основе уравнений регрессии;

– среднее квадратическое отклонение эмпирических (фактических) значений у.

Количественная оценка тесноты связи в зависимости от корреляционного отношения приведена в таблице 21.

Таблица 21 – Качественная оценка тесноты связи при различных значениях корреляционного отношения

Величина корреляционного отношения

0,1-0,3

0,3 - 0,5

0,5 - 0,7

0,7 - 0,9

0,9 - 0,99

Теснота связи

Слабая

Умеренная

Заметная

Высокая

Весьма высокая

В случае прямолинейной зависимости корреляционное отношение называется коэффициентом корреляции и обозначается буквой r.

Корреляционное отношение (коэффициент корреляции) принимает значения от 0 до 1:

- если η(r)=0, то связь между показателями отсутствует;

- если η(r)=1, то связь функциональная (детерминированная);

- если η(r) – отрицательная величина, то связь между показателями обратная.

8.2 Алгоритм расчетов

Алгоритм расчетов при корреляционном анализе связи парной корреляции состоит из ряда этапов.

Этап 1. Производится отбор наиболее важных существенных факторов, влияющих на результативный показатель. При отборе факторов учитываются причинно-следственные связи между показателями, причем все факторы должны быть количественно измеримы. Большую помощь при отборе факторов для корреляционной модели оказывают аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. Отобранные для анализа показатели и результаты наблюдений за их изменением помещаются в таблицу, в которой факторные признаки располагаются в порядке возрастания или убывания, т.е. ранжируются.

Этап 2. Данные из таблицы наносятся на плоскость координат – строится корреляционное поле.

Этап 3. Производится обоснование формы связи:

  • по форме корреляционного поля;

  • путем визуального анализа ранжированного ряда.

Подобное обоснование является приблизительным и нуждается в дальнейшем уточнении с помощью ошибки аппроксимации.

Форма связи определяет дальнейшие действия корреляционного анализа.

Если связь носит прямолинейный характер, то рассчитывается коэффициент корреляции.

Если связь криволинейная, то, прежде всего, определяются теоретические значения ух. С этой целью решается уравнение регрессии, описывающее связь между изучаемыми показателями. Затем рассчитывается корреляционное отношение.

Корреляционное отношение, или коэффициент корреляции, дает количественную оценку тесноты связи, характеризует силу влияния факторных признаков на результативные.

При прямолинейной форме связи коэффициент корреляции рассчитывается по формуле 63:

(63)

Коэффициент корреляции может быть представлен и как среднее значение произведений нормированных отклонений (tx, ty) (формула 64).

(64)

Нормированные отклонения определяются по формулам 65 и 66.

(65)

(66)

где σx, σy – средние квадратические отклонения, которые рассчитываются по формулам 67, 68.

(67)

(68)

Если коэффициент корреляции возвести в квадрат, то получим коэффициент (индекс) детерминации, который показывает, чему равна доля влияния изучаемого фактора на совокупный показатель.

При значениях тесноты связи меньше 0,7 величина индекса детерминации d всегда будет меньше 50%. Это означает, что на долю вариации факторного признака х приходится меньшая доля по сравнению с другими признаками, влияющими на изменение результативного показателя.

Синтезированные при таких условиях математические модели связи практического значения не имеют.

Если значения показателей тесноты связи более 0,7, выбирается уравнение регрессии, с помощью которого описывается форма связи между показателями.

Этап 4. Выбор и решение уравнения регрессии. Выбор конкретного уравнения регрессии, адекватно описывающего форму связи, является довольно сложной процедурой. В условиях использования ПЭВМ выбор адекватной модели осуществляется перебором решений, наиболее часто применяемых в анализе парной корреляции уравнений регрессии. Если форму связи сразу установить сложно, решают уравнения нескольких типов. Выбор адекватной модели производится на основе средней ошибки аппроксимации ε (формулы 69, 70).

(69)

или

(70)

где х – теоретическое значение, рассчитанное на основе выбранной модели;

ухi – индивидуальное значение результативного показателя, рассчитанное по уравнению;

– среднее значение результативного показателя, рассчитанное по уравнению;

уi – фактические индивидуальные значения результативного показателя;

n – количество наблюдений.

Наибольшее значение ошибки аппроксимации свидетельствует о том, что оцениваемая модель дает наиболее адекватное описание формы взаимосвязи. Причем ошибка аппроксимации не должна превышать 0,2, или 20%.

Прямолинейное уравнение регрессии показывает равномерное нарастание результативного признака с увеличением факторного: у=а+bх, параметры а и b определяются на основе системы уравнений:

где n – количество наблюдений.

Коэффициент регрессии b показывает, на сколько единиц в среднем изменяется результативный признак у с изменением на одну единицу факторного признака х. Эта всегда именованная величина b на графике показывает угол наклона прямой.

Свободный член а показывает начальную ординату, т.е. расстояние от начала координат до пересечения прямой с осью у.

Значения коэффициентов определяются методом наименьших квадратов. Он основан на предположении, что линия, выравнивающая эмпирические данные, должна проходить так, чтобы сумма квадратов отклонений от этой линии была наименьшей, т.е.: ∑(y - ухi)2 = min, ∑(y - ух)2 = 0.

Криволинейная форма связи может быть представлена уравнением гиперболы, параболы, логарифмической функцией и т.д.:

а) уравнение гиперболы:

б) параболическая форма связи может описываться параболическим уравнением, например параболой 2-ro порядка:

у=а+ьх+сх2,

в) при логарифмической форме связи:

y=a+b Igx,

Пример. Применение корреляционно-регрессионного анализа рассмотрим на примере прямолинейной зависимости между факторами х и результативным признаком у. Показатели условные, так как назначение примера – продемонстрировать основные процедуры метода. Обозначим х качество товара в баллах, у – розничная цена, руб.

Исходные и расчетные данные приведены в таблице 22.

Таблица 22 – Данные для расчета коэффициента корреляции и параметров уравнения прямой

№ п/п

х

у

х-

(х-х)2

tx*ty

х2

ху

у2

1

2

12

-10

-6

100

36

- 1,395

-1,261

1,759

4

24

144

2

4

11

-8

-7

64

49

-1,116

- 1,470

1,641

16

44

121

3

6

14

-6

-2

36

16

- 0,837

-0,840

0,703

36

84

196

4

8

16

-4

-2

16

4

- 0,558

- 0,420

0,234

64

128

256

5

10

17

-2

-1

4

1

- 0,279

- 0,210

0,059

100

170

289

6

12

19

0

1

0

1

0

+0,210

0

144

228

361

7

15

20

3

2

9

4

0,418

+0,420

0,176

225

300

400

8

17

21

5

3

25

9

0,697

+0,704

0,491

289

357

441

9

20

23

8

5

64

25

1,116

+1,050

1,308

400

460

529

10

26

27

14

9

196

81

1,953

+ 1,891

3,693

676

702

729

120

180

0

0

514

226

0

0

9,836

1954

2497

3466

Расчет коэффициентов корреляции проводится по формуле (64):

Зависимость между показателями весьма высокая.

Коэффициент корреляции рассчитываем по формуле (63):

Рассчитанный коэффициент корреляции показывает, что качество товара - основной ценообразующий фактор.

Коэффициент детерминации d = r2, d = 0,982 = 0,96 означает, что цена товара на 96,0 % зависит от качества, влияние прочих факторов составляет 4,0 %.

Положительное значение коэффициента корреляции свидетельствует о наличии прямой связи между показателями.

Определим зависимость между ценой и качеством товара на основе уравнения прямой: у =а +bх.

Составим систему нормальных уравнений по данным таблицы 22:

Умножив все члены первого уравнения на 12 и вычтя из второго уравнения первое, получим: 514b = 337; b=0,656. подставив полученное значение в первое или второе уравнение, получим а = 10,13.

Уравнение прямой примет вид: у = 10,13 + 0,66х. Коэффициент регpeссии b = 0,66 означает, что при изме­нении качества на 1 балл цена товара возрастает на 0,66 руб.

Этот условный пример показывает возможности метода в изучении зависимости между стохастическими показателями.

Математический аппарат регрессионного и корреляционного анализа оказался очень удобным для определения взаимозависимостей между различными величинами. Но наряду с простотой у этих видов анализа имеется существенный недостаток – исследуется только линейная зависимость между результирующим параметром и независимым фактором.

На практике значительно чаще встречаются многомерные зависимости, т.е. такие, в которых результирующий параметр зависит от многих факторов, и зависимости нелинейные.

Определение нелинейной корреляционной зависимости. Одним из способов нахождения зависимости является метод замены переменной. Этот метод довольно часто используется при решении различных математических задач. Он заключается в том, что независимый фактор заменяется некоторой функцией этого фактора, которая переводит нелинейную зависимость в разряд линейных.

Например, рассмотрим нелинейную зависимость вида у = х2. Это не что иное, как парабола с вершиной в начале координат. Зависимость явно нелинейная.

Сделаем замену переменной z = х2. После подстановки в исходное уравнение получим зависимость вида у = z, которая уже является линейной. Для нее можно использовать весь математический аппарат регрессионного и корреляционного анализа, т.е. можно находить регрессионное уравнение, ко­эффициенты парной корреляции, ошибки и т. д.

Некоторые виды подстановок приведены в таблице 23.

Таблица 23 – Различные виды подстановок, с помощью которых осуществляется переход от нелинейных зависимостей к линейным

Вид нелинейной зависимости

Подстановка

1

у= 1/( а + b* x)

у= 1 / y

2

у=а+ b/x

x= I/x

3

y=x/(a+b*x)

y= x / y

4

y= 1 / + b* ехр(-x))

x= ехр(-x) y= 1 / y

5

y= а* ехр(b*x)

Y = log(y)

6

y =

у=y2

7

y= ехр[а + b* ехр(x)]

x = ехр(x) y = log(y)

8

у= а*x/(b+x)

x= 1 / x, у= 1 / y

Вопросы для самоконтроля

  1. Какие способы стохастических (корреляционных) взаимосвязей вы знаете?

  2. Какие задачи решает корреляционный анализ?

  3. Охарактеризуйте виды корреляций.

  4. Приведите общую формулу корреляционного отношения (η).

  5. Как определяется коэффициент корреляции (r)?

  6. Назовите этапы корреляционного анализа связи парной корреляции.

100

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]