Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка для бакалавров 2012 (2).doc
Скачиваний:
129
Добавлен:
29.03.2016
Размер:
1.58 Mб
Скачать

Тема 10. Корреляционно-регрессионный анализ Методические указания к теме

В экономических исследованиях встречаются стохастические зависимости, которые отличаются приблизительностью, неопределенностью. Они наблюдаются только в среднем по значительному количеству объектов (наблюдений). Например, увеличение фондовооруженности труда рабочих дает разный прирост производительности труда на разных предприятиях. Это объясняется тем, что все факторы, от которых зависит производительность труда, действуют в комплексе.

Корреляционная (стохастическая) связь – это неполная зависимость между показателями, которая проявляется только в массе наблюдений.

Различают парную и множественную корреляцию.

Парная корреляция – это связь между двумя показателями, один из которых является факторным, а другой – результативным.

Множественная корреляция возникает от взаимодействия нескольких факторов с результативным показателем.

Основное уравнение связи находят с помощью составления параллельных рядов, группировки данных и линейных графиков. Размещение точек на графике покажет, какая зависимость образовалась между изучаемыми показателями: прямолинейная или криволинейная.

Необходимые условия применения корреляционного анализа.

Наличие достаточно большого количества наблюдений о величине исследуемых факторных и результативных показателей (в динамике или за текущий год по совокупности однородных объектов).

Исследуемые факторы должны иметь количественное изменение и отражение в тех или иных источниках информации.

Этот метод призван решать следующие задачи:

1) Выявить зависимость признаков;

2) Установить форму связи и находить ее аналитическое выражение;

3) Измерять степень тесноты связи;

4) Рассчитывать теоретические уровни;

5) Анализировать результаты.

Первая задача – предполагает логическую обработку первичного материала, отбор фактов, влияющих на результативный признак, выявление зависимостей с помощью метода группировок.

Вторая задача – предполагает измерение степени тесноты связи с помощью коэффициента корреляции с целью суждения об адекватности полученной модели данному экономическому процессу или явлению.

Третья задача – состоит в том, чтобы по полученному уравнению регрессии находить теоретические уровни, т.е. плановые показатели на предстоящий период или прогнозировать развитие явления.

Термин «корреляция» от латинского «correlatio» - соотношение, заимствована из естествознания. Суть в том, что значениям факторного признака соответствуют не строго определенные значения результативного признака, как в функциональных связях, а распределение этих значений,

Термин «регрессия» – заимствовано из биологии, от латинского «regressio» – движение назад.

Корреляционно-регрессионный метод исследования состоит из двух этапов.

Корреляционный метод решает следующие задачи:

-выявить зависимость между признаками;

-установить форму связи и находить ее аналитическое выражение;

-измерять степень тесноты связи.

Регрессионный метод решает следующие задачи:

-дает выражение аналитической форме связи в виде уравнения связи (регрессии);

-на основании этого выражения рассчитываются ожидаемые или планируемые показатели на предстоящий период.

Исходные эмпирические (фактические) данные наносим на графике корреляционного поля и на основании графика делаем вывод о форме связи. На оси абсцисс откладываем факторные значения признака, а на оси ординат результативные. Построив график по эмпирическим значениям обоих признаков, делаем вывод о форме связи, ее направлении, а по разбросу точек – о тесноте связи.

Расположение точек на графике («корреляционное поле») может показать прямую, обратную зависимость или отсутствие зависимости. Графический метод – это самый простой метод определения формы связи.

Прежде чем перейти к построению уравнения регрессии необходимо определить коэффициент корреляции парной или множественной, с тем, чтобы убедиться в необходимости дальнейших расчетов.

Следующим этапом исследования является количественное определение степени влияния факторных признаков на результативный. Мерой существенности влияния являются показатели тесноты связи: линейный коэффициент корреляции (r) при прямолинейной форме связи и корреляционное отношение (n) при криволинейной форме связи, которые дают возможность судить в будущем о соответствии полученной экономико-статистической модели экономическому процессу или явлению.

Линейный коэффициент корреляции обозначается «r» и изменяется при прямой связи от 0 до +1, а при обратной связи – от 0 до –1. О тесноте связи свидетельствует абсолютная величина коэффициента корреляции, Чем теснее связь между признаками, тем ближе к единице будет значение линейного коэффициента корреляции и наоборот. Для качественной оценки связи используется таблица Чеддока.

Таблица Чеддока

Значение коэффициента

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Характеристика тесноты связи

Слабая

Умеренная

Заметная

Высокая

Весьма высокая

При наличии криволинейной связи «r» недооценивает тесноту связи и в некоторых случаях дает неверное представление о степени тесноты связи.

На этом заканчивается первый этап исследования – корреляционный анализ, который позволил определить направление, форму и силу тесноты связи. Результаты корреляционного анализа служат основой для проведения регрессионного анализа, дающего выражение аналитической форме связи в виде построения теоретического уравнения регрессии.

В качестве примера, приведем расчеты выполненные для ЦББ (Центральная Бассейновая больница).

Как правило, исследуемые процессы характеризуются большой сложностью и многообразием, и представляют собой результат действия многих факторов. Поэтому, чтобы отразить это влияние на результативный признак, необходимо производить расчеты на основе методов множественной корреляции. Это очень громоздкие расчеты, но использование современного программного обеспечения позволяет сократить трудоемкость расчетов. Но смысл корреляционно-регрессионного анализа не теряется, если для упрощения расчетов будем исходить из двухфакторного комплекса, т.е. такая постановка задачи выполнена выше. В расчетах будут участвовать два признака, на результативный будет действовать один факторный признак.

При анализе должно выполняться основное условие – качественная и количественная однородность единиц наблюдения, которое обеспечивает получение регрессионной модели, адекватной эмпирическим данным (статистическому материалу).

Выполняются соответствующие расчеты для каждой больницы на статистическом материале за последние 4 года.

Для центральной больницы формируем расчетную таблицу для нахождения линейного коэффициента корреляции и параметров уравнения регрессии.

Расчетная таблица для «r» и уровня регрессии

Х

Объем медицинских услуг в койко-днях, тыс.койко-дней

У

Расходы по заработной плате медперсонала, тыс. руб.

ХУ

Х2

У2

Ух

46540

22258

1035887320

2165971600

495418564

22156

50728

36020

1827222560

2573329984

1297440400

36395

53591

46410

2487158310

2871995281

2153888100

46129

52952

43911

2325175272

2803914304

1928175921

43956

åХ

åУ

åХУ

åХ2

åУ2

203811

148599

7675443462

10415211169

5874922985

Линейный коэффициент корреляции для парной зависимости исчисляется по следующей формуле:

(84)

где n - количество точек в выборке.

Существуют и другие модификации этой формулы. Подставляя значения в формулу, получим 0,69, что свидетельствует о высокой тесноте связи между изучаемыми признаками, а знак при коэффициенте «плюс» – о прямой связи.

В целях синтезирования модели y от x определите уравнение прямолинейной связи и нанесите полученную при этом теоретическую линию регрессии на график корреляционного поля.

Уравнение прямой линии имеет вид:

Ух= ао + а1 х;

(85)

где Ух – индивидуальные значения результативного признака;

х - индивидуальные значения факторного признака;

ао, а1 – параметры уравнения регрессии.

Способом наименьших квадратов решим систему нормальных уравнений, находя параметры ао и а1:

(86)

Делим каждое уравнение на коэффициенты при ао и получаем:

Путем вычитания из второго уравнения первого получаем:

150 а1 = 510: а1 = 3,4

Подставляя значение а1 в первое уравнение получаем:

Ао+50950 ×3,4 = 37150:ао = -136,080

Уравнение регрессии примет вид:

Ух= - 136,080 + 3,4х

Проверка указана в последней графе таблицы.

Соответствующие расчеты свидетельствуют о тесноте связи между признаками, т.е. о степени адекватности предполагаемой регрессионной модели процессу, который она описывает: ЦББ – 0,69. Линейный коэффициент корреляции изменяется, при прямой связи, от 0 до 1, а она такова, что было доказано построением графиков на корреляционных полях. Чем теснее связь между признаками, тем ближе к единице будет значение коэффициента корреляции. Для качественной оценки тесноты связи используется таблица Чеддока, в соответствии с которой для ЦББ – связь оценивается как высокая.

Таким образом, используя полученную модель, можно достаточно быстро просчитать различные прогнозные варианты затрат по заработной плате в зависимости от различных вариантов объема медицинских услуг.

Соответствующие расчеты свидетельствуют о тесноте связи между признаками, т.е. о степени адекватности предполагаемой регрессионной модели процессу, который она описывает: ЦББ – 0,69. Линейный коэффициент корреляции изменяется, при прямой связи, от 0 до 1, а она такова, что было доказано построением графиков на корреляционных полях. Чем теснее связь между признаками, тем ближе к единице будет значение коэффициента корреляции. Для качественной оценки тесноты связи используется таблица Чеддока, в соответствии с которой для ЦББ – связь оценивается как высокая.

Таким образом, используя полученную модель, можно достаточно быстро просчитать различные прогнозные варианты затрат по заработной плате в зависимости от различных вариантов объема медицинских услуг.

Задача 67 

По данным таблицы определить зависимость урожайности зерновых культур (Y) от качества земли (Х).

Зависимость урожайности зерновых культур и качества земли

Номер хозяйства

Качество земли, балл

Урожайность, ц/га

Номер хозяйства

Качество земли, балл

Урожайность, ц/га

1

32

19,5

11

45

24,2

2

33

19,0

12

46

25,0

3

35

20,5

13

47

27,0

4

37

21,0

14

49

26,8

5

38

20,8

15

50

27,2

6

39

21,4

16

52

28,0

7

40

23,0

17

54

30,0

8

41

23,3

18

55

30,2

9

42

24,0

19

58

32,0

10

44

24,5

20

60

33,0

Система уравнений имеет вид:

Значения x, y, xy, x2 рассчитать на основе фактических данных, расчеты свести в таблицу.

n

x

y

xy

x2

y2

Yx

1

2

3

20

Итого

Задача 68 

Определить зависимость производительности труда (Y) от возраста работников (Х).

Поскольку при увеличении одного показателя значение другого возрастает до определенного уровня, а затем начинает снижаться (зависимость производительности труда от возраста), то для записи зависимости подходит парабола второго порядка:

Yx = a + bx + cx2

(87)

Система уравнений имеет вид:

(88)

Средний возраст по группе (Х)

Средняя месячная выработка (Y)

X/10

YX

X2

X2Y

X3

X4

Yx

20

4,2

25

4,8

30

5,3

35

6,0

40

6,2

45

5,8

50

5,3

55

4,4

60

4,0

Всего

46,0

Задача 69

Определить влияние на рентабельность (Y) материалоотдачи (Х1), фондоотдачи (Х2), производительности труда (Х3), продолжительности оборота оборотных средств (Х4), удельного веса продукции высшей категории качества. Рассчитать влияние каждого фактора на прирост уровня рентабельности.

Исходные данные для корреляционного анализа

№ п/п

Y

X1

X2

X3

X4

X5

1

22,5

2,4

80,0

8,00

25,0

25,00

2

23,8

2,7

88,0

7,30

23,0

22,5

3

24,7

2,5

87,0

7,90

22,0

26,0

40

32,4

3,20

94,4

9,90

18,0

36,5

Yх = a + b1x1 + b2x2 + b3x3 + … + bnxn

(89)

Расчет влияния факторов на прирост уровня рентабельности:

Факторный

показатель

Уровень показателя

Хi

bi

Yxi

план

факт

Х1

205

2.4

Х2

90.0

80.0

Х3

8.2

8.0

Х4

22.0

25.0

Х5

30.0

25.0

Y

25.0

22.5

-

Задача 70

По группам рабочих судостроительного завода имеются следующие данные:

Стаж работы, лет (x )

1

2

3

4

5

Выработка одного рабочего за смену, штук (y)

80

90

120

130

160

Рассчитайте линейный коэффициент корреляции стажа работы и выработки и коэффициент корреляции рангов. Проанализируйте параметры уравнения регрессии.