Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТВиМС.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.56 Mб
Скачать

Регрессионный анализ

Регрессионный анализ это поиск аналитического выражения связи, в котором изменение результативного признака обуславливается влиянием одного или нескольких факторных признаков, а множество всех прочих факторов принимается за постоянные (или усредненные) величины

Связь между случайными величинами может быть прямо пропорциональной, гиперболической, параболической, экспоненциальной и др.

В основе регрессионного анализа лежит метод наименьших квадратов, который заключается в построении такой математической модели, что сумма квадратов отклонений эмпирических данных от теоретических была бы минимальной.

В уравнении однофакторной линейной регрессии , параметр означает среднее изменение величины результативного признака , в зависимости от изменения значений факторного признака х, если все остальные факторы, влияющие на результативный признак рассматриваются как неизменные. Параметр показывает, насколько в среднем величина одного признака Y изменяется при изменении на единицу меры другого корреляционно связанного с Y признака X. Свободный член отражает усредненное влияние всех неучтенных факторов.

При исследовании корреляции между количественными признаками, значения которых можно точно измерить в единицах метрических шкал (рубли, секунды, килограммы и т.д.), очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Эта модель отображает зависимость между переменными величинами xi и yi в системе прямоугольных координат. Зависимость может быть от ( ) и от ( ). Наглядно эти зависимости можно представить в виде диаграммы рассеивания или корреляционного поля.

Пример. В результате группировки 100 рабочих по общему стажу работы и месячной заработной плате получена следующая корреляционная таблица, представленная в виде интервального вариационного ряда:

Группы рабочих по общему стажу работы (лет)

Группы рабочих по размеру заработной платы (руб.)

100-120

120-140

140-160

160-180

180-200

200-220

220-240

Итого

0-5

5

6

14

7

32

5-10

3

4

7

10

2

26

10—15

1

2

6

5

4

18

15-20

4

1

6

1

12

20—25

1

3

1

3

8

25—30

1

2

1

4

Для характеристики связи между рассматриваемыми показателями необходимо провести корреляционно-регрессионный анализ двумерной модели.

Решение. Обозначим общий производственный стаж рабочих через , а их месячную заработную плату - .

Для графического изображения зависимости в прямоугольной системе координат по оси абсцисс отложим значения признака – фактора (производственный стаж), а по оси ординат – средние значения интервалов зависимого признака (заработную плату).

Рис. 7 Корреляционное поле

На основе анализа корреляционного поля можно предположить, что между заработной платой и стажем рабочих существует прямая регрессия:

.

Для нахождения значений величин и , входящих в систему нормальных уравнений, составим расчетные таблицы, введя в них одновременно и величины, необходимые для расчета коэффициента корреляции (в качестве вариант возьмем середины интервалов):

x

y

110

130

150

170

190

210

230

my

у my

у2 my

2,5

5

6

14

7

32

80

200

7,5

3

4

7

10

2

26

195

1462,5

12,5

1

2

6

5

4

18

225

2812,5

17,5

4

1

6

1

12

210

3675

22,5

1

3

1

3

8

180

4050

27,5

1

2

1

4

110

3025

mx

5

10

20

25

20

15

5

100

1000

15225

X mx

550

1300

3000

4250

3800

3150

1150

17200

X2 mx

60500

169000

450000

722500

722000

661500

264500

3050000

∑у mxy

12,5

50

90

237,5

250

247,5

112,5

1000

x∑у mxy

1375

6500

13500

40375

47500

51975

25875

187100

Коэффициент корреляции вычисляется по формуле:

.

Из таблицы определяются: ,

Например, для (X=150) , для (Y=12,5)

,

Подставим найденные величины в формулу коэффициента корреляции и получим:

Полученное значение коэффициента корреляции по шкале Чеддока указывает на наличие заметной линейной связи между общим производственным стажем и заработной платой рабочих.

Вычислим коэффициенты уравнения регрессии, для этого подставим найденные значения в систему уравнений, полученную на основе метода наименьших квадратов:

получим:

.

В результате совместного решения уравнений находим: =143,1 и =2,89. Искомое уравнение прямой регрессии примет вид:

.

Это уравнение показывает, что между общим производственным стажем и заработной платой рабочих имеется прямая связь: с увеличением стажа на один год размер месячной заработной платы возрастает в среднем на 2р.89 у.е. ( ).

Однако чаще уравнение регрессии записывают с использованием выборочного коэффициента корреляции:

,

где , ,

объем выборки

Для данной задачи

, , , , , окончательно

Корреляция и регрессия тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму.