Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Minashkin-TeoriyaStatistiki2008.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
10.68 Mб
Скачать

8.3. Множественная (многофакторная) регрессия

Изучение связи между тремя и более связанными между собой признаками носит на-

звание множественной (многофакторной) регрессии:

y1, 2,...,k =

f ( x1 , x2 ,..., xk )

Построение моделей множественной регрессии включает несколько этапов:

1. Выбор формы связи (уравнения регрессии);

2. Отбор факторных признаков;

3. Обеспечение достаточного объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти свя- зи. Основное значение имеют линейные модели в силу простоты и логичности их эконо- мической интерпретации.

103

СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ

Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.

С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных при- знаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая мо- дель будет недостаточно адекватна исследуемым явлениям и процессам.

Проблема отбора факторных признаков для построения моделей взаимосвязи мо- жет быть решена на основе интуитивно-логических или многомерных математико- статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заклю- чается в реализации алгоритмов последовательного «включения», «исключения» или

«включения-исключения» факторов в уравнение регрессии и последующей проверке их статистической значимости. Алгоритм «включения» заключается в том, что факторы по- очередно вводятся в уравнение так называемым «прямым методом». При проверке значи- мости введенного фактора определяется, на сколько уменьшается сумма квадратов остат- ков и увеличивается величина множественного коэффициента корреляции (R2). Одновре-

менно используется и алгоритм последовательного «исключения», сущность которого за- ключается в том, что исключаются факторы, ставшие незначимыми по статистическим критериям.

Фактор является незначимым, если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффи- циента регрессии не изменяется (или меняется несущественно), то данный признак суще- ственен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.

При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в

x

модель (r

ij

> 0,8) .

Наличие мультиколлинеарности между признаками вызывает:

искажение величины параметров модели, которые имеют тенденцию к завышению,

чем осложняется процесс определения наиболее существенных факторных призна-

ков;

изменение смысла экономической интерпретации коэффициентов регрессии.

В качестве причин возникновения мультиколлинеарности между признаками мож-

но выделить следующие:

• изучаемые факторные признаки являются характеристикой одной и той же стороны изучаемого явления или процесса. Например: показатели объема производимой

продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

факторные признаки являются составляющими элементами друг друга. Например:

показатели выработки продукции на одного работающего и численность работаю-

104

СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ

щих одновременно в модель включать нельзя, так как в основе расчета показателей лежит один и тот же показатель – численность работающих на предприятии.

факторные признаки по экономическому смыслу дублируют друг друга.

Устранение мультиколлинеарности может реализовываться через исключение из

корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

Вопрос о том, какой из факторов следует отбросить, решается на основании каче- ственного, логического анализа изучаемого явления, а также на основе анализа тесноты связи между результативным (y) c каждым из сильно коллинеарно связанных факторных признаков. Из дальнейшего анализа целесообразно исключить тот факторный признак, связь которого с результативным наименьшая.

Качество уравнения регрессии зависит от степени достоверности и надежности ис- ходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.

Аналитическая форма связи результативного признака от нескольких факторных выражается и называется многофакторным (множественным) уравнением регрессии или моделью связи.

Линейное уравнение множественной регрессии имеет вид:

где

y1,2,..., k

= a0 + a1 x1 + a2 x 2 +...+ak x k

y1,2,3,..., k – теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

x 1, x 2 ,..., x k факторные признаки;

a1, a2 , ..., ak – параметры модели (коэффициенты регрессии).

Параметры уравнения могут быть определены графическим методом или методом наименьших квадратов.

Пример.

По следующим данным о выручке (y), спросу по номиналу (x1) и объему продаж (x2)

корпоративных ценных бумаг определим зависимость между признаками.

Таблица 8.4.

Основные характеристики корпоративных ценных бумаг

Серия ценной бумаги

Выручка,

млрд. руб., y

Спрос по номиналу,

млрд. руб., x1

Объем продаж по номиналу,

млрд. руб., x2

0001

0002

0003

0004

0005

0006

0007

3,0

5,4

5,9

4,8

3,3

3,4

5,3

6,8

11,2

9,1

6,9

6,4

6,9

12,2

3,5

6,7

6,8

5,9

3,8

4,3

6,9

Итого

31,1

59,5

37,9

105

СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ

Система нормальных линейных уравнений имеет вид:

na0 + a1 x1 + a2 x2 = y

2

a0 x1 + a1 x1 + a2 x1 x2 = x1 y

2

a0 x2 + a1 x1 x2 + a2 x2 = x2 y

Для определения параметров линейного уравнения регрессии составим расчетную таблицу:

Расчетная таблица для определения параметров

Таблица 8.5.

уравнения регрессии выручки от реализации корпоративных ценных бумаг

Серия ценной

бумаги

Выручка,

млрд. руб., y

Спрос по номиналу,

млрд. руб.,

x1

Объем продаж по номиналу,

млрд. руб.,

x2

2

x1

x1 x2

x1 y

2

x 2

x2 y

0001

0002

0003

0004

0005

0006

0007

3,0

5,4

5,9

4,8

3,3

3,4

5,3

6,8

11,2

9,1

6,9

6,4

6,9

12,2

3,5

6,7

6,8

5,9

3,8

4,3

6,9

46,24

125,44

82,81

47,61

40,96

47,61

148,84

23,80

75,04

61,88

40,71

24,32

29,67

84,18

20,40

60,48

53,69

33,12

21,12

23,46

64,66

12,25

44,89

46,24

34,81

14,44

18,49

47,61

10,50

36,18

40,12

28,32

12,54

14,62

36,57

Итого

31,1

59,5

37,9

539,51

339,6

276,93

218,73

178,85

Система уравнений примет следующий вид:

7a0 + 59,5a1 + 37,9a2 = 31,1

Таким образом:

59,5a0 + 539,51a1 + 339,6a2 = 276,93

37,9a0 + 339,60a1 + 218,73a2 = 178,85

1

2

yx , x

= 0,378 0,082x1 + 0,879x2 .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]