Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Uchebnoe_posobie_matmod_ispraveny_I.doc
Скачиваний:
5
Добавлен:
01.05.2025
Размер:
1.59 Mб
Скачать

Раздел 6. Моделирование экономических процессов

6.1 Линейная и нелинейная регрессия

Множественная регрессия представляет собой регрессию результативного признака с двумя или большим числом независимых пере­менных вида

У = ƒ(х1, х2, ..., хк).

В уравнении регрессии случайная величина у зависит не только от значений независимых переменных х1 х2, ..., хк, но и от ряда других факторов, влияющих на у, которые не могут быть проконтролированы. В связи с этим будем использовать запись вида

У = ƒ(х1 х2, ..., хк)+ е,

где е — случайная величина, характеризующая отклонения результативного признака от теоретического, найденного по уравнению регрессии. Статистический анализ случайной ошибки является одной из основных задач эконометрики.

При исследовании зависимости результативного признака у от ряда факторов х1 х2, ..., хк, необходимо решать такие же задачи, что и при парной связи двух переменных х и у:

  • определение вида регрессии;

  • оценка параметров;

  • определение тесноты связи, если переменные х и у — случайные величины.

Однако наряду с этими задачами необходимо рассматривать и ряд задач, характерных лишь для множественной регрессии и корреляции. К таким задачам относится отбор факторов х1, х2, ..., хк, существенно влияющих на фактор у, при наличии возможностей внутренней взаимосвязи между переменными х1, х2,..., хк. Такой отбор требует, прежде всего, глубокого теоретического и практического знания качественной стороны рассматриваемых экономических явлений.

Отбор факторов осуществляется обычно в нескольких этапов. Сначала отбираются факторы, связанные с изучаемым явлением на основе данных теоретического исследования (экономическая теория, заключения специалиста и т. д.). При этом для построения множественной регрессии и корреляции отбираются факторы, которые могут быть количественно измеримы.

Далее отобранные факторы подвергаются проверке существенности их влияния на изучаемый показатель с использованием методов математической статистики. Такая проверка, как правило, включает ана­лиз матрицы парных корреляций, частных корреляций, проверку существенности (значимости) коэффициентов регрессии на основе t-критерия, анализ остатков (отклонений) и т. д.

Особенностью множественной регрессии и корреляции является необходимость различать случаи корреляционной множественной связи, когда переменные х1, х2, ..., хk, являются случайными величинами; регрессионной, если переменные х1, х2,..., хkнеслучайными величинами, а также смешанный случай, когда некоторые из переменных — случайные величины, другие — неслучайные. В случае корреляционной зависимости следует вычислять и интерпретировать коэффициенты корреляции, при регрессионной зависимости это не имеет смыс­ла, а при наличии как случайных, так и неслучайных переменных коэффициенты корреляции следует вычислять только между случай­ными переменными.

Множественная линейная корреляционная зависимость

Рассмотрим отбор факторов для построения множественной линейной зависимости, когда переменные у, х1, х2 ..., хp являются случайными величинами (обычно предполагается, что их совместное распреде­ление нормальное).

Наиболее простой формой зависимости, достаточно строго обоснованной для случая совместного нормального распределения, является линейная зависимость, т.е. зависимость вида

У = а0 + а1х1 + а2х2 +... + аpхр. (6.1)

Такая зависимость во многих случаях довольно хорошо отражает сложившиеся экономические взаимосвязи. Исходная информация для построения зависимости (6.1) обычно задается в виде некоторой таблицы.

Факторы, для которых получены данные

x1

x2

x3

xk

y

1

x11

x21

x31

xk1

y1

2

x12

x22

x32

xk2

y2

3

x13

x23

x33

xk3

y3

N

x1n

x2n

x3n

xkn

yn

Следует определить, все ли переменные следует включать в уравнение (5.1) или есть переменные, которые существенно не влияют на величину у и их нецелесообразно включать в (6.1). В первом случае р = k, во втором р < k.

Для решения этого вопроса часто используется таблица, составленная из коэффициентов парной корреляции. Элементами такой таблицы являются коэффициенты парной корреляции для всех k факторов.

Таблица имеет вид

y

x1

x2

x3

xk

y

1

ryx1

ryx2

ryx3

ryxx

x1

rx1y

1

rx1 x2

rx1x3

r x1xk

x2

rx2y

rx2 x1

1

r x2xk

x3

rx3y

rx3 x4

rx3 x2

1

r x3xk

xk

rxky

rxk x1

rxk x2

1

В клетках таблицы записаны парные коэффициенты корреляции, например, r31 — парный коэффициент корреляции между переменными х3 и х1 и др. Коэффициенты rij и rji;, а также rxiy и ryxi совпадают, так как теснота связи между переменными у и хi такая же, как между хi и у, аналогично, для хi и хj Поэтому таблицу записывают в упрощенной симметричной форме (треугольная форма).

y

x1

x2

x3

xk

y

1

ryx1

ryx2

ryx3

ryxx

x1

-

1

ryx2

rx1x3

r x1xk

x2

-

-

1

rx2x3

r x2xk

x3

-

-

-

1

r x3xk

xk

-

-

-

-

1

По данным такой таблицы можно примерно оценить, какие факторы существенно влияют на переменную у, а какие — несущественно, а также выявить взаимосвязь между факторами.

Пример 1.

Пусть получена таблица

y

x1

x2

x3

y

1

0,6

0,5

0,7

x1

-

1

0,04

0,03

x2

-

-

1

0,1

x3

-

-

-

1

На основании указанных в таблице парных коэффициентов корреля­ции можно сделать вывод, что связь факторов х1, х2, х3 с фактором у существенная (коэффициенты корреляции, соответственно, 0,6; 0,5; 0,7). Теснота связи между факторами х1, х2, х3 незначительная (коэф­фициенты корреляции 0,04, 0,03, 0,1).

Такая информация наиболее благоприятна для построения уравнения (6.1).

Если факторы-аргументы не являются случайными величинами, то коэффициенты корреляции не могут быть использованы при построении уравнения регрессии, так как они не могут быть интерпретированы как показатели тесноты связи.

Существенность вводимых факторов в случае линейной множественной регрессии может быть проверена одновременно с существенностью коэффициентов регрессии. Для проверки существенности вычисляется отношение

t iii , і=1,n, (6.2)

где аi- — коэффициент множественной регрессии; σi — среднее квадратическое отклонение этого коэффициента.

Если ti< tта6л, взятого по таблицам t-распределения Стьюдента, то с заданной вероятностью не отвергается гипотеза, что соответствующий коэффициент регрессии аi- в генеральной совокупности (который не известен и который нужно оценить по данным выборки) равняется нулю. При этом iфактор в таком случае признается несуществен­ным для построенного уравнения регрессии.

При проведении исследования может оказаться, что вычисленные значения t для нескольких факторов не превышают tтабл В этом случае несущественные факторы из уравнения регрессии исключаются поочередно, начиная с наименьшего по абсолютной величине t. Фактор, соответствующий минимальному значению t, из уравнения регрессии исключается, и заново решается система нормальных уравнений. За­тем вновь вычисляются значения t для всех оставшихся в уравнении коэффициентов, определяется минимальное значение t, которое со­поставляется с tтабл. Если окажется, что tmin.< tтабл ,то фактор, имеющий tmin исключается.

Процесс исключения коэффициентов повторяется до тех пор, пока не будет выполняться соотношение tmin.≥ tтабл. В этом случае все оставшиеся в уравнении факторы существенны.

Проводить исключение из уравнения регрессии одновременно несколько факторов, имеющих t < tтабл. нецелесообразно, так как после исключения одного несущественного фактора коэффициенты регрессии других факторов меняются и несущественные факторы после пересчета могут оказаться существенными.

Аналогичный подход осуществляется и при наличии корреляционной зависимости, но на последней стадии отбора существенных факторов. Проверка значимости уравнения регрессии осуществляется по крите­рию Фишера

F2y / σ2ост

с числом степеней свободы υ1= п – 1 и υ 2 = п -р -1,

где σ2y =Σ(yi –y)2/(n-1).

σ2ост. =Σ(yi –ŷi)2/(n- p-1).

ŷiзначения у, полученные по данным наблюдений; уi — расчетные значения у, полученные для соответствующих значений х1, х2, ..., хр.

Полученное значение F сравнивается с Fта6л при выбранном уровне значимости. Если окажется F> Fта6л, то гипотеза о том, что х1, х2, ..., хр не имеют существенного влияния на у, отвергается.

Если F>Fта6л, , то следует ввести некоторые другие факторы, влияющие на показатель у, или перейти к построению нелинейной множественной регрессии.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]