Добавил:
Меня зовут Катунин Виктор, на данный момент являюсь абитуриентом в СГЭУ, пытаюсь рассортировать все файлы СГЭУ, преобразовать, улучшить и добавить что-то от себя Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математика / Лекции / Теория вероятностей.doc
Скачиваний:
96
Добавлен:
09.08.2023
Размер:
1.26 Mб
Скачать

6. Простейшие случаи парной нелинейной корреляционной зависимости. Корреляционное отношение. Нелинейное уравнение регрессии

Простейшие случаи парной нелинейной корреляционной зависимости – это гиперболическая и параболическая. Их уравнения регрессии, соответственно, имеют вид:

.

Как и в случае линейной зависимости, параметры ai , i = 0,1,2 находятся методом наименьших квадратов, который дает следующие системы нормальных уравнений.

Для гиперболической зависимости:

Для параболической зависимости:

Параметры ai, находим, решая эти системы нормальных уравнений.

Теснота взаимосвязи между признаками в нелинейной зависимости измеряется с помощью корреляционного отношения, рассчитываемого по формуле:

где Dобщ – общая дисперсия признака Y;

Dм/гр – межгрупповая дисперсия признака Y.

Общая дисперсия результативного признака Y складывается из двух дисперсий: межгрупповой и внутригрупповой, то есть Dобщ = Dм/гр + Dвн/гр. Межгрупповая дисперсия Dм/гр характеризует вариацию признака Y за счет учтенного фактора, а внутригрупповая дисперсия Dвн/гр – за счет неучтенных факторов.

Dобщ  ; Dм/гр  ,

где yi – значение признака Y, i =  ;

 – условная средняя признака Y, j =  ;

 – общая средняя признака Y;

 – частота значений признака Y;

 – частота значений признака X;

n – объем выборки (сумма всех частот).

Корреляционное отношение изменяется от 0 до 1, то есть 0    1. Чем ближе к 0, тем слабее связь между результативным признаком Y и учтенным фактором Х, чем ближе к 1 – тем эта связь сильнее.

С помощью корреляционного отношения можно оценить тесноту взаимосвязи между признаками и в случае линейной зависимости, так какrв =  в случае линейной зависимости.

D = 2  100 % – коэффициент детерминации, показывающий на сколько процентов в среднем вариация результативного признака объясняется за счет вариации учтенного факторного признака.

 0,185 + 0,0362x – 0,0001x2.

7. Множественный корреляционно-регрессионный анализ

Корреляционная взаимосвязь между тремя и более признаками (показа­телями) называется множественной корреляционной зависимостью. Во множественной корреляционной зависимости решаются те же задачи, что и в парной, а именно: оценивается теснота взаимосвязи между признаками (корреляционный анализ), определяется аналитическое выражение этой взаимосвязи приближенно в виде уравнения регрессии (регрессионный анализ). Но во множественном регрессионном анализе предварительно решается еще одна задача – отбор факторных признаков в уравнение регрессии (регрессионную модель). При отборе факторных признаков в регрессионную модель необходимо учитывать следующие условия:

1) в модель вводятся факторные признаки, оказывающие сильное влияние на результативный признак;

2) факторные признаки, вводимые в модель, должны быть линейно независимыми или иметь слабую связь между собой. Отбор признаков проводят по матрице парных коэффициентов корреляции, которая имеет вид:

Y

X1

X2

...

Xj

...

Xn

Y

1,0

...

...

X1

1,0

...

...

X2

1,0

...

...

...

...

...

...

...

...

...

...

Xi

...

...

...

...

...

...

...

...

...

...

Xn

1,0 .

Коэффициент корреляции указывает на тесноту взаимосвязи между результативным признаком и каждым факторным признаком. Поэтому значения этих коэффициентов должны быть как можно ближе к единице.

Коэффициенты корреляции указывают на тесноту взаимосвязи между каждой парой факторных признаков. Так как факторные признаки должны находиться в слабой зависимости, то значения коэффициентов   должны быть как можно меньше.

Факторные признаки, находящиеся в тесной корреляционной зависимости, называют мультиколлинеарными. Практически считают, что если    0,8 , то признаки мультиколлинеарны. Из каждой пары мультиколлинеарных признаков в регрессионную модель вводят только один, а именно тот, который оказывает наибольшее влияние на результативный признак, или исходя из экономической целесообразности.

18