
- •Теории вероятностей
- •1. Вероятность события. Непосредственный подсчет вероятностей
- •2. Теоремы сложения и умножения вероятностей Теорема сложения вероятностей несовместных событий
- •Теорема умножения вероятностей
- •3. Формула полной вероятности. Формула байеса
- •4. Повторные испытания. Формула бернулли. Асимптотические формулы (пуассона и муавра – лапласа)
- •5. Случайные величины. Способы их задания
- •6. Числовые характеристики случайной величины
- •7. Равномерное распределение
- •8. Показательное распределение
- •9. Нормальное распределение
- •Математической статистике
- •1. Вариационный ряд. Статистические распределения. Эмпирическая функция распределения. Графическое представление статистических распределений
- •2. Выборочные характеристики статистических распределений
- •3. Точечные и интервальные оценки параметров распределения
- •4. Проверка гипотезы о нормальном распределении генеральной совокупности
- •5. Парная линейная корреляционная зависимость. Парный линейный коэффициент корреляции, проверка его значимости. Линейное уравнение регрессии
- •6. Простейшие случаи парной нелинейной корреляционной зависимости. Корреляционное отношение. Нелинейное уравнение регрессии
- •7. Множественный корреляционно-регрессионный анализ
6. Простейшие случаи парной нелинейной корреляционной зависимости. Корреляционное отношение. Нелинейное уравнение регрессии
Простейшие случаи парной нелинейной корреляционной зависимости – это гиперболическая и параболическая. Их уравнения регрессии, соответственно, имеют вид:
.
Как и в случае линейной зависимости, параметры ai , i = 0,1,2 находятся методом наименьших квадратов, который дает следующие системы нормальных уравнений.
Для гиперболической зависимости:
Для параболической зависимости:
Параметры ai, находим, решая эти системы нормальных уравнений.
Теснота взаимосвязи между признаками в нелинейной зависимости измеряется с помощью корреляционного отношения, рассчитываемого по формуле:
где Dобщ – общая дисперсия признака Y;
Dм/гр – межгрупповая дисперсия признака Y.
Общая дисперсия результативного признака Y складывается из двух дисперсий: межгрупповой и внутригрупповой, то есть Dобщ = Dм/гр + Dвн/гр. Межгрупповая дисперсия Dм/гр характеризует вариацию признака Y за счет учтенного фактора, а внутригрупповая дисперсия Dвн/гр – за счет неучтенных факторов.
Dобщ =
;
Dм/гр =
,
где yi – значение
признака Y,
i =
;
– условная
средняя
признака Y,
j =
;
– общая средняя признака Y;
– частота
значений признака Y;
– частота
значений признака X;
n – объем выборки (сумма всех частот).
Корреляционное отношение изменяется от 0 до 1, то есть 0 1. Чем ближе к 0, тем слабее связь между результативным признаком Y и учтенным фактором Х, чем ближе к 1 – тем эта связь сильнее.
С помощью корреляционного отношения можно оценить тесноту взаимосвязи между признаками и в случае линейной зависимости, так какrв = в случае линейной зависимости.
D = 2 100 % – коэффициент детерминации, показывающий на сколько процентов в среднем вариация результативного признака объясняется за счет вариации учтенного факторного признака.
0,185 + 0,0362x – 0,0001x2.
7. Множественный корреляционно-регрессионный анализ
Корреляционная взаимосвязь между тремя и более признаками (показателями) называется множественной корреляционной зависимостью. Во множественной корреляционной зависимости решаются те же задачи, что и в парной, а именно: оценивается теснота взаимосвязи между признаками (корреляционный анализ), определяется аналитическое выражение этой взаимосвязи приближенно в виде уравнения регрессии (регрессионный анализ). Но во множественном регрессионном анализе предварительно решается еще одна задача – отбор факторных признаков в уравнение регрессии (регрессионную модель). При отборе факторных признаков в регрессионную модель необходимо учитывать следующие условия:
1) в модель вводятся факторные признаки, оказывающие сильное влияние на результативный признак;
2) факторные признаки, вводимые в модель, должны быть линейно независимыми или иметь слабую связь между собой. Отбор признаков проводят по матрице парных коэффициентов корреляции, которая имеет вид:
|
Y |
X1 |
X2 |
... |
Xj |
... |
Xn |
Y |
1,0 |
|
|
... |
|
... |
|
X1 |
|
1,0 |
|
... |
|
... |
|
X2 |
|
|
1,0 |
... |
|
... |
|
... |
... |
... |
... |
... |
... |
... |
... |
Xi |
|
|
|
... |
|
... |
|
... |
... |
... |
... |
... |
... |
... |
... |
Xn |
|
|
|
|
|
|
1,0 . |
Коэффициент корреляции указывает на тесноту взаимосвязи между результативным признаком и каждым факторным признаком. Поэтому значения этих коэффициентов должны быть как можно ближе к единице.
Коэффициенты корреляции указывают на тесноту взаимосвязи между каждой парой факторных признаков. Так как факторные признаки должны находиться в слабой зависимости, то значения коэффициентов должны быть как можно меньше.
Факторные признаки, находящиеся в тесной корреляционной зависимости, называют мультиколлинеарными. Практически считают, что если 0,8 , то признаки мультиколлинеарны. Из каждой пары мультиколлинеарных признаков в регрессионную модель вводят только один, а именно тот, который оказывает наибольшее влияние на результативный признак, или исходя из экономической целесообразности.