Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
11_Конспекты лекций.doc
Скачиваний:
42
Добавлен:
11.11.2019
Размер:
1.19 Mб
Скачать

1. Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции

"correlatio" – соотношение, взаимосвязь

английские

статистики

Ф.Гальтон К.Пирсон

середина

XIX века

"regressio" – движение назад

Функциональная зависимость – каждому значению одной переменной соответствует по некоторому правилу единственное значение другой переменной.

Статистическая зависимость – каждому значению одной переменной соответствует множество значений другой переменной. Точнее, каждому значению одной переменной соответствует распределение (условное) другой переменной (стохастическая или вероятностная зависимость).

Например, зависимость урожайности от количества внесенных удобрений.

Определение 1. Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.

Mx(Y)=(x) или My(X)=(y) – уравнения регрессии Y по X или X по Y , функции (x) и (y) – функции регрессии, а их графики – линии регрессии.

Для отыскания уравнений регрессии необходимо знать закон распределения двумерной случайной величины (X,Y). На практике, как правило, известна некоторая выборка пар значений (xi, yj). Поэтому ставят вопрос об оценке (приближенном выражении) функций регрессии, которую проводят методом наименьших квадратов.

Основные задачи теории корреляции:

– основной задачей регрессионного анализа является установление формы и изучение зависимости между случайными переменными;

– основной задачей корреляционного анализа является выявление связи между случайными переменными и оценка тесноты связи.

2. Линейная корреляция. Уравнения прямых регрессии для парной корреляции

Данные о статистической зависимости между двумя переменными величинами удобно задавать в виде корреляционной таблицы:

y1

y2

yj

ym

Всего:

или ni

x1

n11

n12

n1j

n1m

n1

x2

n21

n22

n2j

n2m

n2

xi

ni1

ni2

nij

nim

ni

xl

nl1

nl2

nlj

nlm

nl

Всего:

или nj

n1

n2

nj

nm

n

где: l – число интервалов по переменной X, m – число интервалов по переменной Y;

xi и yj – середины соответствующих интервалов;

nij – частоты пар (xi ; yj) ;

, ;

– объем выборки.

Определение 1. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии (x) и (y) являются линейными.

Этот вид корреляционной зависимости встречается довольно часто. В этом случае обе линии регрессии являются прямыми и называются прямыми регрессии.

Выведем уравнение прямой регрессии Y по X , т.е. найдем коэффициенты линейной функции (x)=aх+b.

Для этого применим метод наименьших квадратов, согласно которому неизвестные параметры a и b выбираются так, чтобы была минимальной сумма:

,

где групповые средние вычисляются по формулам:

.

Используя необходимое условие экстремума функции двух переменных, получаем систему нормальных уравнений для определения параметров линейной регрессии:

,

где соответствующие средние вычисляются по формулам:

, , , .

Решая систему нормальных уравнений, получаем:

, , где:

– выборочная дисперсия переменной X, выборочная ковариация.

Коэффициент a в уравнении регрессии называется выборочным коэффициентом регрессии Y по X и обозначается yx. Итак,

Аналогично уравнение прямой регрессии X по Y имеет вид , где выборочный коэффициент регрессии X по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной Y на одну единицу. Здесь есть выборочная дисперсия переменной Y, где .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]