Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
190700 Мат.статистика на транспорте.doc
Скачиваний:
28
Добавлен:
16.02.2016
Размер:
1.21 Mб
Скачать

2. Система двух случайных величин и регрессия

Система двух случайных величин– совокупность двух случайных величин (X,Y), которые рассматриваются одновременно.

Измерения обычно осуществляются попарно, а полученные значения случайных величин X и Y в определенном смысле взаимосвязаны.

Закон распределения двумерной случайной величины дискретного типа представляет собой перечень значений этой величины и их вероятностей, указанных в специальной таблице. В табл.1 представлены возможные значения (xi, yj) и их совместные вероятности:

. Зная закон распределения дискретной двумерной случайной величины (X,Y), можно найти закон распределения каждой случайной величиныX и Y:

;

.

Таблица 1

Закон распределения двумерной случайной величины

Y

X

x1

x2

xi

xn

pyj

y1

p11

p21

pi1

pn1

py1

y2

p12

p22

pi2

pn2

py2

yj

p1j

p2j

pij

pnj

pyj

ym

p1m

p2m

pim

pnm

pym

pxi

px1

px2

pxi

pxn

Интегральная функция распределениядвумерной случайной величины (X,Y) есть вероятность совместного выполнения неравенствX < xиY < y, т.е.

F(x,y) = P(X < x, Y < y).

Двумерная случайная величина непрерывного типа может быть задана интегральной или дифференциальной функцией распределения. Если интегральная функция распределения всюду непрерывна и имеет непрерывную смешанную частную производную второго порядка, то дифференциальная функция распределения системы двух случайных величин (X,Y) определяется по формуле

.

Плотность распределения отдельных случайных величин, входящих в систему, выражается через плотность системы случайных величин следующим образом:

.

Условный закон распределенияслучайной величины, входящей в систему, есть закон ее распределения, полученный в предположении, что другая случайная величина приняла определенное значение. Для системы случайных величин дискретного типа условные законы распределения имеют вид:

.

Условные математические ожидания (условные средние) дискретных случайных величин:

Условные распределения показывают, что одна СВ реагирует на изменение другой изменением своего закона распределения. Такая общая зависимость называется стохастической (вероятностной) и достаточно сложна для изучения. Однако зависимость условного среднего одной СВ от значений другой является функцией, которая называется регрессией: – регрессияYнаX, – регрессияXнаY. Но и функции регрессии в общем случае достаточно сложны, поэтому используют различные их приближения, например линейной функцией (наилучшей в смысле наименьшего значения среднего квадрата отклонения). Это значит, что для регрессииYнаX,функция приближается линейной функциейy = ax + b:

.

Запишем уравнения таких наилучших линейных регрессий.

Для регрессии YнаX это уравнение:

,

а для регрессии XнаY:

,

где ,,,.

Коэффициент корреляции

характеризует близость (или тесноту) связи между случайными величинами к линейной.

Отметим, что всегда . Если, то СВ называютсянекоррелированнымии в этом случае их условные средние значения являются постоянными, т.е. не зависят от значений другой СВ, что характеризует их слабую взаимозависимость. Если(угол между прямыми наилучших линейных регрессий близок к прямому), связь между случайными величинами достаточно слабая и нелинейная. Если(угол близок к нулю), то связь сильная и близка к линейной. В случае промежуточного значенияrxy(и угла) связь достаточно сильна и существенно нелинейная.