
Konspekt_Tv_2020_ch_6
.pdf
1.()
(
)
2. |
( |
|
) |
|
( |
|
) |
|
( |
|
) |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
( ) =2
3.()
(
)
4.| ()
5. Если X и Y независимы, то ()
|
|
|
|
|
( |
|
) |
|
{ |
6. Если Y=kX+b, то |
|
( |
) |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
Из свойства 6 ковариации, в частности вытекает, что если две гауссовские случайные величины независимы, то . Верно и обратное: если
, то две гауссовские с.в. независимы (докажите это). Но в общем случае из некоррелированности случайных величин (т. е. из того, что cov(X, Y) = 0) не следует их независимость.
Задача 6.5. Доказать свойства 1 и 3 коэффициента корреляции.
Доказательство свойства 2 коэффициента корреляции. Так как ( )= c2
DX; то |
( |
) |
|
|
|
|
|
|
|
|
|
||
( |
) |
( |
|
) |
= |
|
( ) |
= |
|
|
( ) |
= ( ) |
( ) |
( |
) |
|
|
|
|
|
|
Доказательство свойства 4 коэффициента корреляции. Разделим все три части неравенства в свойстве 5 ковариации на
( ) |
; |
( |
) |
|
Доказательство свойства 5 коэффициента корреляции. Если X и Y
независимы, то по свойству 5 ковариации cov(X,Y)=0, следовательно и коэффициент корреляции равен 0: ( )
Доказательство свойства 6 коэффициента корреляции. Найдем cov(X,Y):
|
|
|
|
|
|
|
|
|
|
|
|
cov(X,Y)= M ( |
)( |
|
|
) = |
,( |
|
|
|
)( |
|
|
|
|
)- |
( |
) |
|
Теперь найдем коэффициент корреляции: |
|
|
||||||||||||
( |
) |
|
|
( |
) |
= |
|
= |
|
|
{ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Пример 6.3. Рассмотрим случай ( |
) |
и покажем, что это возможно тогда и только |
||||||||||||
тогда, когда X и Y связаны линейной зависимостью: |
|
|
||||||||||||
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
Обозначим |
|
|
|
|
( |
) |
|
|
|||||
|
( |
( |
) |
) |
|
|
|
|
|
|
|
|

т.к , |
( |
) |
и следовательно квадратное уравнение |
имеет |
|
||
единственный двукратный корень |
. Тогда случайная величина |
( |
) |
||||
( |
|
) имеет математическое ожидание, равное 0, и дисперсию |
|
|
|||
|
, т. е. Z - вырожденная с.в., P(Z= 0) =1 и, следовательно, |
, где |
|
||||
|
|
, причѐм знак ( |
) совпадает со знаком . |
|
|
Если с.в. X и Y связаны линейной зависимостью, то по свойству 6
( ) Таким образом, мы доказали, что ( ) тогда и только тогда, когда X и Y связаны линейной зависимостью.
Чем лучше реальная зависимость Y от X аппроксимируется линейной, тем ближе по модулю к 1 будет их коэффициент корреляции.
|
|
|
Если |
( |
|
) |
это означает, что с ростом одной |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
величины другая имеет |
тенденцию |
убывать. |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
||||||
|
|
Если |
( |
) |
|
это означает, что с ростом одной |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
величины другая имеет |
тенденцию |
возрастать. |
|
|
||||||||||
|
Шкала Чеддока для оценки линейной связи двух случайных величин |
|
|||||||||||||
|
|
|
|
|
|
|
|
||||||||
|
Значение |
модуля |
коэффициента |
|
Теснота связи |
|
|||||||||
|
|
|
корреляции r |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
0,1 0,3 |
|
|
|
Слабая |
|
|||||
|
|
|
|
|
0,3 0,5 |
|
|
|
Умеренная |
|
|||||
|
|
|
|
|
0,5 0,7 |
|
|
|
Заметная |
|
|||||
|
|
|
|
|
0,7 0,9 |
|
|
|
Высокая |
|
|||||
|
|
|
|
0,9 0,99 |
|
|
|
Весьма высокая |
|
Замечание. Как было показано коэффициент корреляции характеризует степень только линейной зависимости двух с.в. Однако, этот коэффициент можно использовать для определения степени и нелинейных зависимостей. Если мы считаем, что между с.в. Y и X существует вероятностная (статистическая) зависимость ( ) то между с.в.
( ) существует уже линейная зависимость.

Рисунок 6.1. Типы корреляции между случайными величинами X и Y
Построение уравнения прямой, наиболее адекватно характеризующей зависимость X от Y, называют ещѐ нахождением линейной регрессии Y на X. При этом под наибольшей адекватностью понимается зависимость, минимизирующая ошибку подобного представления в среднеквадратичном:
( |
( |
)) |
∫ ∫ ( |
( |
)) |
( ) |
(6.11) |
Далее для примера рассмотрим случай, когда существует |
( ), |
хотя все выводы сохранятся, если одна или обе случайные величины не являются непрерывными и соответствующие интегралы заменяются суммой.
Найдѐм минимум функции ошибки L по переменным а и b. При этом мы будем предполагать, что подынтегральные функции позволяют изменять порядок дифференцирования и интегрирования. Критическая точка функции L задаѐтся условиями:
∫ ∫ ( ( |
)) ( ) |
( ( |
)) |

∫ |
∫ |
( ( |
)) ( ) |
( ( |
)) ) |
|
|
|
|
|
|
|
|
|
|
|
( ) |
В итоге получим систему уравнений для определения a и b:
{ |
( ) |
( |
) |
|
Умножим обе части первого уравнения системы на MX и вычтем из второго уравнения получившееся первое уравнение:
( ( ) |
( |
) ) |
( ) |
|
|
|
|
|
|||||||
Коэффициент при b равен |
|
|
|
а правая часть равна |
( |
) |
|||||||||
( |
) |
( |
) |
|
( |
) |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
( |
) |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
В итоге получим уравнение
( |
) |
|
( |
) |
|
В окончательном виде уравнение регрессии Y на X:
( |
) |
( |
) |
(6.13) |
Аналогично уравнение регрессии X на Y имеет вид
|
|
( |
)( |
) |
(6.14) |
|
|||||
|
|
|
|
|
|
Замечание. При ( |
) |
обе прямые совпадают. Обе прямые проходят через |
точку (MX,MY), которая называется центром рассеивания.