Добавил:
2200 7008 9480 6099 TKFF БЛАГОДАРНОСТЬ МОЖНО ТУТ ОСТАВИТЬ Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Konspekt_Tv_2020_ch_6

.pdf
Скачиваний:
22
Добавлен:
27.05.2023
Размер:
1.07 Mб
Скачать

1.() ()

2.

(

 

)

 

(

 

)

 

(

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( ) =2

3.() ()

4.| ()

5. Если X и Y независимы, то ()

 

 

 

 

 

(

 

)

 

{

6. Если Y=kX+b, то

 

(

)

 

 

 

 

 

 

 

 

 

 

 

 

 

Из свойства 6 ковариации, в частности вытекает, что если две гауссовские случайные величины независимы, то . Верно и обратное: если , то две гауссовские с.в. независимы (докажите это). Но в общем случае из некоррелированности случайных величин (т. е. из того, что cov(X, Y) = 0) не следует их независимость.

Задача 6.5. Доказать свойства 1 и 3 коэффициента корреляции.

Доказательство свойства 2 коэффициента корреляции. Так как ( )= c2

DX; то

(

)

 

 

 

 

 

 

 

 

 

(

)

(

 

)

=

 

( )

=

 

 

( )

= ( )

( )

(

)

 

 

 

 

 

 

Доказательство свойства 4 коэффициента корреляции. Разделим все три части неравенства в свойстве 5 ковариации на

( )

;

(

)

 

Доказательство свойства 5 коэффициента корреляции. Если X и Y

независимы, то по свойству 5 ковариации cov(X,Y)=0, следовательно и коэффициент корреляции равен 0: ( )

Доказательство свойства 6 коэффициента корреляции. Найдем cov(X,Y):

 

 

 

 

 

 

 

 

 

 

 

 

cov(X,Y)= M (

)(

 

) =

,(

 

 

 

)(

 

 

 

 

)-

(

)

Теперь найдем коэффициент корреляции:

 

 

(

)

 

 

(

)

=

 

=

 

 

{

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 6.3. Рассмотрим случай (

)

и покажем, что это возможно тогда и только

тогда, когда X и Y связаны линейной зависимостью:

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

Обозначим

 

 

 

 

(

)

 

 

 

(

(

)

)

 

 

 

 

 

 

 

 

т.к ,

(

)

и следовательно квадратное уравнение

имеет

 

единственный двукратный корень

. Тогда случайная величина

(

)

(

 

) имеет математическое ожидание, равное 0, и дисперсию

 

 

 

, т. е. Z - вырожденная с.в., P(Z= 0) =1 и, следовательно,

, где

 

 

 

, причѐм знак (

) совпадает со знаком .

 

 

Если с.в. X и Y связаны линейной зависимостью, то по свойству 6

( ) Таким образом, мы доказали, что ( ) тогда и только тогда, когда X и Y связаны линейной зависимостью.

Чем лучше реальная зависимость Y от X аппроксимируется линейной, тем ближе по модулю к 1 будет их коэффициент корреляции.

 

 

 

Если

(

 

)

это означает, что с ростом одной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

величины другая имеет

тенденцию

убывать.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если

(

)

 

это означает, что с ростом одной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

величины другая имеет

тенденцию

возрастать.

 

 

 

Шкала Чеддока для оценки линейной связи двух случайных величин

 

 

 

 

 

 

 

 

 

 

Значение

модуля

коэффициента

 

Теснота связи

 

 

 

 

корреляции r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,1 0,3

 

 

 

Слабая

 

 

 

 

 

 

0,3 0,5

 

 

 

Умеренная

 

 

 

 

 

 

0,5 0,7

 

 

 

Заметная

 

 

 

 

 

 

0,7 0,9

 

 

 

Высокая

 

 

 

 

 

0,9 0,99

 

 

 

Весьма высокая

 

Замечание. Как было показано коэффициент корреляции характеризует степень только линейной зависимости двух с.в. Однако, этот коэффициент можно использовать для определения степени и нелинейных зависимостей. Если мы считаем, что между с.в. Y и X существует вероятностная (статистическая) зависимость ( ) то между с.в.

( ) существует уже линейная зависимость.

Рисунок 6.1. Типы корреляции между случайными величинами X и Y

Построение уравнения прямой, наиболее адекватно характеризующей зависимость X от Y, называют ещѐ нахождением линейной регрессии Y на X. При этом под наибольшей адекватностью понимается зависимость, минимизирующая ошибку подобного представления в среднеквадратичном:

(

(

))

∫ ∫ (

(

))

( )

(6.11)

Далее для примера рассмотрим случай, когда существует

( ),

хотя все выводы сохранятся, если одна или обе случайные величины не являются непрерывными и соответствующие интегралы заменяются суммой.

Найдѐм минимум функции ошибки L по переменным а и b. При этом мы будем предполагать, что подынтегральные функции позволяют изменять порядок дифференцирования и интегрирования. Критическая точка функции L задаѐтся условиями:

∫ ∫ ( (

)) ( )

( (

))

( (

)) ( )

( (

)) )

 

 

 

 

 

 

 

 

 

 

( )

В итоге получим систему уравнений для определения a и b:

{

( )

(

)

 

Умножим обе части первого уравнения системы на MX и вычтем из второго уравнения получившееся первое уравнение:

( ( )

(

) )

( )

 

 

 

 

 

Коэффициент при b равен

 

 

 

а правая часть равна

(

)

(

)

(

)

 

(

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В итоге получим уравнение

(

)

 

(

)

 

В окончательном виде уравнение регрессии Y на X:

(

)

(

)

(6.13)

Аналогично уравнение регрессии X на Y имеет вид

 

 

(

)(

)

(6.14)

 

 

 

 

 

 

Замечание. При (

)

обе прямые совпадают. Обе прямые проходят через

точку (MX,MY), которая называется центром рассеивания.