Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Correlation_Theory.doc
Скачиваний:
10
Добавлен:
08.05.2019
Размер:
2.08 Mб
Скачать

Умовні розподіли. Реґресії

Розглянемо дві дискретні випадкові величини й . Імовірність того, що величина набуває значення за умови , що інша величина набуває значення x, дорівнює

( 1 а )

Аналогічно визначається імовірність того, що набуває значення x за умови, що набуває значення ,

. ( 1 б )

Імовірності, які даються формулами ( 1 а ), (1 б ), називаються умовними.

Якщо випадкові величини , неперервні, - щільність розподілу (або щільність імовірності) двовимірної випадкової величини , а , - щільності розподілу (щільності ймовірності) складових , , то розглядають умовні щільності розподілу (щільності ймовірності)

( 2 а )

щільність розподілу випадкової величини за умови, що величина набуває значення x, і

( 2 б )

- щільність розподілу випадкової величини за умови, що величина набуває значення .

Знаючи , можемо знайти , бо

( 3 )

Якщо , незалежні, то умовні щільності розподілу збігаються з "безумовними" ( ).

Умовні ймовірності (1 а), (1 б) та умовні щільності розподілу (2 а), (2 б) дозволяють ввести важливе поняття умовного матеметичного сподівання однієї випадкової величини за умови, что інша набуває певного значення,

Якщо , дискретні й мають можливі значення (відповідно , ), то

( 4 а )

( 4 б )

Фактично ми маємо k значень першої величини та m значень другої. Дійсно, на підставі формул (1 а), (1 б)

,

де для скорочення запису використано такі позначення: , . Крім того, як відомо, .

Для неперервних випадкових величин , маємо

( 5 а )

( 5 б )

Умовне математичне сподівання (відповідно ) називається функцією реґресії на (відповідно на ), графік функції реґресії (рис. 1) називається лінією реґресії, а рівняння

, ( 6 а )

відповідно

( 6 б )

- рівнянням реґресії на (відповідно на ). Рівняння реґресії, очевидно, є рів-нянням лінії реґресії (яку ми, як звичайно, ототожнюємо з самою лінією реґресії).

Можна показати, що якщо випадкові Рис. I. Лінії реґресії величини , пов”язані функціональною залежністю, то обидві лінії реґресії збігаються.

Приклад 1. Розглянемо так званий нормальний розподіл на площині, а саме двовимірну випадкову величину з щільністю розподілу

( 7 )

Знаходячи щільності розподілу складових , за допомогою формул (3) (див.[ 3, с. 188]), отримуємо

і бачимо, що складові розподілені нормально ( ). Для умовної щільності розподілу формула (2 а) дає

,

так що - це щільність нормального розподілу з математичним сподіванням (умовним м.с., функцією реґресії по )

і рівнянням реґресії

.

Аналогічно за допомогою формули (2 б) знаходимо умовну щільність розподілу функцію й рівняння (лінію) реґресії по

.

Якщо в формулі (7) параметр r дорівнює нулю, маємо так званий найпростіший нормальний розподіл на площині з щільністю розподілу

і отже - незалежними нормально розподіленими складовими.

Функції реґресії посідають так звану основну властивість (див. [ 2, с. 195]). Так, для функції математичне сподівання квадрата відхилення випадкової величини від не більше, ніж від довільної іншої функції ,

Інакше кажучи, з усіх функцій найменше значення величини

досягається на функції реґресії . Основна властивість лежить в основі багатьох положень теорії кореляції. Зокрема, з неї випливає обґрунтування методу найменших квадратів для відшукання параметрів кореляційної залежності.

Функції реґресії ставлять у відповідність значення однієї випадкової величини середні значення (умовні математичні сподівання) іншої. Така залежність між двома випадковими величинами, тобто залежність між значеннями однієї величини і відповідними середніми значеннями іншої, називається кореляційною. Слово "кореляція" фі­гурує в багатьох мовах (латинське слово correlātio, італійське correlazióne, німецьке Korrelation, францзьке corrélation, англійське correlation) і означає співвідношення, зв”язок, взаємозв”язок, взаємозалежність.

Дві основні задачі теорії кореляції (для двох випадкових величин ).

1. Визначення вигляду кореляційної залежності між випадковими величинами. Якщо функції реґресії на і на лінійні, то кажуть про лінійну кореляцію, в протилежному випадку - про нелінійну, або криволінійну.

2. Визначення тісноти связку між випадковими величинами. Друга задача розв”язується вивченням величини розсіяння (або концентрації) значень кожної випадкової величини навколо її функції реґресії. Звичайно для цього використовуються коефіцієнт кореляції та кореляційне відношення.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]