- •Розділ 3. Випадкові величини та їх розподіли
- •3.1. Випадкові величини. Функція розподілу випадкової величини
- •3.2. Властивості функції розподілу
- •3.3. Дискретні випадкові величини
- •3.4. Абсолютно неперервні розподіли. Щільність розподілу випадкової величини
- •3.5. Функції від випадкової величини
- •3.6. Багатовимірні випадкові величини
- •3.6.2. Незалежність випадкових величин. Випадкові величини називаються незалежними, якщо
- •Тому .
- •Нехай випадковий вектор має щільність розподілу . Розглянемо випадкову величину . Функція розподілу буде рівна
- •Знайдемо щільність розподілу суми
- •3.7. Умовні розподіли
- •Розділ 4. Числові характеристики випадкових величин
- •4.1. Математичне сподівання
- •4.2. Дисперсія випадкової величини
- •4.3. Нерівність Чебишова
- •4.4. Моменти випадкових величин. Деякі інші числові характеристики
- •4.5. Числові характеристики багатовимірних випадкових величин
- •4.6. Умовне математичне сподівання. Регресія
4.5. Числові характеристики багатовимірних випадкових величин
Нехай
–
вимірна
випадкова величина. Тоді її математичним
сподіванням називається вектор
,
якщо
існують.
Величини
,
де
,
,
називають змішаними моментами порядку
випадкових величин
.
Серед змішаних моментів важливу роль
відіграють моменти другого порядку –
коваріації випадкових величин
і
:
.
Для
введення характеристик випадкового
вектора
з функцією розподілу
використаємо рівність
,
де – довільна борелєва функція, для якої принаймні одна частина рівності має зміст.
Зокрема,
,
.
Для неперервного розподілу із щільністю
,
а
якщо врахуємо, що
,
то
.
Якщо
для величин
існують
,
,
то матриця
,
де
,
називається коваріаційною
(кореляційною)
матрицею випадкових величин
:
.
Коваріаційна матриця додатньо визначена.
Введемо ще одну досить важливу характеристику
,
яку
називають
коефіцієнтом
кореляції
випадкових величин
і
.
Враховуючи, що
,
то для коефіцієнта кореляції справедлива формула
.
Розглянемо
деякі властивості коефіцієнта кореляції.
Для спрощення розглянемо двовимірний
вектор
,
а коефіцієнт кореляції позначимо
.
Із
визначення коваріації випливає, що для
незалежних випадкових величин
,
тому і
.
Якщо
,
то випадкові величини називаються
некорельованими.
Для нормального розподілу некорельованість
означає незалежність.
,
якщо
,
то з ймовірністю 1 між випадковими
величинами
і
існує лінійний зв’язок. Навпаки, якщо
і
зв’язані лінійною залежністю, то
.
Тому
можна розглядати як міру лінійної
залежності між величинами
і
.
Для
доведення цього введемо позначення:
.
Тоді
,
,
а
.
Із властивостей дисперсії одержуємо
.
Якщо
,
то із нерівності
випливає, що
,
а якщо
,
то із нерівності
одержимо
.
Отже,
.
Нехай
,
тоді
,
а
,
тому
.
Нехай
.
Тоді із рівності
випливає, що з ймовірністю 1
,
а із рівностей
одержуємо
.
Отже,
або
.
Звідки,
,
тобто випадкові величини
зв’язані лінійною залежністю.
Нехай
.
Тоді із рівності
,
аналогічно попередньому, одержуємо, що
з ймовірністю 1
.
Звідки,
,
тобто знову випадкові величини
зв’язані лінійною залежністю.
Вправи.
Щільність сумісного розподілу вектора
Знайти коефіцієнт кореляції.Знайти коефіцієнт кореляції дискретного випадкового вектора за його розподілом
|
-1 |
0 |
1 |
-1 |
0,1 |
0,15 |
0,2 |
1 |
0,15 |
0,25 |
0,15 |
4.6. Умовне математичне сподівання. Регресія
Нехай
випадковий вектор
–
дискретний
із розподілом
і нехай
– умовний розподіл
при умові
.
Тоді величина
називається умовним математичним сподіванням випадкової величини при умові .
Нехай
випадковий вектор
– неперервний
із щільністю
і нехай
– умовна щільність розподілу випадкової
величини
при умові
,
тоді величина
називається умовним математичним сподіванням випадкової величини при умові .
Якщо
випадковий вектор
–
дискретний
із розподілом
,
то
,
а якщо випадковий вектор – неперервний із щільністю , то
.
Якщо
величини
і
– незалежні, то
.
Аналогічно вводиться умовне математичне
сподівання
.
Ми
можемо вважати
значеннями випадкової величини
,
що є функцією від
і рівною
при
.
Випадкову величину
називають умовним
математичним
сподіванням
випадкової величини
при заданому
.
Від цієї величини можна знайти математичне
сподівання
.
Аналогічно у неперервному випадку
.
Отже, справедлива рівність
.
Очевидно,
умовне математичне сподівання
є функцією від
.
Цю функцію називають регресією
на
,
а її графік називають кривою
регресії.
Умовне
математичне
сподівання
функції
при умові
у випадку неперервного розподілу
визначається рівністю
.
Якщо цю рівність помножити на і проінтегрувати по , то одержимо:
.
Тобто,
.
Умовною дисперсією випадкової величини при умові називається величина
.
У випадку неперервного розподілу
.
Дисперсія характеризує на скільки при фіксованому значення величини розсіяні відносно лінії регресії.
Якщо повернемось до прикладу щільності умовного нормального розподілу із попереднього розділу
,
то
одержимо, що нормальна
регресія є лінійною:
.
Умовна дисперсія дорівнює
Лінія
регресії має одну важливу властивість
мінімальності. Серед всіх функцій
мінімум виразу
досягається при
.
В рівності
права
частина буде мінімальна, якщо внутрішній
інтеграл для довільного
буде мінімальним. Перетворимо його до
вигляду
.
Отже,
буде мінімальним, якщо
.
Розглянемо
задачу про знаходження такої лінійної
функції
,
для якої
буде мінімальним. Тоді її називають
лінійною
середньоквадратичною
регресією.
Для цього параметри a
і b
необхідно
вибрати так, щоб
було мінімальним (позначимо
,
):
.
Щоб
математичне сподівання було мінімальним,
необхідно
і
вибрати так, щоб
і
.
Одержимо:
,
.
Отже, пряма середньоквадратичної
регресії задається рівнянням
.
Коефіцієнт
називають коефіцієнтом середньоквадратичної
регресії
на
,
називається залишковою дисперсією.
Вираз можна подати у вигляді
.
Другий доданок рівний нулю, бо
,
а внутрішній інтеграл рівний нулю. Тому для будь-яких a і b
.
Перший доданок правої частини не залежить від a і b, тому другий доданок буде мати мінімум при тих самих a і b, що і ліва частина. Це означає, що пряма середньоквадратичної регресії може розглядатись як пряма, яка дає найкраще середньоквадратичне наближення до кривої регресії.
Покладемо в рівності
,
що
справедлива для будь-яких a
і b,
,
,
тоді одержимо:
.
Величину
,
що визначається рівністю
,
називають кореляційним відношенням на .
Із
рівності
випливають такі властивості кореляційного
відношення: 1)
;
2)
тоді і тільки тоді, коли
не залежить від
;
3)
тоді і тільки тоді, коли розподіл вектора
зосереджений на лінії регресії
.
Якщо в рівності
,
що
справедлива для будь-яких a
і b,
виберемо a
і b,
як коефіцієнти прямої середньо-квадратичної
регресії і врахуємо, що в цьому випадку
,
то одержимо
.
Звідки
.
Тому
.
Якщо
регресія
на
лінійна,
то
.
Тобто,
можна розглядати, як характеристику
того, наскільки залежність між
і
близька до лінії регресії.
Вправи.
Знайти умовне математичне сподівання
за розподілом із вправи 12.Задано щільність розподілу випадкового вектора . Знайти умовне математичне сподівання .
Знайти кореляційне відношення на за розподілом із вправи 12.
