 
        
        - •Розділ III. Елементи математичної статистики.
- •3.1. Предмет і задачі математичної статистики. Короткий історичний нарис.
- •3.2. Вибірковий метод. Генеральна та вибіркова сукупності.
- •3.3. Способи відбору.
- •3.4. Статистичний розподіл вибірки.
- •3.5. Емпірічна функція розподілу.
- •. Полігон і гістограма
- •3.7. Точкові оцінки параметрів розподілів, вимоги до них.
- •3.8. Вибіркове середнє.
- •3.9. Вибіркова дисперсія.
- •3.10. Початкові та центральні емпіричні моменти.
- •3.11. Порівняльна таблиця характеристик випадкової величини та їх статистичних аналогів.
- •3.12. Приклади на обчислення числових характеристик вибірки.
- •3.13. Метод моментів точкової оцінки параметрів розподілу.
- •3.14. Метод найбільшої правдоподібності.
- •3.15. Інші вибіркові характеристики.
- •3.16. Інтервальні оцінки параметрів розподілів. Довірчий інтервал і довірча ймовірність.
- •3.17. Довірчий інтервал для оцінки математичного сподівання нормального розподілу.
- •3.18. Статистична перевірка статистичних гіпотез.
- •3.19. Критерій Пірсона перевірки статистичної гіпотези про нормальний розподіл випадкової величини.
- •3.20. Приклад перевірки статистичної гіпотези про нормальний розподіл випадкової величини за допомогою критерію Пірсона.
- •3.21. Елементи теорії кореляції. Функціональна, статистична та кореляційна залежності.
- •3.22. Побудова прямої лінії регресії методом найменших квадратів.
- •3.23. Вибірковий коефіцієнт кореляції.
- •3.24. Приклад побудови прямих ліній регресії.
- •Додаток
- •Значення функції
- •Значення функції
- •Значення
- •Значення
- •Критичні точки критерія Пірсона
- •Рекомендована література. Базова
- •Додаткова
3.21. Елементи теорії кореляції. Функціональна, статистична та кореляційна залежності.
     На
практиці ми зустрічаємось з різними
типами зв’язку між
випадковими величинами. Одним з таких
типів є функціональна
залежність. Така
залежність виникає тоді, коли зв’язок
між величинами настільки тісний, що,
знаючи можливі значення однієї з величин,
можна точна вказати можливі значення
іншої. Функціональну залежність величини
 від величини 
можна задати формулою:
від величини 
можна задати формулою: 
 .
Нехай, наприклад,
.
Нехай, наприклад, 
 ,
можливі значення величини 
:
1, 2, 3. Тоді можливі значення величини 
:
1, 4, 9.
,
можливі значення величини 
:
1, 2, 3. Тоді можливі значення величини 
:
1, 4, 9. 
     До
величин, що пов’язані
функціональними залежностями, відносяться
значна кількість тих, що зустрічаються
у природознавстві. Наприклад, тиск 
 ,
температура
,
температура 
 та об’єм газу
та об’єм газу 
 пов’язані функціональною
залежністю
пов’язані функціональною
залежністю 
 ,
де
,
де 
 – універсальна газова стала.
– універсальна газова стала. 
     Разом
з цим точна функціональна залежність
між величинами реалізується досить
рідко, оскільки величини підлягають
впливу багатьох випадкових факторів.
Серед цих факторів можуть бути спільні
для обох величин. В таких випадках
виникають статистичні залежності.
Наприклад, якщо величина 
залежить від випадкових факторів 
 ,
а величина 
– від випадкових факторів
,
а величина 
– від випадкових факторів 
 ,
то між 
та 
є
статистична залежність – серед випадкових
факторів, що діють на величини  
та 
,
є спільні –
,
то між 
та 
є
статистична залежність – серед випадкових
факторів, що діють на величини  
та 
,
є спільні – 
 .
.
Означення. Статистичною залежністю між величинами називають таку залежність, коли зміна однієї з величин викликає зміну розподілу іншої.
Зокрема, якщо при зміні однієї з величин змінюється середнє значення іншої, то така залежність називається кореляційною.
Статистичні та кореляційні залежності знаходять численні застосування в усіх сферах природознавства, зокрема і в геології. Наприклад, існує кореляційна залежність між органічними речовинами, що є у ґрунті, з неорганічними мінеральними компонентами порід. Такого типу залежності лежать в основі багатьох методів підрахунку природничих ресурсів, на них спираються прогностичні побудови, розрахункові схеми.
Кореляційні зв’язки є частинним випадком статистичних. Термін «кореляція» походить від англійського correlation – співвідношення, відповідність. При таких залежностях певному значенню однієї з величин може відповідати одразу декілька значень іншої.
Для дослідження кореляційного зв’язку між величинами часто використовується математична модель, яка називається рівнянням регресії. При цьому дослідження складається з двох етапів:
1) виявлення на підставі великої кількості спостережень того, як змінюється в середньому величина в залежності від величини , тобто знаходження рівняння зв’язку між та ;
2) виявлення ступені взаємозв’язку явищ, що досліджуються.
3.22. Побудова прямої лінії регресії методом найменших квадратів.
Припустимо, що експериментально встановлено, що залежність величини від величини близька до лінійної:
     
 ,
                                                                     
                                (*)   але параметри 
і
,
                                                                     
                                (*)   але параметри 
і 
 ми не знаємо.
ми не знаємо.
     Нехай
– можливі значення величини 
,
а 
 – можливі значення величини 
(для спрощення припускаємо, що кожне
значення зустрічається по одному разу).
– можливі значення величини 
(для спрощення припускаємо, що кожне
значення зустрічається по одному разу).
     Якщо
рівняння (*) виконується хоча б наближено,
то значення 
не повинні сильно відрізнятися відповідно
від значень 
 …,
…,
 .
Тому є сенс ввести міру відмінності цих
значень та обрати параметри 
і 
таким чином, щоб ця міра відмінності
була по можливості найменшою. Такою
мірою, зокрема, може бути функція двох
змінних:
.
Тому є сенс ввести міру відмінності цих
значень та обрати параметри 
і 
таким чином, щоб ця міра відмінності
була по можливості найменшою. Такою
мірою, зокрема, може бути функція двох
змінних:
     
 .
.
Підберемо
і 
з умови мінімуму функції 
 .
Для цього дорівняємо до нуля частинні
похідні цієї функції:
.
Для цього дорівняємо до нуля частинні
похідні цієї функції:
     
 ,
,
    
 .
.
Перепишемо ці рівняння так:
     
 (**)
                                                                    
(**)
Тобто отримали систему двох лінійних алгебраїчних рівнянь відносно і . Систему (**) називають системою методу найменших квадратів. Розв’язуючи цю систему, знаходимо:
     
 ,
,
     
 .
.
