
- •Збірник задач
- •З теорії ймовірностей та математичної статистики
- •Навчальний посібник
- •Рекомендовано
- •Міністерством освіти України
- •Рецензенти: член-кореспондент нан України, доктор фізико-математичних наук
- •Передмова
- •Розділ 1. Елементи комбінаторики
- •Приклади розв’язання задач
- •Розділ 2. Простір елементарних подій, випадкові події та операції над ними
- •Правило де Моргана: Приклад розв’язання задачі
- •Розділ 3. Ймовірності у дискретних просторах елементарних подій. Класичне означення ймовірності
- •Приклад розв’язання задачі
- •Розділ 4. Геометричні ймовірності.
- •Приклад розв’язання задачі
- •Розділ 5. Аксіоми теорії ймовірностей
- •Приклад розв’язання задачі
- •Розділ 6. Умовні ймовірності.
- •Приклад розв’язання задачі
- •Розділ 7. Формула повної ймовірності. Формула Байєса
- •Приклад розв’язання задачі
- •Розділ 8. Дискретні випадкові величини. Числові характеристики дискретних випадкових величин
- •Приклад розв’язання задачі
- •Дисперсія d
- •Розділ 9. Схема Бернуллі. Класичні дискретні розподіли
- •Приклад розв’язання задачі
- •Розділ 10. Неперервні випадкові величини
- •Приклад розв’язання задач
- •Розділ 11. Закон великих чисел. Центральна гранична теорема
- •Наслідок 2. Якщо для послідовності {n, n1} виконується умова Ляпунова, то справджується і центральна гранична теорема. Приклад розв’язання задач
- •Розділ 12. Вибірка та її основні характеристики. Емпірична функція розподілу, гістограма
- •Приклад розв’язання задачі
- •Розділ 13. Оцінювання невідомих параметрів розподілів. Класифікація оцінок. Вибіркове середнє та дисперсія, мода, медіана
- •Приклад розв’язання задачі
- •Розділ 14. Ефективні оцінки. Достатні статистики
- •Приклади розв’язання задач
- •Розділ 15. Метод моментів та метод максимальної правдоподібності
- •Приклади розв’язання задач
- •Розділ 16. Надійні інтервали
- •Приклад розв'язання задачі
- •Розділ 17. Перевірка статистичних гіпотез. Критерії згоди
- •Приклади розв’язання задач
- •Розділ 18. Перевірка гіпотез про рівність математичних сподівань та дисперсій для нормальних сукупностей
- •Приклади розв’язання задач
- •Розділ 19. Лінійна регресія
- •Приклади розв’язання задач
- •Розділ 20. Елементи дисперсійного аналізу
- •Приклад розв’язання задачі
- •Розділ 21. Елементи аналізу часових рядів. Виділення тренду, згладжування, прогноз
- •Приклад розв’язання задачі
- •Розділ 22. Задачі для контрольних робіт Контрольна робота №1 “Теорія ймовірностей”
- •Контрольна робота №2 “Теорія ймовірностей”
- •Контрольна робота №3 “Математична статистика”
- •Розділ 4
- •Розділ 5
- •Розділ 6
- •Розділ 7
- •Розділ 8
- •Розділ 9
- •Розділ 10
- •Розділ 11
- •Розділ 18
- •Розділ 19
- •Розділ 20
- •Розділ 21
- •Додатки
- •Література Підручники, навчальні посібники та монографії
- •Збірники задач
- •Для нотаток:
Розділ 19. Лінійна регресія
Нехай ми маємо теоретичну залежність між величинами x та y у вигляді:
де
— деяка функція. Проте в експерименті
внаслідок можливих похибок вимірювань
або невизначеностей у самому об’єкті
в точці
спостерігається величина
де
— деякі випадкові величини.
Треба
за спостереженнями пар
зробити статистичні висновки щодо
функції
.
Регресія. Нехай та — дві випадкові величини (залежні у загальному випадку), і ми хочемо знайти найкраще в деякому розумінні наближення величини деякою функцією g() від величини .
Під найкращим наближенням будемо розуміти наближення в середньому квадратичному.
Означення. Величина g() називається найліпшим наближенням величини в середньому квадратичному, якщо
Функція
g()
є середньоквадратичною регресією
величини
на величину .
Часто функцію
називають кореляційною залежністю
випадкових величин
та
або функцією регресії випадкової
величини
відносно .
Звичайно регресію шукають у якомусь
конкретному класі функцій і мінімум
береться за функціями
з
цього класу.
Лінійна регресія. Розглянемо регресію в класі лінійних функцій, тобто припустимо, що
де і — невідомі параметри.
Введемо такі позначення:
тобто
—коефіцієнт
кореляції.
Лінійна
середньоквадратична регресія
величини
на величину
має вигляд:
Повернемося
тепер до сформульованої на початку
задачі про найліпше визначення функції
Будемо вважати, що функція
належить
деякій параметричній сукупності функцій
і ми маємо спостереження
Означення.
Оцінкою невідомих
параметрів
за методом найменших квадратів буде
вектор
,
при якому досягається мінімум функції:
а функція
буде найліпшим середньоквадратичним
наближенням, що відновлює залежність
між x
та y
за результатами наших спостережень.
Якщо
функція
диференційована за аргументами
,
для знаходження величин
одержимо
систему рівнянь:
Розглянемо важливий випадок, коли функція має вигляд
де k
і b
— невідомі параметри. У цьому випадку
оцінками параметрів лінійної регресії
будуть числа
та
,
при яких функція
досягає мінімуму.
Тоді
де
У випадку поліноміальної регресії
оцінки
невідомих параметрів
знаходяться з системи лінійних
алгебраїчних рівнянь
де
Якщо значення відомі без похибок, а значення незалежні та рівноточні, то оцінка дисперсії (похибка вимірювань) величини визначається за формулою:
де
Оцінки
дисперсій коефіцієнтів
визначаються за формулами:
де
— визначник системи, а
—
алгебраїчне доповнення до елемента,
який стоїть на діагоналі й має індекс
k
у визначнику
У випадку лінійної регресії
Якщо величини мають нормальний розподіл, то для коефіцієнтів справеджуються такі надійні інтервали:
де
— оцінки, отримані методом найменших
квадратів, а число
знаходиться за таблицею розподілу
Стьюдента (таблиця 6 додатка) при числі
степенів свободи
і
Вибірковий коефіцієнт кореляції визначається за формулою:
У деяких
випадках функція
яка не є многочленом, може бути зведена
до нього заміною змінних. Приклади такої
заміни наведено в таблиці.
№ |
Початкова функція |
До якого вигляду приводиться |
Заміна змінної |
1.
|
|
|
|
2. |
|
|
|
3. |
|
|
|
4. |
|
|
|
Коефіцієнт
кореляції рангів. У
деяких випадках натрапляємо на ознаки,
які не піддаються кількісним оцінкам.
Тоді кожній оцінці можна поставити у
відповідність порядковий номер, який
назвемо рангом. Нехай n
осіб за якістю A
мають ранги
а за якістю B
—
,
де всі X
та Y
є перестановками n
перших чисел натурального ряду.
—
різниця рангів.
Тоді коефіцієнт кореляції рангів Спірмена, або коефіцієнт щільності зв’язку між A та B, визначається за формулою:
Є й і інші показники щільності зв’язку між рангами. Якщо не можна визначити рангову відмінність декількох осіб, то беруть середній ранг. У цьому випадку використовують коефіцієнт кореляції рангів Кендела:
де
—
число об’єднаних рангів для X
та Y.