
- •Частина іі Математична статистика
- •Розділ іv. Статистична перевірка гіпотез
- •1.1 Статистичний розподіл вибірки
- •1.2 Емпірична функція розподілу
- •1.3 Полігон та гістограма
- •Приклад 3. Вибірку задано у вигляді розподілу частот
- •1.4 Тренувальні вправи
- •2.1 Точкові оцінки параметрів розподілу
- •Основні властивості вибіркової середньої
- •1) При множенні усіх варіант вибірки на однаковий множник вибіркова середня також множиться на цей множник:
- •Приклад 1. Вибіркова сукупність задана таблицею
- •2.2 Інтервальні оцінки параметрів розподілу
- •2.3 Тренувальні вправи
- •2.4 Обчислення параметрів розподілу методом добутків
- •2.5 Індивідуальне семестрове завдання №1 “Статистичний розподіл вибірки. Обчислення параметрів розподілу методом добутків”
- •2.6 Зразок виконання індивідуального семестрового завдання №1
- •2.7 Обробка вибірки методом найменших квадратів
- •2.8 Тренувальні вправи
- •2.9 Індивідуальне семестрове завдання №2 «Метод найменших квадратів»
- •2.10 Зразок виконання індивідуального семестрового завдання №2
- •Розділ ііі. Елементи теорії кореляції
- •3.2 Лінійна кореляція
- •3.3 Криволінійна кореляція
- •3.4 Рангова кореляція. Вибірковий коефіцієнт рангової кореляції Спірмена
- •3.5 Тренувальні вправи
- •3.6 Індивідуальне семестрове завдання №3 “Знаходження вибіркового коефіцієнта кореляції та прямих ліній регресії”
- •Варіант 5. Розподіл 50 за вартістю основних виробничих фондів (млн. Грн) та витратами (% до вартості основних фондів) на капітальний ремонт дано у таблиці:
- •Варіант 6. Розподіл 40 заводів кольорової металургії за середньодобовим виробленням металу (тис.Т) та затратами електроенергії на 1 тн. (тис. КВт-год) дано у таблиці:
- •Варіант 7. Розподіл 80 корів за живою вагою (кг) та надоями молока (кг) дано у таблиці:
- •Варіант 8. Розподіл 100 ткацьких фабрик за виробничими потужностями (тис. М. На рік) та собівартістю 1 м тканини (грн) дано у таблиці:
- •Варіант 9. Розподіл 100 прямокутних чавунних плиток за довжиною (см) та масою (кг) дано у таблиці:
- •Варіант 10. Розподіл 200 заводів за вартістю основних фондів (млн. Грн.) та вартістю готової продукції ( млн. Грн.) дано у таблиці:
- •Варіант 11. Розподіл підприємств за об’ємом продукції (грн) та за її собівартістю (грн) надано у таблиці:
- •Варіант 12. Розподіл 120 вагонних коліс за терміном служби (в роках) та величиною зносу ободу колеса (в мм) дано у таблиці:
- •Варіант 14. Розподіл 100 проб руди з вмістом окису заліза (%) та закису заліза (%) дано у таблиці:
- •Варіант 15. Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •Варіант 16. Розподіл 100 прямокутних плиток за їх довжиною (см) та масою (кг) дано у таблиці:
- •За відповідним рівнянням регресії оцінити середнє значення собівартості вугілля тих шахт, глибина виробок яких складає 800 м, та порівняти одержаний результат з відповідним груповим середнім.
- •За відповідним рівнянням регресії оцінити середнє значення газоносності тих шахт, глибина виробок яких складає 900 м, та порівняти його з відповідним груповим середнім.
- •3.7 Зразок виконання індивідуального семестрового завдання №3 Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •3.8 Питання для самоперевірки
- •Розділ іv. Статистична перевірка гіпотез
- •4.1 Поняття статистичної гіпотези
- •4.2 Критична область. Знаходження критичних областей
- •4.3 Критерій узгодження Пірсона
- •4.4 Тренувальні вправи
- •4.5 Питання для самоперевірки
- •Література
- •Додатки Додаток а Таблиця значень функції (х)
- •Додаток б
- •Додаток в
- •Додаток д
- •Додаток е Критичні точки розподілу 2
- •Додаток ж Критичні точки розподілу Стьюдента
- •Додаток и Критичні точки розподілу f Фішера – Снедекора
- •Додаток к Критичні точки розподілу Колмогорова
2.7 Обробка вибірки методом найменших квадратів
Оцінка параметрів лінійної функції
При експериментальному вивченні функціональної залежності однієї величини Y від іншої величини Х роблять ряд вимірів величини у при різних значеннях х. Результати можуть бути представлені у вигляді таблиці:
|
|
|
… |
|
… |
|
|
|
|
… |
|
… |
|
Метод, заснований на вимозі мінімізації суми квадратів відхилень, називається методом найменших квадратів.
З його допомогою зображують статистичну функціональну залежність у вигляді аналітичної залежності й виражаються такі оцінки параметрів рівняння регресії, які зводять до мінімуму обрану міру розкиду.
У результаті відбувається вирівнювання емпіричних значень в одну лінію регресії.
При цьому, для однозначного визначення як міру розкиду використовують один з показників розсіювання випадкової величини – дисперсію.
Припустимо, що діаграма розсіювання така, що між величинами х и у існує лінійна залежність
,
де
параметри а
та
невідомі.
Це
означає, що відхилення фактичних значень
функції від «підібраної прямої»
повинні бути мінімальними, тобто пряма
підбирається так, щоб сума квадратів
відхилень була мінімальною
.
Нехай – є рівняння « підібраної прямої».
Тоді повинна виконуватися рівність
.
Потрібно визначити параметри а й b так, щоб z досягло мінімуму.
Відомо, що необхідна умова існування мінімуму полягає в тому, що:
Після диференціювання і спрощень, одержимо систему рівнянь
яка називається системою нормальних рівнянь у випадку вибору емпіричної функції у вигляді лінійної залежності.
Приклад 1. Методом найменших квадратів знайти значення параметрів емпіричної функції, якщо дослідницькі дані про значення х и у представлені в таблиці:
х |
6 |
8 |
9 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
у |
4 |
4 |
5 |
7 |
5 |
6 |
8 |
7 |
9 |
10 |
Розв’язання. За вибіркою спостережень побудуємо в системі координат х0у діаграму розсіювання, тобто побудуємо точки
.
Аналіз дослідницьких даних показує, що в якості емпіричної (підібраної) функції можна використати лінійну функцію
.
Для знаходження параметрів а й b застосуємо МНК.
Тоді для визначення параметрів а й b будемо мати систему нормальних рівнянь:
Для
зручності обчислень складемо наступну
розрахункову таблицю (
):
|
|
|
|
|
1 |
6 |
4 |
36 |
24 |
2 |
8 |
4 |
64 |
32 |
3 |
9 |
5 |
81 |
45 |
4 |
9 |
7 |
81 |
63 |
5 |
10 |
5 |
100 |
50 |
6 |
11 |
6 |
121 |
66 |
7 |
12 |
8 |
144 |
96 |
8 |
13 |
7 |
169 |
91 |
9 |
14 |
9 |
196 |
126 |
10 |
15 |
10 |
225 |
150 |
|
|
|
|
|
Підставимо дані останнього рядка таблиці в нормальну систему рівнянь:
Розв’язавши систему, одержимо
.
Підставляючи ці значення параметрів, одержимо емпіричну функцію:
,
яка описує залежність між випадковими величинами х та у.
Оцінка параметрів параболічної функціональної залежності
Нехай
між випадковими величинами
та
існує функціональна залежність вигляду
.
Методом
найменших квадратів на основі даних
випробувань знайдемо значення невідомих
параметрів
.
Тепер формула буде мати вигляд
.
Для цієї функції шуканими величинами є параметри , й тому, відповідно до вимог екстремуму функції, треба, щоб
.
Дифенціруючи, після спрощень, маємо систему
яка є системою нормальних рівнянь у випадку вибору квадратичної функції в якості емпіричної функції.
Складемо розрахункову таблицю:
|
|
|
|
|
|
|
|
1 2 ... ... п |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Підставляючи дані останньої строчки в систему нормальних рівнянь і розв’язавши її любим з відомих методів, знайдемо значення параметрів .
Отже, матимемо рівняння квадратичної функції в якості емпіричної
.
Приклад
2. Застосовуючи
метод найменших квадратів, скласти
рівняння параболи
,
яка проходить найближче до точок
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
0,1 |
0,48 |
0,81 |
1,26 |
2,3 |
2,85 |
3,4 |
3,96 |
4,54 |
Розв’язання.
Для розв’язання системи нормальних рівнянь
(у випадку вибраної емпіричної функції – квадратичної) складемо розрахункову таблицю:
|
|
|
|
|
|
|
|
1 |
0 |
0,1 |
0 |
0 |
0 |
0 |
0 |
2 |
1 |
0,48 |
1 |
1 |
1 |
0,48 |
0,48 |
3 |
2 |
0,81 |
4 |
8 |
16 |
1,62 |
3,24 |
4 |
3 |
1,26 |
9 |
27 |
81 |
3,78 |
11,34 |
5 |
4 |
23 |
16 |
64 |
256 |
92 |
368 |
6 |
5 |
2,85 |
25 |
125 |
625 |
14,25 |
71,25 |
7 |
6 |
3,4 |
36 |
216 |
1296 |
20,4 |
122,4 |
8 |
7 |
3,96 |
49 |
343 |
2401 |
27,72 |
194,04 |
9 |
8 |
4,54 |
64 |
512 |
4096 |
36,32 |
290,56 |
|
|
|
|
|
|
|
|
Підставивши дані останньої строки у систему нормальних рівнянь, отримаємо
Розв’язуючи систему трьох невідомих будь-яким відомим методом, отримаємо значення
.
Таким чином, рівнянням шуканої параболи буде
.