- •1 Предмет курсу. Основні задачі
- •1.1 Математична модель. Види моделей
- •1.2 Типи розв'язуваних задач
- •3 Виявлення закономірностей (досліджуємо залежність одних змінних від інших):
- •4 Класифікація, тобто одержання відповіді на одне з питань:
- •1.3 Шкали вимірювання
- •1.4 Види шкал
- •1.5 Зв'язок шкал вимірювань і застосовуваних методів
- •Питання і завдання до розділу 1
- •2 Випадкові величини
- •2.1 Закон розподілу
- •2.1.1 Закон розподілу дискретної випадкової величини
- •2.1.2 Закон розподілу неперервної випадкової величини
- •2.2. Числові характеристики випадкових величин
- •2.2.1 Математичне сподівання
- •2.2.2 Дисперсія випадкової величини
- •2.2.3 Середнє квадратичне відхилення випадкових величин
- •2.2.4 Мода і медіана
- •Графік функції розподілу
- •Питання і завдання до розділу 2
- •Лабораторна робота Тема. Основні характеристики дискретної випадкової величини.
- •3 Нормальний розподіл і основні розподіли, пов'язані з ним
- •Нормальний розподіл
- •3.1.1 Обчислення ймовірності заданого відхилення від математичного сподівання
- •3.1.2 Правило трьох сигм (3σ)
- •3.1.3 Моменти
- •3.1.4 Оцінка відхилення теоретичного розподілу від нормального. Асиметрія та ексцес
- •3.2 Розподіл χ2 (розподіл Пірсона)
- •Функції Excel
- •3.3 Розподіл Стьюдента (t – розподіл)
- •Питання і завдання до розділу 3
- •Лабораторна робота Тема. Нормальний закон розподілу
- •4 Вибірковий метод
- •4.1 Теорема Чебишева
- •4.2 Основні поняття вибіркового методу
- •4.3 Емпіричний закон розподілу
- •4.3.1 Статистичний розподіл у вигляді таблиці
- •4.3.2 Графічне зображення статистичного розподілу
- •4.3.3 Побудова гістограми
- •4.4 Статистичні оцінки параметрів розподілу
- •4.4.1 Міри положення
- •4.4.2 Міри розсіювання
- •4.4.3 Міри форми
- •4.5 Визначення параметрів з використанням ms Excel
- •4.6 Довірчий інтервал
- •4.6.1 Довірчий інтервал для оцінки математичного сподівання нормального розподілу при невідомому
- •4.6.2 Довірчий інтервал для середнього квадратичного відхилення (нормальний розподіл)
- •Питання і завдання до розділу 4
- •Лабораторна робота Тема. Обчислення основних статистичних характеристик вибірки
- •5 Статистична перевірка статистичних гіпотез
- •Помилки першого і другого роду
- •5.1 Перевірка гіпотези про закон розподілу
- •5.1.1 Емпіричні та теоретичні частоти. Безперервний розподіл
- •5.1.2 Критерій згоди Пірсона
- •5.2 Поняття про параметричну, непараметричну і робастну статистику
- •5.3 Порівняння двох дисперсій нормальної генеральної сукупності
- •5.3.1 Критерій Фішера
- •5.4 Порівняння виправленої вибіркової дисперсії з гіпотетичною генеральною дисперсією
- •5.5 Перевірка гіпотез про середні для нормальної генеральної сукупності
- •5.5.2 Перевірка гіпотези про рівність середніх при нерівних дисперсіях (малі вибірки)
- •5.5.4 Перевірка гіпотези про рівність середніх при зв'язаних вибірках
- •5.5.5 Порівняння вибіркової середньої (з генеральної нормальної сукупності) із заданим а
- •Питання і завдання до розділу 5
- •6 Перевірка наявності зв'язку між змінними
- •6.1 Кореляційний аналіз (ка)
- •6.1.1 Властивості коефіцієнта кореляції
- •Зауваження
- •6.1.2 Значущість коефіцієнта кореляції
- •6.2 Поняття про багатовимірний кореляційний аналіз
- •6.2.1 Часткова кореляція
- •6.2.2 Множинний коефіцієнт кореляції
- •Питання і завдання до розділу 6
- •Лабораторна робота Тема. Багатофакторний кореляційний аналіз
Зауваження
1 Варто пам'ятати, що коефіцієнт кореляції показує тісноту тільки лінійного зв'язку, для більш складних залежностей (квадратичних, кубічних та ін.) коефіцієнт кореляції може показувати відсутність зв'язку. Для досліджень більш складних залежностей використовують регресійний аналіз.
2 Наявність статистичного зв'язку необов'язково означає наявність фізичного зв'язку (причинно-наслідковий зв'язок).
Причиною може бути те, що випадкові величини X і Y обидві залежать від змінної Z. У цьому випадку при проведенні кореляційного аналізу ми бачимо зв'язок, який у фізичному змісті відсутній.
У Стокгольмі в 60-ті роки ХХ ст. був обчислений коефіцієнт кореляції між кількістю лелек, що прилітають, і кількістю дітей, що народжуються. Він виявився близьким до 1. Але обидва ці явища залежать від кількості домогосподарств.
У США встановили наявність позитивного зв'язку між кількістю церков і барів (чим більше церков, тим більше барів). Насправді ці величини залежать від розміру міста.
3 З наявності кореляційного зв'язку, що відбиває дійсно існуючий фізичний зв'язок, варто робити правильні висновки. Наприклад, з наявності зворотного зв'язку між температурою повітря й кількістю палива для обігріву приміщення зовсім не випливає, що чим більше топити, тим холодніше буде на вулиці.
6.1.2 Значущість коефіцієнта кореляції
Щоб перевірити, чи значуще коефіцієнт кореляції відрізняється від 0, використовують критеріальне значення
, (6.3)
яке є розподілом Стьюдента з k=N-2 ступенями вільності. При заданому рівні значущості критичне значення tкр знаходять із рівняння P(|t|>tкр)=.
Якщо , то rxy не значуще відрізняється від 0, і приймають гіпотезу про відсутність лінійного кореляційного зв'язку між змінними.
Якщо , то rxy значуще відрізняється від 0, і приймають гіпотезу про наявність лінійного кореляційного зв'язку між змінними.
Залежно від значення розрізняють такі види зв'язку:
0 – 0,3 – слабкий зв'язок; 0,3 – 0,7 – середній зв'язок; 0,7 – 1 – сильний зв'язок.
Приклад. Проаналізувати зв'язок між балом ураження яблунь шкідниками та їх урожайністю. Дані наведені в таблиці 6.1.
Таблиця 6.1 – Значення балу ураження та урожайності яблунь
X |
Y |
XY |
4 |
10 |
40 |
1 |
15 |
15 |
2 |
20 |
40 |
3 |
10 |
30 |
5 |
5 |
25 |
5 |
10 |
50 |
2 |
25 |
50 |
1 |
20 |
20 |
3 |
15 |
45 |
4 |
15 |
60 |
=3 |
=14,5 |
37,5 |
σх =1,41421 |
σy=5,678908 |
=СТАНДОТКЛОНП() |
r xy=-0,747 |
|
|
,
коррел(<діапазон>)= –0,74709.
Перевіряємо значущість коефіцієнта кореляції з рівнем значущості α=0,05.
,
tкр= СТЬЮДРАСПОБР(0,05; 10-2)=2,306,
/tр/ > tкр – отже, коефіцієнт кореляції є статистично значущим.
Висновок: між балом ураження шкідниками й урожайністю яблунь існує сильний зворотний лінійний зв'язок.