- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
- •Тема 6. Дисперсійний аналіз 46
- •Тема 7. Непараметрична статистика 51
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків 63
- •Тема 1. Складання варіаційних рядів та їх графічне зображення.
- •Тема 2. Вирахування середньої арифметичної
- •2.1. Вирахування середньої арифметичної прямим способом у малих вибірках.
- •2.2. Обчислення середньої арифметичної у великих вибірках.
- •2.3. Вирахування середньої зваженої.
- •Тема 3. Показники різноманітності ознаки в сукупностях.
- •3.1. Вирахування середнього квадратичного відхилення в малих вибірках.
- •3.2. Вирахування середнього квадратичного відхилення великих вибірках.
- •3.4. Вирахування коефіцієнту варіації.
- •3.5. Вирахування нормованого відхилення.
- •Тема 4. Визначення зв’язку між ознаками
- •4.1 Обчислення коефіцієнту фенотипічної кореляції в малих вибірках.
- •4.2 Обчислення коефіцієнту фенотипічної кореляції у великих вибірках
- •Добові надої (х)‚ жива вага (у) корів
- •Розрахунок коефіцієнту кореляції між добовими надоями та живою вагою корів.
- •4.3 Обчислення коефіцієнту прямолінійної регресії
- •4.4 Обчислення коефіцієнту генетичної кореляції
- •Тема 5. Помилка репрезентативності. Оцінка достовірності вибіркових показників.
- •5.1 Обчислення допустимих границь для середньої арифметичної генеральної сукупності
- •Допустимі ймовірності (ймовірності безпомилкового прогнозу), відповідні їм значення та допустимі границі у великих вибірках *
- •5.2 Обчислення достовірності різниці між середніми арифметичними
- •5.3 Обчислення критерію відповідності.
- •Вирахування критерію χ2
- •5.3.1 Кількісний аналіз успадкування кольору тіла дрозофілами з використанням критерію відповідності
- •Статистична обробка отриманих результатів
- •5.3.2 Використання критерію відповідності при порівнянні двох емпіричних рядів.
- •5.3.3 Застосування критерію відповідності при визначенні достовірності між двома групами тварин
- •Тема 6. Дисперсійний аналіз
- •Приклад розрахунків при дисперсійному аналізі однофакторних комплексів для малих груп ( число ягнят у потомстві овець каракульської породи).
- •6.1 Визначення коефіцієнту спадкування в однофакторному комплексі
- •Тема 7. Непараметрична статистика
- •7.1 Перевірка гіпотез про закон розподілу. Застосування коефіцієнтів асиметрії та ексцесу для перевірки нормальності розподілу
- •7.2 Особливості представлення непараметичних даних
- •7.2.1 Мода та медіана
- •7.2.2 Довірчі імовірності та рівні значущості
- •7.2.3 Довірчій інтервал
- •7.3 Непараметричні критерії
- •Тема 8. Використання табличного процессору Microsoft Excel для проведення статистичних розрахунків
- •8.1 Точкове й інтервальне оцінювання параметрів розподілів
- •8.1.1. Точкове оцінювання
- •8.1.2. Інтервальне оцінювання
- •8.2 Перевірка статистичних гіпотез про вид розподілу
- •8.3 Перевірка гіпотез про рівність дисперсій і математичних очікувань
- •8.3.1. Критерій Фишера для порівняння дисперсій
- •8.3.2. Критерій Ст’юдента порівняння середніх
- •8.4 Основи регресійного й кореляційного аналізу
- •Додатки
- •Стандартні значення критерію t для малих вибірок (за Стьюдентом).
- •Значення χ2 (хі-квадрат), які відповідають різним рівням значимості та ступеням свободи
- •Стандартні значення критерію для дисперсійного аналізу (за н.А. Плохінським)
- •Критичні значення коефіцієнту асиметрії As
- •Критичні значення коефіцієнту ексцесу Ex
- •Критичні точки t-крітерію Ст’юдента
- •Критичні значення критерію u Манна-Уітні
- •Список рекомендованої літератури
- •Основи статистичного аналізу в екології
- •6.070800, 7.070801, 8.070801 — «Екологія та охорона навколишнього середовища»
8.4 Основи регресійного й кореляційного аналізу
Рівняння регресії будується для аналізу статистичних залежностей між двома або більш показників. Якщо показників два, то регресія називається парний. Якщо залежність між показниками XиY пропорційна, то регресія буде лінійної й описується рівнянням виду у = ах + b. Розглянемо методику побудови регресійного рівняння на прикладі.
Розбір вирішення задачі
Агропромислова фірма бажає з’ясувати, як впливає кількість внесення мінеральних добрив (кг/га) на врожайність культури (ц/га).
Вага добрив, (кг/га) |
12 |
15 |
17 |
19 |
20 |
22 |
25 |
27 |
28 |
30 |
33 |
33 |
Врожай, (ц/га) |
34 |
42 |
45 |
49 |
53 |
55 |
61 |
68 |
67 |
71 |
75 |
74 |
Уведемо цю таблицю в комірки А1-М2 електронної книги Excel. Переглянемо попередньо, як лежать точки на графіку і яке рівняння регресії краще вибрати. Для цього будуємо графік. Викликавши майстер діаграм і вибравши тип діаграми «Крапкова» натискаємо «Далі» і помістивши курсор у поле «Діапазон» обводимо курсором дані Y (комірки В2-М2). Переходимо на закладку «Ряд» і в поле «Значення X» робимо посилання на комірки В 1-М1, обводячи їх курсором. Натискаємо «Готово».
Як видно із графіка, точки добре укладаються на пряму лінію, тому будемо знаходити рівняння лінійної регресії виду y = ах + b .
Для знаходження коефіцієнтів а й b рівняння регресії служать функції НАКЛОН і ОТРЕЗОК, категорії «Статистичні». Уводимо в А5 підпис «а=» а в сусіднє комірка В5 уводимо функцію НАКЛОН, ставимо курсор у поле «Изв_знач_y» задаємо посилання на комірки В2-М2, обводячи їх мишею. Аналогічно в поле «Изв_знач_х» вводимо посилання на В1-М1. Результат 1,923921. Знайдемо тепер коефіцієнт b. Уводимо в А6 підпис «b=», а в В6 функцію ОТРЕЗОК з тими ж параметрами, що й у функції НАКЛОН. Результат 12,78151. Отже, рівняння лінійної регресії є y = 1,92х +12,78 .
Побудуємо графік рівняння регресії. Для цього в третій рядок таблиці введемо значення функції регресії в заданих точках X (перший рядок) – y(xi). Для одержання цих значень використовується функція ТЕНДЕНЦІЯ категорії «Статистичні». Уводимо в A3 підпис Y(X) і, помістивши курсор у В3, викликаємо функцію ТЕНДЕНЦІЯ. У поля «Изв_знач_y» і «Изв_знач_х» вводимо посилання на В2-М2 і В1-М1. У поле «Нове_знач_х» уводимо також посилання на В1-М1. У поле «Константа» уводять 1, якщо рівняння регресії має вигляд у = ах + b, і 0, якщо у = ах . У нашому випадку вводимо одиницю. Функція ТЕНДЕНЦИЯ є масивом, тому для висновку всіх її значень виділяємо область В3-М3 і натискаємо F2 і Ctrl+Shift+Enter. Результат — значення рівняння регресії в заданих точках. Будуємо графік. Ставимо курсор у будь-яку вільну комірку, викликаємо майстер діаграм, вибираємо категорію «Точкова», вид графіка — лінія без точок (у нижньому правому куті), натискаємо «Далі», у поле «Діапазон» уводимо посилання на В3-М3. Переходимо на закладку «Ряд» і в поле «Значення X» уводимо посилання на B1-M1, натискаємо «Готово». Результат — пряма лінія регресії. Подивимося, як різняться графіки дослідних даних і рівняння регресії. Для цього ставимо курсор у будь-яке вільну комірку, викликаємо майстер діаграм, категорія «Графік», вид графіка — ламана лінія із крапками (друга зверху ліва), натискаємо «Далі», у поле «Діапазон» уводимо посилання на другу й третю рядки В2-М3. Переходимо на закладку «Ряд» і в поле «Підпису осі X» уводимо посилання на B1-M1, натискаємо «Готово». Результат - дві лінії (Синя - вихідні дані, червона - рівняння регресії). Видно що лінії мало різняться між собою.
Для обчислення коефіцієнта кореляції r служить функція ПИРСОН. Розміщаємо графіки так, щоб вони розташовувалися вище 25 рядки, і в А25 робимо підпис «Кореляція», в В25 викликаємо функцію ПИРСОН, у полях якої «Масив 1» і «Масив 2» уводимо посилання на вихідні дані B1-M1 і В2-М2. Результат 0,993821. Коефіцієнт детермінації R — це квадрат коефіцієнта кореляції r. В А26 робимо підпис «Детермінація», а в В26 – формулу =В25*В25. Результат 0,987681.
Однак, в Excel існує одна функція, яка розраховує всі основні характеристики лінійної регресії. Це функція ЛИНЕЙН. Ставимо курсор в В28 і викликаємо функцію ЛИНЕЙН, категорії «Статистичні». У полях «Изв_знач_у» і «Изв_знач_х» даємо посилання на В2-М2 і В1-М1. Поле «Константа» має той же зміст, що й у функції ТЕНДЕНЦІЯ, у нас вона рівна 1. Поле «Стат» повинне містити 1, якщо потрібно вивести повну статистику про регресію. У нашому випадку ставимо туди одиницю. Функція повертає масив розміром 2 стовпця й 5 рядків. Після введення виділяємо мишею комірки В28-С32 і натискаємо F2 і Ctrl+Shift+Enter. Результат - таблиця значень, числа в якій мають наступний сенс:
Коефіцієнт а |
Коефіцієнт b |
Стандартна помилка тy |
Стандартна помилка тx |
Коефіцієнт детермінації R |
Среднеквадратическое відхилення в |
F - статистика |
Ступені свободи п-2 |
Регресійна сума квадратів S2b |
Залишкова сума квадратів S2a |
Аналіз результату: у першому рядку - коефіцієнти рівняння регресії, зрівняєте їх з розрахованими функціями НАКЛОН і ОТРЕЗОК. Другий рядок - стандартні помилки коефіцієнтів. Якщо одна з них по модулю більше чому сам коефіцієнт, то коефіцієнт уважається нульовим. Коефіцієнт детермінації характеризує якість зв'язку між факторами. Отримане значення 0,987681 свідчить про дуже гарний зв'язок факторів. F - статистика перевіряє гіпотезу про адекватність регресійної моделі. Дане число потрібно зрівняти із критичним значенням, для його одержання вводимо в Е33 підпис « F-Критичне», а в F33 функцію FPAСПРОБP, аргументами якої вводимо відповідно «0,05» (рівень значимості), «1» (число факторів X) і «10» (ступені свободи). Видне, що F- статистика більше, чим F- критичне, значить я модель адекватна. В останньому рядку наведені регресійна сума квадратів
і залишкові суми квадратів
Важливо, щоб регресійна сума (пояснена регресією) була набагато більше залишковою (не пояснена регресією, викликана випадковими факторами). У нашому випадку ця умова виконується, що свідчить про наявність вираженої регресії.