Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОСНОВИ СТАТИСТИЧНОГО АНАЛІЗУ В ЕКОЛОГІЇ.doc
Скачиваний:
5
Добавлен:
05.05.2019
Размер:
3.51 Mб
Скачать

8.4 Основи регресійного й кореляційного аналізу

Рівняння регресії будується для аналізу статистичних залежностей між двома або більш показників. Якщо показників два, то регресія називається парний. Якщо залежність між показниками XиY пропорційна, то регресія буде лінійної й описується рівнянням виду у = ах + b. Розглянемо методику побудови регресійного рівняння на прикладі.

Розбір вирішення задачі

Агропромислова фірма бажає з’ясувати, як впливає кількість внесення мінеральних добрив (кг/га) на врожайність культури (ц/га).

Вага добрив, (кг/га)

12

15

17

19

20

22

25

27

28

30

33

33

Врожай, (ц/га)

34

42

45

49

53

55

61

68

67

71

75

74

Уведемо цю таблицю в комірки А1-М2 електронної книги Excel. Переглянемо попередньо, як лежать точки на графіку і яке рівняння регресії краще вибрати. Для цього будуємо графік. Викликавши майстер діаграм і вибравши тип діаграми «Крапкова» натискаємо «Далі» і помістивши курсор у поле «Діапазон» обводимо курсором дані Y (комірки В2-М2). Переходимо на закладку «Ряд» і в поле «Значення X» робимо посилання на комірки В 1-М1, обводячи їх курсором. Натискаємо «Готово».

Як видно із графіка, точки добре укладаються на пряму лінію, тому будемо знаходити рівняння лінійної регресії виду y = ах + b .

Для знаходження коефіцієнтів а й b рівняння регресії служать функції НАКЛОН і ОТРЕЗОК, категорії «Статистичні». Уводимо в А5 підпис «а=» а в сусіднє комірка В5 уводимо функцію НАКЛОН, ставимо курсор у поле «Изв_знач_y» задаємо посилання на комірки В2-М2, обводячи їх мишею. Аналогічно в поле «Изв_знач_х» вводимо посилання на В1-М1. Результат 1,923921. Знайдемо тепер коефіцієнт b. Уводимо в А6 підпис «b=», а в В6 функцію ОТРЕЗОК з тими ж параметрами, що й у функції НАКЛОН. Результат 12,78151. Отже, рівняння лінійної регресії є y = 1,92х +12,78 .

Побудуємо графік рівняння регресії. Для цього в третій рядок таблиці введемо значення функції регресії в заданих точках X (перший рядок) – y(xi). Для одержання цих значень використовується функція ТЕНДЕНЦІЯ категорії «Статистичні». Уводимо в A3 підпис Y(X) і, помістивши курсор у В3, викликаємо функцію ТЕНДЕНЦІЯ. У поля «Изв_знач_y» і «Изв_знач_х» вводимо посилання на В2-М2 і В1-М1. У поле «Нове_знач_х» уводимо також посилання на В1-М1. У поле «Константа» уводять 1, якщо рівняння регресії має вигляд у = ах + b, і 0, якщо у = ах . У нашому випадку вводимо одиницю. Функція ТЕНДЕНЦИЯ є масивом, тому для висновку всіх її значень виділяємо область В3-М3 і натискаємо F2 і Ctrl+Shift+Enter. Результат — значення рівняння регресії в заданих точках. Будуємо графік. Ставимо курсор у будь-яку вільну комірку, викликаємо майстер діаграм, вибираємо категорію «Точкова», вид графіка — лінія без точок (у нижньому правому куті), натискаємо «Далі», у поле «Діапазон» уводимо посилання на В3-М3. Переходимо на закладку «Ряд» і в поле «Значення X» уводимо посилання на B1-M1, натискаємо «Готово». Результат — пряма лінія регресії. Подивимося, як різняться графіки дослідних даних і рівняння регресії. Для цього ставимо курсор у будь-яке вільну комірку, викликаємо майстер діаграм, категорія «Графік», вид графіка — ламана лінія із крапками (друга зверху ліва), натискаємо «Далі», у поле «Діапазон» уводимо посилання на другу й третю рядки В2-М3. Переходимо на закладку «Ряд» і в поле «Підпису осі X» уводимо посилання на B1-M1, натискаємо «Готово». Результат - дві лінії (Синя - вихідні дані, червона - рівняння регресії). Видно що лінії мало різняться між собою.

Для обчислення коефіцієнта кореляції r служить функція ПИРСОН. Розміщаємо графіки так, щоб вони розташовувалися вище 25 рядки, і в А25 робимо підпис «Кореляція», в В25 викликаємо функцію ПИРСОН, у полях якої «Масив 1» і «Масив 2» уводимо посилання на вихідні дані B1-M1 і В2-М2. Результат 0,993821. Коефіцієнт детермінації R — це квадрат коефіцієнта кореляції r. В А26 робимо підпис «Детермінація», а в В26 – формулу =В25*В25. Результат 0,987681.

Однак, в Excel існує одна функція, яка розраховує всі основні характеристики лінійної регресії. Це функція ЛИНЕЙН. Ставимо курсор в В28 і викликаємо функцію ЛИНЕЙН, категорії «Статистичні». У полях «Изв_знач_у» і «Изв_знач_х» даємо посилання на В2-М2 і В1-М1. Поле «Константа» має той же зміст, що й у функції ТЕНДЕНЦІЯ, у нас вона рівна 1. Поле «Стат» повинне містити 1, якщо потрібно вивести повну статистику про регресію. У нашому випадку ставимо туди одиницю. Функція повертає масив розміром 2 стовпця й 5 рядків. Після введення виділяємо мишею комірки В28-С32 і натискаємо F2 і Ctrl+Shift+Enter. Результат - таблиця значень, числа в якій мають наступний сенс:

Коефіцієнт а

Коефіцієнт b

Стандартна помилка тy

Стандартна помилка тx

Коефіцієнт детермінації R

Среднеквадратическое відхилення в

F - статистика

Ступені свободи п-2

Регресійна сума квадратів S2b

Залишкова сума квадратів S2a

Аналіз результату: у першому рядку - коефіцієнти рівняння регресії, зрівняєте їх з розрахованими функціями НАКЛОН і ОТРЕЗОК. Другий рядок - стандартні помилки коефіцієнтів. Якщо одна з них по модулю більше чому сам коефіцієнт, то коефіцієнт уважається нульовим. Коефіцієнт детермінації характеризує якість зв'язку між факторами. Отримане значення 0,987681 свідчить про дуже гарний зв'язок факторів. F - статистика перевіряє гіпотезу про адекватність регресійної моделі. Дане число потрібно зрівняти із критичним значенням, для його одержання вводимо в Е33 підпис « F-Критичне», а в F33 функцію FPAСПРОБP, аргументами якої вводимо відповідно «0,05» (рівень значимості), «1» (число факторів X) і «10» (ступені свободи). Видне, що F- статистика більше, чим F- критичне, значить я модель адекватна. В останньому рядку наведені регресійна сума квадратів

і залишкові суми квадратів

Важливо, щоб регресійна сума (пояснена регресією) була набагато більше залишковою (не пояснена регресією, викликана випадковими факторами). У нашому випадку ця умова виконується, що свідчить про наявність вираженої регресії.