Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПР № 7,8.doc
Скачиваний:
5
Добавлен:
18.08.2019
Размер:
433.15 Кб
Скачать

Показники, які застосовують у дисперсійному аналізі

Статистичною теорією розроблено шість показників дисперсійного аналізу (табл. 2.4.1).

Для кількісного вимірювання варіацій застосовують сумарну та середню дисперсії:

дисперсія сумарна (D) - вимірює загальний обсяг варіації за сукупністю (групою);

дисперсія середня характеризує варіацію ознаки в розрахунку на одиницю сукупності 2) або на одну ступень вільності (s2)

σ2 = D / N або (s2) = D/V

кількість ступенів вільності варіації (V), або просто кількість ступенів вільності, являє собою кількість незалежних відхилень індивідуальних значень ознаки від його значення. Вона завжди буде на одиницю менша, ніж кількість спостережень (N). Загальна кількість ступенів вільності, що відповідає загальній сумі квадратів відхилень, підлягає в дисперсійному аналізі розкладанню за компонентами варіації аналогічно розкладанню сум квадратів відхилень:

загальній варіації ознаки відповідає кількість ступенів вільності

Vo=N-1;

у міжгруповій варіації, оскільки вона представляє відхилення групових середніх від загального середнього, кількість степенів вільності буде меншою за кількість групи (т) на одиницю, тобто V1 = т-1;

для залишкової варіації ступені вільності визначаються також, як і сама залишкова варіація, тобто за різницею між ступенями волі загальної та міжгрупової варіацій, тобто

V2 = Vo-V1= (N-1)-(m-1) = N-m,

Основними показниками дисперсійного аналізу є три відносних показники, отриманих на основі співвідношення різних видів дисперсій: коефіцієнт детермінації, кореляційне та дисперсійне відношення. Кожен з них має своє призначення.

Кореляційне відношення ) характеризує силу зв'язку факторної і результативної ознак:

Його числове значення коливається в межах від 0 до 1;

Коефіцієнт детермінації 2), який характеризує ступінь впливу систематичного або випадкового фактора на результативний; змінюється в межах від нуля до одиниці:

Він показує частку участі окремих факторів у загальній мінливості ознаки. Якщо варіація результативної ознаки цілком зумовлюється фактором, що вивчається (D0 = DМ), а дія випадкових факторів виключена (DВ = 0), то коефіцієнт детермінації матиме максимальне значення (ή2=1). Мінімальним воно буде (ή2 = 0), якщо вплив групувальної ознаки дорівнює нулю (DM = 0). Проміжні значення ή2 оцінюються за ступенем їхнього наближення до граничних.

Слід підкреслити, що значення ή2 > 0 не завжди є доказом наявності кореляційного зв'язку між ознаками. Відмінне від нуля кореляційне відношення може з'явитись і при випадковому розподілі сукупності на групи. Тому потрібна Перевірка істотності відхилень групових середніх. Вона ґрунтується на порівнянні фактичного значення ή2 з так званим критичним ή2ά. Останнє є тим максимально можливим значенням кореляційного відношення, яке може виникнути випадково при відсутності кореляційного зв'язку. Якщо фактичне значення більше від критичного, то зв'язок між результативною і факторною ознаками вважається істотнім. Якщо фактичне значення менше критичного, то наявність кореляційного зв'язку між ознаками не доведена, зв'язок вважається неістотним.

Критичне значення вибирають таким чином, щоб ймовірність отримання значення ή2 більшого від критичного (за умови відсутності зв'язку між ознаками) була достатньо мала. Таку ймовірність називають рівнем істотності ά. Найчастіше в статистико-екологічних дослідженнях застосовують такі рівні істотності, ά = 0,05 і ά = 0,01. Макет таблиці критичних значень для ή2 рівня істотності ά = 0,05 подано далі. Розподіл ή2 в цій таблиці залежить від числа ступенів вільності (V1) міжгрупової і випадкової (V2) дисперсій.

Дисперсне відношення або критерії Фішера (F) дає змогу оцінити достовірність впливу фактора, що вивчається і використовується для перевірки істотності зв'язку. Числове значення критерію Фішера

завжди повинно бути більше одиниці або дорівнювати їй - F > 1 . Обчислюють його за формулами:

Чим більше значення F, тим достовірніше вплив. Дисперсійне відношення може дорівнювати або бути більшим за одиницю: якщо F = 1,то питання про оцінку достовірності знімається, оскільки дисперсії є рівними; якщо F>], то оцінюється випадково чи невипадково розбіжність між дисперсіями.

Для оцінки випадковості розходжень використовується критичне теоретичне значення Fά, яке показує можливе випадкове значення дисперсійного відношення за даного рівня ймовірності і відповідної кількості ступенів вільності дисперсій, що порівнюються. Його знаходимо за спеціальними математичними таблицями .

Якщо F>Fά, то малоймовірно, що таке розходження є випадковим. Отже, відмінності в варіації значень не можна пояснити лише грою випадку. Ці коливання в 95 або 99 випадках зі ста будуть зумовлені фактором, що вивчається. Тому можна дійти висновку про достовірність впливу факторної ознаки на результативну ознаку. Надійний рівень ймовірності, достатній для висновків, визначається дослідником самостійно залежно від мети і завдань дослідження.

СХЕМА І МОДЕЛІ ДИСПЕРСІЙНОГО АНАЛІЗУ

Схема дисперсійного аналізу включає шість етапів: перший етап - встановлення основних джерел мінливості результативної ознаки і розкладання загальної дисперсії по джерелах утворення та визначення обсягів варіації по джерелах утворення:

другий етап - визначення числа ступенів вільності варіації, що відповідають компонентам загальної варіації;

третій етап - обчислення середніх дисперсій - загальна середня дисперсія σ20 (за правилом складання дисперсій) розкладається на міжгрупову σ2м і внутрішньогрупову σ2в дисперсії:

σ202м2в, кожна з яких є квадратом відхилень від середньої в розрахунку на одиницю сукупності:

,

четвертий етап - оцінка ступеня і сили зв'язку факторних ознак з результативною ознакою. Здійснюється за допомогою двох показників – і2 та ή.

п'ятий етап - оцінка достовірності отриманих розрахунків за допомогою F-критерію

шостий етап - аналіз і загальні висновки про:

  • стан варіації досліджуваної результативної ознаки,

  • фактори, що викликають на її варіацію,

. ступінь і силу впливу факторів на варіацію результативної ознаки;

• достовірність і надійність зроблених оцінок та висновків. Наведена схема використовується як при однофакторному, так і при багатофакторному аналізі. Однак зі збільшенням кількості групувальних ознак ускладнюється процес розчленування варіації за джерелами утворення. Це одна з найбільш складних частин дисперсійного аналізу. Загальна схема розкладання:

Ця схема розкладання загальної дисперсії стосується вивчення мінливості ознак під впливом одного фактора. Якщо ж вивчається змінюваність результативної ознаки, зумовлена впливом кількох факторів, тоді факторна дисперсія Dм може бути представлена сумою дисперсій кожного фактора окремо (А, В,С і т.д.) та дисперсій спільної дії факторів, що аналізуються (AВ, АС, ВС, ABC і т.д.) . Якщо в комплексному досліді вивчають дію двох факторів (А, В) та їх сполучення (АВ), тоді при аналізі визначають дисперсію кожного з цих факторів окремо DA і DB і за їх сумісним використанням DAB. В цьому випадку дисперсію варіантів розкладають на три компоненти:

Якщо у досліді вивчають три фактори А, В, С дисперсія варіантів складається із наступних компонентів:

Наведене рівняння має силу, якщо статистичний комплекс за співвідношенням частот належить до рівномірного пропорційного комплексу. В аналізі екологічних явищ найчастіше трапляються нерівномірні комплекси. Для них набирає сили нерівність:

У всіх цих випадках дисперсійний аналіз починають з визначення загальної дисперсії Do і дисперсії факторів DМ.

Загальна схема розкладання міняється в залежності від числа факторів і порядку формування груп (випадковий чи невипадковий).

Схема розкладання в залежності від числа факторів:

однофакторний дисперсійний аналіз:

Міжгрупова (факторна) дисперсія виникає під впливом врахованих факторів; залишкова дисперсія (внутрішньогрупова) зумовлена дією різних випадкових (неврахованих) факторів.

двофакторний дисперсійний аналіз - міжгрупова (факторна) дисперсія розкладається на складові окремих факторів (А і В) та їх взаємодії (АВ) :

Звідси загальна варіація буде визначається як сума окремих дисперсій, що виникають під дією двох різних факторів:

трифакторний дисперсійний аналіз - міжгрупова дисперсія розкладається на дисперсії трьох факторів та взаємодії між всіма ними:

Звідси загальна варіація буде визначається як сума окремих дисперсій, що виникають під дією трьох різних факторів:

Схема розкладання в залежності від порядку формування груп

  • формування груп випадкове Do = DМ + Озал

  • формування груп невипадкове Do = DМ + Dnoв + Озал

При невипадковому формуванні груп виникає дисперсія повторень (Dnoв) зумовлена дією варіантів повторень.

Моделі дисперсного аналізу. Найважливішим етапом дисперсійного аналізу є добір моделі дисперсійного аналізу, оскільки розкладання загальної варіації і формула розрахунку міжгрупової варіації залежать від ряду умов: кількість складових загальної варіації залежить як від способу формування груп, так і від кількості факторів, взятих для дослідження:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]