
- •Етапи аналізу даних.
- •Класифікація типів змінних.
- •Групування даних.
- •Етапи попередньої обробки даних .
- •2. Числові характеристики вибірки.
- •3. Перевірка основних гіпотез.
- •Видалення аномальних спостережень.
- •Перевірка випадковості (стохастичності) вибірки.
- •Графічне представлення даних.
- •1. Суть кореляційного аналізу
- •Коефіцієнт детермінації – це є квадрат коефіцієнта кореляції, долю варіації, спільну для двох змінних, іншими словами “степінь” залежності двох змінних.
- •3. Частинні коефіцієнти кореляції.
- •4. Нелінійна кореляція.
- •2.Індекс Фехнера.
- •3. Кореляційне відношення Пірсона
- •4.Коефіцієнт конкордації.
- •Тема: „Регресійний аналіз”.
- •Регресійний аналіз – сукупність статистичних методів, що орієнтовані на дослідження стохастичної залежності однієї змінної y від набору інших змінних .
- •Метод найменших квадратів
- •Дисперсійний аналіз
- •Модель ііi.
- •Коваріаційний аналіз.
- •Перевірка гіпотези в умовах ;
- •35.Дискримінант ний аналіз.
Модель ііi.
Перевіряються нульові гіпотези:
,
(44)
Критерій для перевірки нульових гіпотез:
(45)
.
Прийняття рішення здійснюється так, як і в моделях 1 і 2.
Існують ще різновиди перехресної класифікації. А саме:
перехресна класифікація (ПК) з одним повторенням в комірці.
ПК з нерівною кількістю спостережень в комірках.
Ієрархічна класифікація результатів спостережень застосовується в дисперсійному аналізі в тих випадках, коли один фактор згрупований всередині іншого „головного” фактора.
основне рівняння прийнятої моделі дисперсійного аналізу мають вигляд:
(46)
де -математичне сподівання всіх результатів спостережень;
-ефект і-ої градації фактора А;
-ефект
j-го
рівня фактора В
в
межах і-ої
градації фактора А;
-ефект
неконтрольованих факторів.
Дисперсію у запишемо у вигляді суми:
(47)
Перевіряємо гіпотези:
(48)
Визначаємо суми квадратів відхилень:
(49)
(50)
(51)
де
(52)
(53)
(54)
Величина
відображає вплив фктора А,
-вплив
фактору В,
-характеризує
зміну всередині комірок. Середні квадрати
знаходяться за формулами:
(55)
(56)
Статистики
при виконанні відповідних нульових
гіпотез, мають F-розподіл
з степенями вільності
(57)
Коваріаційний аналіз.
Коваріація між двома вибірками випадкових величин обчислюється за формулою:
(1)
де
компоненти векторів х
та у,
п-
чисельність вибірки.
Коваріація вибірки самої з собою називається дисперсією. Коваріація може бути як додатньою, так і від’ємною.
В
більш широкому змісті коваріацією
називають сукупність трьох статичних
показників: середніх арифметичних
та
,
сум квадратів відхилень
і
і
суми добутків відхилень
.
Паралельний розклад цих величин за
факторами змін і складає суть коваріаційного
аналізу.
Коваріаційний аналіз включає три основних етапи:
дисперсійний аналіз X, Y та добутків XY;
розклад залишкової дисперсії Cz за рядом у (залишок 1) на суму квадратів відхилень, обумовлену регресією Y по X, що позначається Cb ісуму квадратів відхилень від регресії
(залишок 2);
(2)
приведення фактичних середніх за рядом Y до повного вирівнювання умов експерименту за рядом Х.
коваріаційний аналіз (КА) – це статистичний метод оцінки впливу на випадкову величину різних одночасно діючих факторів, одні з яких задані якісно, а інші можуть бути виміряні кількісно. Тобто, КА можна розглядати, як комбінацію дисперсійного та регресійного аналізів.
Суму квадратів відхилень, зумовлену регресією Y на X визначають за формулою:
(3)
Суму
квадратів випадкового змінювання, тобто
суму квадратів відхилень від регресії,
знаходить як різницю
.
Коеіцієнт
регресії
(4)
Результативну ознаку вирівнюють за співвідношенням
(5)
Y1 – коректоваі дані; byx – коефіцієнт регресії;
Y
– фактичні дані;
- різниця між середнім значенням
незалежної змінної х
та її фактичним значенням.
(2.) Основна модель КА, що узагальнює дисперсійний та регресійний підходи, має вигляд:
(6)
де Y, X, β мають той же зміст, що і моделі ДА;
а z’γ – визначає вклад факторів, що піддаються кількісному дослідженню, при цьому z – значення факторів (регресорів), γ – коефіцієнти регресії Y на z.
Далі будемо допускати, що коефіцієнти регресії не залежать від градацій якісного фактору, що задають розбиття вхідних даних на р груп:
.
Основні припущення КА:
Y має нормальний розподіл з параметрами
Y має нормальний розподіл з параметрами
Як
і в дисперсійному і регресійному
аналізах, розподіл
також допускається нормальним з
параметрами
.
Припущення
(1) відповідає нульовій гіпотезі
,
а припущення (2) – гіпотезі
.
Якщо
виконується, то перевірка
зводиться до загального дисперсійного
аналізу.
Якщо ж відхиляється, то перед перевіркою треба внести деякі корективи, що виключають ефект регресії.
Основна модель КА зручно розглядати на прикладі одно факторного аналізу з однією незалежною змінною (регресором):
(7)
де
- ефект і-
ї градації фактора А;
-
ефект, обумовлений дією змінної z;
-
коефіцієнт регресії;
-
ефект неконтрольованих факторів;
.
Перевірка
гіпотези
:
= 0 здійснюється за наступною схемою:
І. Визначаємо суми квадратів і добутків відхилень, що відображають змінювання Y і z,
а) Всередині груп (градацій)
;
(8)
де
;
(9)
б) Між групами:
;
(10)
(11)
де
;
(12)
ІІ. Якщо гіпотеза вірна, то статистика що обчислюється за формулою:
(13)
має
F-розподіл
з f1=1,
f2=N-p-1
степенями вільності. Гіпотеза про
рівність нулю коефіцієнта регресії
відхиляється, якщо обчислене значення
критерія перевищить табличне
.