
- •Етапи аналізу даних.
- •Класифікація типів змінних.
- •Групування даних.
- •Етапи попередньої обробки даних .
- •2. Числові характеристики вибірки.
- •3. Перевірка основних гіпотез.
- •Видалення аномальних спостережень.
- •Перевірка випадковості (стохастичності) вибірки.
- •Графічне представлення даних.
- •1. Суть кореляційного аналізу
- •Коефіцієнт детермінації – це є квадрат коефіцієнта кореляції, долю варіації, спільну для двох змінних, іншими словами “степінь” залежності двох змінних.
- •3. Частинні коефіцієнти кореляції.
- •4. Нелінійна кореляція.
- •2.Індекс Фехнера.
- •3. Кореляційне відношення Пірсона
- •4.Коефіцієнт конкордації.
- •Тема: „Регресійний аналіз”.
- •Регресійний аналіз – сукупність статистичних методів, що орієнтовані на дослідження стохастичної залежності однієї змінної y від набору інших змінних .
- •Метод найменших квадратів
- •Дисперсійний аналіз
- •Модель ііi.
- •Коваріаційний аналіз.
- •Перевірка гіпотези в умовах ;
- •35.Дискримінант ний аналіз.
Групування даних.
Описові статистики.
Мінімум і максимум – це мінімальне і максимальне значення змінної.
Середнє – сума значень змінної, поділене на n (число значень змінної):
Дисперсія
вибірки
або вибіркова дисперсія
,
Стандартне
відношення
–
- корінь
квадратний з дисперсії.
Медіана вибірки – значення, що розбиває вибірку на дві рівні частини. Половина спостережень лежать вище медіани, половина – нижче.
Обчислюється
таким чином: вибірка впорядковується
за зростанням, отримана послідовно
xk,
k=1,…2m+1,
називається варіаційним рядом або
порядковими статистиками. Якщо число
спостережень непарне (2m+1),
то медіана береться як xm+1,
якщо парне 2т,
то як
.
Квантиль – це число хp, нижче якого знаходиться p-а частина (доля) вибірки.
Мода – значення, яке найбільш часто зустрічається, тобто найбільш „модне” значення змінної.
Асиметрія
– це характеристика форми розподілу
скошеності.
.
Ексцес – характеристика форми розподілу, а саме міра гостроти піку
;
моментами
розподілу
Етапи попередньої обробки даних .
Попередня обробка результатів вимірювань чи спостережень необхідна для того, щоб надалі з найбільшою ефективністю, а головне – коректно, використовувати статистичні методи для побудови емпіричних залежностей.
Суть попередньої обробки в основному полягає у відсіюванні грубих похибок вимірювань чи похибок, які виникають в результаті переписування цифрового матеріалу чи при вводі інформації в ЕОМ.
Ще одним важливим моментом попередньої обробки є перевірка відповідності розподілу результатів вимірювань закону нормального розподілу. Після цього можна перейти до побудови елементарних формул, застосовуючи, наприклад, метод найменших квадратів
В ході ПОД вирішують наступні підзадачі: 1. перетворення змінних описаних текстом номінальну та ординальну шкалу; 2. статичний опис поточних сукупностей з визначенням границь варіацій змінних; 3. аналіз спостережень що різко виділяються ; 4. перевірка статистичної незалежності ; 5. уніфікація типів змінних; 6. експеримент аналіз закону розподіл закону генеральної сукупності
2. Числові характеристики вибірки.
Сукупність усіх можливих значень досліджуваної величини (ознаки) називають генеральною сукупністю. Генеральна сукупність може бути скінченною і нескінченною. Результати обмеженого ряду спостережень х1,х2,...хn випадкової величини називають вибіркою з генеральної сукупності. Кількість елементів вибіркової сукупності називають її обсягом. Окреме значення ознаки називають її варіантою. Число, яке показує, скільки разів зустрічається та чи інша варіанта, називають частотою. Сума всіх частот дорівнює обсягу сукупності. Щоб вивчити закономірності частоти появи варіант, їх розміщують у зростаючому або спадному порядку і вказують частоту появи кожної з варіант даної сукупності. При цьому дістають таблицю, яку називають варіаційним рядом, або емпіричним розподілом.
Дискретною варіацією ознаки називають таку, коли окремі значення варіанти відрізняються одне від одного на деяку скінченну величину. Неперервна – це така варіація, коли значення варіанти можуть відрізнятися одне від одного на будь-яку нескінченно малу величину. Розподіл непевної варіації називають інтервальним.