
- •Етапи аналізу даних.
- •Класифікація типів змінних.
- •Групування даних.
- •Етапи попередньої обробки даних .
- •2. Числові характеристики вибірки.
- •3. Перевірка основних гіпотез.
- •Видалення аномальних спостережень.
- •Перевірка випадковості (стохастичності) вибірки.
- •Графічне представлення даних.
- •1. Суть кореляційного аналізу
- •Коефіцієнт детермінації – це є квадрат коефіцієнта кореляції, долю варіації, спільну для двох змінних, іншими словами “степінь” залежності двох змінних.
- •3. Частинні коефіцієнти кореляції.
- •4. Нелінійна кореляція.
- •2.Індекс Фехнера.
- •3. Кореляційне відношення Пірсона
- •4.Коефіцієнт конкордації.
- •Тема: „Регресійний аналіз”.
- •Регресійний аналіз – сукупність статистичних методів, що орієнтовані на дослідження стохастичної залежності однієї змінної y від набору інших змінних .
- •Метод найменших квадратів
- •Дисперсійний аналіз
- •Модель ііi.
- •Коваріаційний аналіз.
- •Перевірка гіпотези в умовах ;
- •35.Дискримінант ний аналіз.
Аналіз даних (АД) – це дисципліна і систематизує поняття, прийоми, математичні методи і моделі, що призначені для організації, збору, стандартного запису, систематизації і обробки ( втому числі і за допомогою ЕОМ) статистичних даних, з метою їх зручного представлення, інтерпретації і отримання наукових і практичних висновків.
Отже, АД – це математична обробка експеремент. даних з використанням статистичних даних.
Етапи аналізу даних.
Основні етапи:
візуальний аналіз (графіки, діаграми, таблиці);
описовий аналіз (прогнозування, запитання і відповіді);
статистична модель (регресійний, диспесійний, кореляційний аналіз і т.д.);
аналіз результатів.
Основні етапи статистичного аналізу даних:
початковий (попередній) аналіз досліджуваної системи;
складання плану для збору вихідної інформації;
збір початкових даних, їх підготовка для введення в ЕОМ;
попередня обробка даних, складання детального плану обчислювального аналізу матеріалу;
реалізація плану обчислювального аналізу початкових даних з допомогою комп'ютера;
проведення підсумків дослідження.
Класифікація типів змінних.
Змінна (англ. термін variable) – це те, що можна вимірювати, контролювати або це те, чим можна маніпулювати в дослідженнях. Іншими словами, це те, що змінюється, а не постійним (від англ. кореня var).
Розрізняють чотири типи змінних: номінальна, порядкова (ординальна), інтеравльна, відносна.
Номінальні змінні використовуються тільки для якісної класифікації. Це означає, що дані змінні можуть бути виміряні тільки в термінах належності можуть бути виміряні тільки в термінах належності до деяких суттєво різних класів, при цьому не можна визначити кількість чи впорядкувати ці класи.
Порядкові змінні дозволяють впорядковувати об'єкти, вказуючи при цьому , які з них в більшій чи меншій мірі володіють якістю, що виражається даною змінною.
Інтервальні змінні дозволяють не тільки впорядковувати об'єкти вимірювання, але і чисельно виражати і порівнювати різницю між ними.
Відносні змінні дуже схожі на інтервальні змінні. Крім всіх властивостей інтервальних змінних вони свою особливість – це наявність визначеної точки абсолютного нуля, таким чином, для цих змінних є обґрунтованим твердження типу: х в два рази більше ніж y.
Залежні змінні і незалежні.
Незалежними змінними називаються змінні, які варіюються дослідником, тоді як залежні змінні – це змінні, які вимірюються чи регіструються.
Якщо ще раз розглянути приклад з кількістю відвідувачів магазину, то інтенсивність реклами-це є незалежна змінна, а потік відвідувачів – залежна.
Якщо в результат експерименту зареєстрували одне число, то відповідну випадкову величину прийнято називати одномірною або скалярною. Якщо ж результатом кожного експерименту (спостереження) є реєстрація цілого набору характеристик, то відповідну випадкову величину називають багатомірною чи векторною.
Кількісна випадкова величина дозволяє вимірювати ступінь прояву властивості досліджуваного об'єкта у визначеній шкалі (інтервальна, шкала відношень). Ординальна випадкова величина дозволяє впорядкувати об'єкти, що досліджуються в ході випадкових експериментів по ступеню прояви в них властивостей, що аналізуються. Номінальна випадкова величина дозволяє розбивати об'єкти на однорідні класи, що не підлягають впорядкуванню.
Метою будь-якого дослідження чи наукового аналізу є знаходження зв'язків (залежностей) між змінними, що вимірюються.
Надійність взаємозалежності менш наглядне поняття, ніж величина залежності, але дуже важливе. Надійність показує наскільки ймовірно те, що залежність, подібна до знайденої, буде знову знайдена (підтвердиться) за даними іншої вибірки.
Величина і надійність представляють собою дві різні характеристики між змінними. Але не можна сказати, що вони зовсім незалежні. В загальному можна стверджувати, що чим більша величина залежності (зв'язку) між змінними у вибірці, тим вона надійніша.