Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпори АД.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
954.37 Кб
Скачать

3. Перевірка основних гіпотез.

Під статистичною гіпотезою будь-яке твердження щодо генеральної сукупності, яке перевіряється на основі вибірки.

Зроблений на основі статистичних даних висновок про те, що між кількома генеральними сукупностями або між емпіричним і теоретичним розподілом істотних відмінностей немає називають нульовою (основною) гіпотезою і позначають Н0. Гіпотезу, яка заперечує нульову, називають альтернативною гіпотезою і позначають буквою На.

Ймовірність допустити помилку першого виду називають рівнем. Рівень значущості - це та мінімальна ймовірність, починаючи з якої можна вважати подію практично неможливою.

Задачі першого типу пов’язані з перевіркою гіпотез про достовірність істотної відмінності між параметрами статистичних сукупностей.

Задачі другого типу пов’язані з оцінкою ступеня розбіжності емпіричного і теоретичного розподілів.

Перевірка гіпотези полягає в тому, що за вибірковими даними обчислюють значення деякої величини, яка має відомий стандартний розподіл. Цю величину називають статистикою критерію або просто значенням критерію.

Перевірка статистичної гіпотези складається з наступних етапів:

  1. оцінка вихідної інформації і опис статистичної моделі вибіркової сукупності;

  2. визначення гіпотези Н0 і Н1;

  3. задання рівня значущості ;

  4. визначення за таблицями, рівнем значущості  і за альтернативною гіпотезою Н1 критичної області;

  5. обчислення за вибіркою значення статистики;

  6. порівняння значення статистики з критичною областю;

  7. прийняття рішення: якщо значення статистики не входить в критичну область, то приймається гіпотеза Н0 і відкидається гіпотеза Н1, а якщо входить в критичну область, то заперечується гіпотеза Н0 і приймається гіпотеза Н1.

  1. Видалення аномальних спостережень.

Видалення спостережень, величина яких не порівнюються (узгоджуються) з розподілом основної маси даних.

Ідентифікація аномальних спостережень дозволяє ще раз перевірити умови їх реєстрації і тим самим знайти і виправити помилку. Якщо ж помилку виправити не вдається, то дані просто виключаються із подальшої обробки як нетипові.

Розглянута задача поділяється на два етапи:

  1. Вияв „підозрілих” спостережень;

  2. Перевірка статистичної значимості їх відмінності від основного набору даних

    1. Перевірка випадковості (стохастичності) вибірки.

Для перевірки, чи вибірка випадково вибрана із нормальної генеральної сукупності, чи вибірка випадково вибрана із нормальної генеральної сукупності, чи незалежні нормально розподілені випадкові величини, можна скористатись критерієм Аббе. Статистика критерія підраховується за формулою:

.

  1. Графічне представлення даних.

Для кількісного опису відмінностей між групами спостережень розроблені багато чисельні обчислювальні методи, що базуються на групуванні даних (наприклад, дисперсійний аналіз). Проте графічні засоби мають особливі переваги і дозволяють виявити закономірності, що важко піддаються кількісному опису і які важко знайти за допомогою обчислювальних процедур (наприклад, складні взаємозв'язки, виключення і аналогії).

Для наглядності варіаційні ряди розподілу можуть бути зображені графічно у вигляді гістограми, полігону, огіви чи кумуляти.

Гістограма служить для зображення варіаційного ряду розподілу, полігон – для дискретного варіаційного ряду, огіва – для ранджированого ряду, комулята – для накопичених частот (графік емпіричної функції розподілу).

Графік складається з ізольованих точок. Їх можна з'єднати пунктирними

прямими, щоб більш наглядно зобразити зміни pk при змінах хk. В проміжках між

точками хk, а також поза областю (x1, x3) значення р=0.

Такий графік називають ступеневий.

У випадку неперервного розподілу на осі абсцис відкладають значення випадкової величини. Графік такого вигляду називається огіва.

Для побудови графіка емпіричної щільності ймовірності на кожному інтервалі, як на основі, будують прямокутник, площа якого дорівнює або числу випадків, або відносній частоті. Графіки такого вигляду називають гістограмами. Іноді замість гістограми будують полігон, який отримують із гістограми якщо з'єднати відрізками

прямих середини верхніх сторін прямокутника

Діаграми розсіювання використовуються для візуального дослідження залежності між двома змінними дослідження залежності між двома змінними X і Y Дані зображаються крапками.

Викиди.

Ще одна важлива перевага діаграм розсіювання полягає в тому, що вони дозволяють знаходити „викиди”

Нормальні ймовірності графіки – дозволяють візуально досліджувати, наскільки розподіл даних близький до нормального.

Діаграми діапазонів.

На діаграмах діапазонів показані діапазони значень чи стовпці помилок, що відносяться до визначених точок даних, у формі прямокутників чи відрізків.

Як правило горизонтальні діаграми діапазонів використовуються для зображення часових проміжків, а не мінливість.

Діаграми розмаху. На діаграмах розмаху чи так звані ящики-вуса, діапазони значень вибраної змінної (чи змінних) будуються окремо для груп спостережень, які визначаються значеннями категоріальної чи групової

Стовпчикові діаграми – представляють собою послідовність значень у вигляді стовпців.

Лінійні графіки – являють собою графіки однієї чи багатьох змінних, на яких окремі точки з'єднані лініями.

Кругова діаграма – графік для представлення пропорцій.

Діаграми пропущених значень та інтервалів.

Трьохвимірний візуальний аналіз дозволяє аналізувати дані в трьох вимірному просторі.

Категоризовані графіки дозволяють візуалізувати категоризовані дані, тобто дані розбиті на групи (категорії) за допомогою однієї чи декількох групуючи змінних.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]