- •Лабораторна робота 1 методи вибіркових обстежень. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 2 оцінювання параметрів генеральної сукупності та вибірки. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 3 оцінювання частки та кількості елементів за певною ознакою. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 4 оцінювання середніх та сумарних значень. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 5 перевірка статистичних гіпотез. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 6 непараметричні критерії. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 7 тести про вигляд розподілу. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 8 регресійний аналіз. Множинна лінійна регресія – виконання в пакеті statistica 6.0.
- •Лабораторна робота 9 кластер ний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 10 дисперсійний ний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 11 Категорізовані дані. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 12 канонічний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 13 дискримінантний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 14 факторний аналіз. Виконання в пакеті statistica 6.0.
Лабораторна робота 11 Категорізовані дані. Виконання в пакеті statistica 6.0.
Гіпотези про розподіл частот.
У середовищі кримінологів активно обговорюють питання про зв'язок між порою року та рівнем злочинності. Було вивчено 1361 вбивство та розподілено їх за чотирма порами року. Результати виявились такими:
Пора року |
|
|||
Зима |
Весна |
Літо |
Осінь |
|
328 |
334 |
372 |
327 |
Чи можна, на основі цих даних, зробити висновок про наявність згаданої залежності?
Розглянемо гіпотезу про рівність частот вбивств у різні пори року (відсутність зв'язку між злочинністю та порою року). Гіпотетичні частоти всі однакові і дорівнюють 1361 : 4 = 340,25.
Використаємо модуль Nonparametric Statistics, процедуру Observed versus expected XІ Створимо два набори даних VAR1 – реальні частоти, VAR2 – гіпотетичні частоти. Вибравши у вікні Variables (Observed frequencies: 1, Expected frequencies 2), одержимо результат (після натискування потрібної кількості ОК).
Тому можемо зробити висновок, що гіпотеза про рівність частот вбивств залежно від пори року не суперечить наявним даним (з рівнем значущості меншим, ніж 0,25778). Отже, немає підстав стверджувати про залежність рівня злочинності від пори року.
Гіпотези про незалежність ознак.
Отримано відповіді 100 студентів перших трьох курсів на запитання: "Чи вважаєте Ви, що куріння заважає навчанню?"
Чи підтверджують ці дані припущення про те, що відношення до куріння у студентів різних курсів різне? Вибрати рівень значущості 0,01.
Для знаходження відповіді використаємо модуль Correspondence Analysis. Задамо таблицю даних, увівши частоти, отримані за результатами опитування:
Відповідь |
Курс |
||
1 |
2 |
3 |
|
Ні |
15 |
10 |
0 |
Не знаю |
8 |
5 |
7 |
Так |
0 |
ЗО |
25 |
Вибравши метод Correspondence Analysis, тип даних Frequencies w/out grouping vars, змінні Variables with frequencies: All, одержимо (після натискування ОК) результати перевірки гіпотези Но (відношення до куріння не залежить від курсу) та можливість отримати деякі додаткові результати. Результат (Total chi-square = 44,24; df = 4; р = 0,000) свідчить про те, що гіпотеза Но має бути відхилена.
Оцінка залежності дворівневих даних.
Під час епідемії грипу вивчався вплив щеплень проти цієї хвороби. Отримали такі результати:
|
Після щеплення |
Без щеплення |
Захворіли |
4 |
34 |
Не захворіли |
192 |
111 |
Чи вказують ці результати на ефективність щеплень?
Застосуємо процедуру 2×2 Tables XІ/VI/Phil, McNemar, Fisher exact модуля Nonparametric Statistics. Завантажимо пакет та виберемо відповідну процедуру. У вікні, що відкриється, введемо значення таблиці спряженості ознак. Натиснувши ОК, отримуємо результат.
Бачимо, що гіпотезу про відсутність впливу щеплень на рівень захворюваності потрібно відхилити.
Крім стандартного критерію χ2 Пірсона (Chi-square) і скоректованого χ2 (V-square), STATISTICA обчислює: χ2 з поправкою Йєтса (Yates corrected Chi-square) для випадку малих значень частот; статистику F'2 (F-square), що є мірою зв'язку між номінальними чи категіальними змінними, значення яких неможливо впорядкувати; рівні значущості одностороннього (one-tailed) та двостороннього (two-tailed) критерію Фішера (Fisher exact); значення та рівні значущості критерію χ2 Макнемара (McNemar Chi-square), який застосовують для дослідження залежних вибірок. Якщо сума частот невелика, то краще використовувати критерій Фішера замість χ2.