Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sis_an_pract.doc
Скачиваний:
14
Добавлен:
24.04.2019
Размер:
2.54 Mб
Скачать

Лабораторна робота 11 Категорізовані дані. Виконання в пакеті statistica 6.0.

Гіпотези про розподіл частот.

У середовищі кримінологів активно обговорюють питання про зв'язок між порою року та рівнем злочинності. Було вивчено 1361 вбивство та розподілено їх за чотирма порами року. Результати виявились такими:

Пора року

Зима

Весна

Літо

Осінь

328

334

372

327

Чи можна, на основі цих даних, зробити висновок про наявність згаданої залежності?

Розглянемо гіпотезу про рівність частот вбивств у різні пори року (відсутність зв'язку між злочинністю та порою року). Гіпотетичні частоти всі однакові і дорівнюють 1361 : 4 = 340,25.

Використаємо модуль Nonparametric Statistics, процедуру Observed versus expected XІ Створимо два набори даних VAR1 – реальні частоти, VAR2 – гіпотетичні частоти. Вибравши у вікні Variables (Observed frequencies: 1, Expected frequencies 2), одержимо результат (після натискування потрібної кількості ОК).

Тому можемо зробити висновок, що гіпотеза про рівність частот вбивств залежно від пори року не суперечить наявним даним (з рівнем значущості меншим, ніж 0,25778). Отже, немає підстав стверджувати про залежність рівня злочинності від пори року.

Гіпотези про незалежність ознак.

Отримано відповіді 100 студентів перших трьох курсів на запитання: "Чи вважаєте Ви, що куріння заважає навчанню?"

Чи підтверджують ці дані припущення про те, що відношення до куріння у студентів різних курсів різне? Вибрати рівень значущості 0,01.

Для знаходження відповіді використаємо модуль Correspondence Analysis. Задамо таблицю даних, увівши частоти, отримані за результатами опитування:

Відповідь

Курс

1

2

3

Ні

15

10

0

Не знаю

8

5

7

Так

0

ЗО

25

Вибравши метод Correspondence Analysis, тип даних Frequencies w/out grouping vars, змінні Variables with frequencies: All, одержимо (після натискування ОК) результати перевірки гіпотези Но (відношення до куріння не залежить від курсу) та можливість отримати деякі додаткові результати. Результат (Total chi-square = 44,24; df = 4; р = 0,000) свідчить про те, що гіпотеза Но має бути відхилена.

Оцінка залежності дворівневих даних.

Під час епідемії грипу вивчався вплив щеплень проти цієї хвороби. Отримали такі результати:

Після щеплення

Без щеплення

Захворіли

4

34

Не захворіли

192

111

Чи вказують ці результати на ефективність щеплень?

Застосуємо процедуру 2×2 Tables XІ/VI/Phil, McNemar, Fisher exact модуля Nonparametric Statistics. Завантажимо пакет та виберемо відповідну процедуру. У вікні, що відкриється, введемо значення таблиці спряженості ознак. Натиснувши ОК, отримуємо результат.

Бачимо, що гіпотезу про відсутність впливу щеплень на рівень захворюваності потрібно відхилити.

Крім стандартного критерію χ2 Пірсона (Chi-square) і скоректованого χ2 (V-square), STATISTICA обчислює: χ2 з поправкою Йєтса (Yates corrected Chi-square) для випадку малих значень частот; статистику F'2 (F-square), що є мірою зв'язку між номінальними чи категіальними змінними, значення яких неможливо впорядкувати; рівні значущості одностороннього (one-tailed) та двостороннього (two-tailed) критерію Фішера (Fisher exact); значення та рівні значущості критерію χ2 Макнемара (McNemar Chi-square), який застосовують для дослідження залежних вибірок. Якщо сума частот невелика, то краще використовувати критерій Фішера замість χ2.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]