
- •Лабораторна робота № 1 робота з файлами вихідних даних. Обчислення основних статистик
- •Завдання:
- •1.1. Теоретичні відомості
- •1.2. Послідовність виконання роботи
- •1.3. Контрольні запитання
- •Лабораторна робота № 2 дослідження статистичної значущості розходжень у групах
- •2.1. Теоретичні відомості
- •2.2. Послідовність виконання роботи
- •2.3. Контрольні запитання Варіант 1. Дисперсійний аналіз
- •Варіант 2. Т-критерій для незалежних вибірок
- •Варіант 3. Т-критерій для залежних вибірок
- •Лабораторна робота № 3 дослідження статистичної залежності даних
- •3.1. Теоретичні відомості
- •3.2. Послідовність виконання роботи
- •3.3. Контрольні запитання Варіант 1. Кореляційний аналіз
- •Варіант 2. Комбінаційні таблиці
- •Лабораторна робота № 4 проведення регресійного аналізу Мета роботи: одержати навички побудови рівняння множинної залежності, освоїти виконання регресійного аналізу даних.
- •4.1. Теоретичні відомості
- •4.2. Послідовність виконання роботи
- •4.3. Контрольні запитання
- •Бібліографічний список
2.2. Послідовність виконання роботи
Запуск модуля й відкриття файла з даними. Відкрийте файл даних і запустіть статистичний модуль Basic statistics &Tables (Основні статистики й таблиці).
Вибір процедури статистичного аналізу. Виберіть у запропонованому меню відповідний метод статистичного аналізу:
t-test for independent samples by groups (t-критерій для незалежних вибірок);
t-test for dependent samples (t-критерій для залежних вибірок);
Breakdown&one-way ANOVA (класифікація і однофакторний дисперсійний аналіз (однофакторна ANOVA)).
У стартовому вікні використовують режим «Один запис на випадок».
Параметр t-критерію для незалежних вибірок. Натисканням кнопки Variables (Змінні) відкрийте вікно вибору змінних. У лівому списку виберіть залежну змінну (можна вибрати декілька змінних), у правому – групувальну змінну, яка може набувати тільки двох значень.
У вікні, що з'явилося, можна задати коди (імена) для двох груп: у рядку Code for Group 1 (Код для групи 1) і в рядку Code for Group 2 (Код для групи 2). Перейдіть на вкладку Advanced, натисніть кнопку «Summary T-test». На екрані з'явиться таблиця результатів, рядки якої призначено для запису кожної аналізованої незалежної змінної. У стовпцях відображено таку інформацію: Mean – середні величини для кожної групи; t-value – значення t-критерію; df – кількість степенів вільності; p – рівень значущості критерію; Valid N – число спостережень у кожній групі; Std. Dev – середньоквадратичне відхилення в групах; F-ratio Variances – F-критерій; p variance – рівень значущості F-критерію.
Найважливіше в цій таблиці – рівень значущості p – мінімальний рівень, на якому можна спростувати гіпотезу (якщо його значення менше 0.05, то групувальна змінна є значущою).
Слід перевірити умови застосування критерію. Необхідно, щоб незалежні змінні в кожній групі мали нормальний розподіл і дисперсії в групах не дуже розрізнялися. Розходження дисперсій перевіряють F-критерієм. Його значення й рівень значущості наведено в одержаній таблиці результатів (10-й і 11-й стовпці). Тут рівень значущості «спростовує» гіпотезу про розходження дисперсій (має бути більше 0.05).
Для графічного зображення використовують діаграму розмаху (Box & whisker plot). Варто вибрати опцію Mean/SE/SD (Середнє/стандартна помилка/стандартне відхилення).
Параметр t-критерію для залежних вибірок. Натисканням кнопки Variables (Змінні) відкрийте вікно вибору змінних. У списку змінних задайте по одній змінній. Ці дві групи необхідно порівняти.
Перейдіть на вкладку Advanced. Натисніть кнопку «Summary T-test». На екрані з'явиться таблиця результатів. Строки таблиці призначено для запису кожної змінної, стовпці відображають таку інформацію: Mean – середні величини для кожної групи; t – значення t-критерію; df – кількість степенів вільності; p – рівень значущості критерію; N – число спостережень у кожній групі; Std. Dev – середньоквадратичне відхилення в групах.
У таблиці зверніть увагу на рівень значущості p – мінімальний рівень, на якому можна спростувати гіпотезу (якщо його значення менше 0.05,то розходження між групами є).
Слід перевірити умови застосування критерію. Необхідно, щоб незалежні змінні в кожній групі мали нормальний розподіл і дисперсії в групах не дуже розрізнялися. Різницю дисперсій перевіряють за таблицею результатів, використовуючи середньоквадратичні відхилення.
Для графічного зображення застосовують діаграму розмаху (Box & whisker plot). Слід вибрати опцію Mean/SE/SD (Середнє/стандартна помилка/стандартне відхилення).
Однофакторний дисперсійний аналіз. У стартовому вікні модуля «Основні статистики й таблиці» виділіть рядок Breakdown&one-way ANOVA (Класифікація і однофакторний дисперсійний аналіз (однофакторна ANOVA)) й натисніть кнопку «ОК». На екрані з'явиться вікно Statistics by Groups (breakdown)(Статистики для груп ).
Натисніть кнопку Variables (Змінні). На екрані з'явиться вікно вибору змінних. У рядках Grouping variables (Групувальні змінні) й Dependent variables (Залежні змінні) задають номери відповідних змінних. Групувальна змінна має набувати невеликої кількості значень. Якщо змінна безперервна, то її слід перекодувати. Натисніть кнопку «ОК».
У вікні, що з'явилося, зайдіть на вкладку ANOVA & tests. Натисніть кнопку Analysis of variance (Дисперсійний аналіз). На екрані з'явиться таблиця з однойменною назвою, у кожному рядку якої містяться результати для однієї незалежної змінної. У стовпцях цієї таблиці наведено таку інформацію: SSeffect – міжгрупова девіація; (k – 1) – число степенів вільності міжгрупової дисперсії; MSeffect – міжгрупова оцінна дисперсія; SSerror – внутрішньогрупова девіація; (n – k) – число степенів вільності внутрішньогрупової дисперсії; MSerror – внутрішньогрупова оцінна дисперсія; значення критерію Фішера; рівень значущості критерію.
Найважливіше в цій таблиці – рівень значущості, що має бути менше ніж 0.05.
Далі в основному вікні слід перейти на вкладку Post-hoc comparisons of means (Апостеріорні порівняння середніх). Необхідно вибрати одну змінну (краще ту, для якої існує розходження між групами або найменше значення рівня значущості). Далі слід вибрати критерій. У першому рядку – LSD test or planned comparisons (Критерій найменшої значущої різниці). Одержимо таблицю, у якій рядки – це групи, стовпці – значення вибраної змінної. На їх перетині розташовано значення критерію, кольором виділено значущі критерії. Вони означають, що саме ці значення в даній групі приводять до існування найбільших відмінностей.
Далі в основному вікні на вкладці Descriptives необхідно натиснути кнопку Summary tables of Statistics (Підсумкова таблиця середніх) і визначити, наскільки значними є розходження середніх значень.
Для графічного зображення натисніть кнопку Categorized histograms (Категоріальні гістограми) на вкладці Descriptives. Для кожного класу будують гістограму. Можна також використати категоріальну діаграму розмаху (Categorized Box & whisker plot). Рекомендується вибрати опцію Mean/SE/SD (Середнє/стандартна помилка/стандартне відхилення).