Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка_Статистический анализ данных.doc
Скачиваний:
7
Добавлен:
15.08.2019
Размер:
557.57 Кб
Скачать

2.2. Послідовність виконання роботи

Запуск модуля й відкриття файла з даними. Відкрийте файл даних і запустіть статистичний модуль Basic statistics &Tables (Основні статистики й таблиці).

Вибір процедури статистичного аналізу. Виберіть у запропонованому меню відповідний метод статистичного аналізу:

  • t-test for independent samples by groups (t-критерій для незалежних вибірок);

  • t-test for dependent samples (t-критерій для залежних вибірок);

  • Breakdown&one-way ANOVA (класифікація і однофакторний дисперсійний аналіз (однофакторна ANOVA)).

У стартовому вікні використовують режим «Один запис на випадок».

Параметр t-критерію для незалежних вибірок. Натисканням кнопки Variables (Змінні) відкрийте вікно вибору змінних. У лівому списку виберіть залежну змінну (можна вибрати декілька змінних), у правому – групувальну змінну, яка може набувати тільки двох значень.

У вікні, що з'явилося, можна задати коди (імена) для двох груп: у рядку Code for Group 1 (Код для групи 1) і в рядку Code for Group 2 (Код для групи 2). Перейдіть на вкладку Advanced, натисніть кнопку «Summary T-test». На екрані з'явиться таблиця результатів, рядки якої призначено для запису кожної аналізованої незалежної змінної. У стовпцях відображено таку інформацію: Mean – середні величини для кожної групи; t-value – значення t-критерію; df – кількість степенів вільності; p – рівень значущості критерію; Valid N – число спостережень у кожній групі; Std. Dev – середньоквадратичне відхилення в групах; F-ratio VariancesF-критерій; p variance – рівень значущості F-критерію.

Найважливіше в цій таблиці – рівень значущості p – мінімальний рівень, на якому можна спростувати гіпотезу (якщо його значення менше 0.05, то групувальна змінна є значущою).

Слід перевірити умови застосування критерію. Необхідно, щоб незалежні змінні в кожній групі мали нормальний розподіл і дисперсії в групах не дуже розрізнялися. Розходження дисперсій перевіряють F-критерієм. Його значення й рівень значущості наведено в одержаній таблиці результатів (10-й і 11-й стовпці). Тут рівень значущості «спростовує» гіпотезу про розходження дисперсій (має бути більше 0.05).

Для графічного зображення використовують діаграму розмаху (Box & whisker plot). Варто вибрати опцію Mean/SE/SD (Середнє/стандартна помилка/стандартне відхилення).

Параметр t-критерію для залежних вибірок. Натисканням кнопки Variables (Змінні) відкрийте вікно вибору змінних. У списку змінних задайте по одній змінній. Ці дві групи необхідно порівняти.

Перейдіть на вкладку Advanced. Натисніть кнопку «Summary T-test». На екрані з'явиться таблиця результатів. Строки таблиці призначено для запису кожної змінної, стовпці відображають таку інформацію: Mean – середні величини для кожної групи; t – значення t-критерію; df – кількість степенів вільності; p – рівень значущості критерію; N – число спостережень у кожній групі; Std. Dev – середньоквадратичне відхилення в групах.

У таблиці зверніть увагу на рівень значущості p – мінімальний рівень, на якому можна спростувати гіпотезу (якщо його значення менше 0.05,то розходження між групами є).

Слід перевірити умови застосування критерію. Необхідно, щоб незалежні змінні в кожній групі мали нормальний розподіл і дисперсії в групах не дуже розрізнялися. Різницю дисперсій перевіряють за таблицею результатів, використовуючи середньоквадратичні відхилення.

Для графічного зображення застосовують діаграму розмаху (Box & whisker plot). Слід вибрати опцію Mean/SE/SD (Середнє/стандартна помилка/стандартне відхилення).

Однофакторний дисперсійний аналіз. У стартовому вікні модуля «Основні статистики й таблиці» виділіть рядок Breakdown&one-way ANOVA (Класифікація і однофакторний дисперсійний аналіз (однофакторна ANOVA)) й натисніть кнопку «ОК». На екрані з'явиться вікно Statistics by Groups (breakdown)(Статистики для груп ).

Натисніть кнопку Variables (Змінні). На екрані з'явиться вікно вибору змінних. У рядках Grouping variables (Групувальні змінні) й Dependent variables (Залежні змінні) задають номери відповідних змінних. Групувальна змінна має набувати невеликої кількості значень. Якщо змінна безперервна, то її слід перекодувати. Натисніть кнопку «ОК».

У вікні, що з'явилося, зайдіть на вкладку ANOVA & tests. Натисніть кнопку Analysis of variance (Дисперсійний аналіз). На екрані з'явиться таблиця з однойменною назвою, у кожному рядку якої містяться результати для однієї незалежної змінної. У стовпцях цієї таблиці наведено таку інформацію: SSeffect – міжгрупова девіація; (k – 1) – число степенів вільності міжгрупової дисперсії; MSeffect – міжгрупова оцінна дисперсія; SSerror – внутрішньогрупова девіація; (n – k) – число степенів вільності внутрішньогрупової дисперсії; MSerror – внутрішньогрупова оцінна дисперсія; значення критерію Фішера; рівень значущості критерію.

Найважливіше в цій таблиці – рівень значущості, що має бути менше ніж 0.05.

Далі в основному вікні слід перейти на вкладку Post-hoc comparisons of means (Апостеріорні порівняння середніх). Необхідно вибрати одну змінну (краще ту, для якої існує розходження між групами або найменше значення рівня значущості). Далі слід вибрати критерій. У першому рядку – LSD test or planned comparisons (Критерій найменшої значущої різниці). Одержимо таблицю, у якій рядки – це групи, стовпці – значення вибраної змінної. На їх перетині розташовано значення критерію, кольором виділено значущі критерії. Вони означають, що саме ці значення в даній групі приводять до існування найбільших відмінностей.

Далі в основному вікні на вкладці Descriptives необхідно натиснути кнопку Summary tables of Statistics (Підсумкова таблиця середніх) і визначити, наскільки значними є розходження середніх значень.

Для графічного зображення натисніть кнопку Categorized histograms (Категоріальні гістограми) на вкладці Descriptives. Для кожного класу будують гістограму. Можна також використати категоріальну діаграму розмаху (Categorized Box & whisker plot). Рекомендується вибрати опцію Mean/SE/SD (Середнє/стандартна помилка/стандартне відхилення).