- •Міністерство освіти і науки україни
- •Розділ 1 Структура основних модулів statistica Елементи інтерфейсу користувача
- •1.1 Загальна структура системи
- •1.2 Структура основних модулів та їх характеристика
- •1.3. Перемикач модулів. Вибір статистичного модуля
- •1.4 Загальна структура головного вікна системи statistica
- •Розділ 2 Робота з даними
- •2.1 Створення, відкриття та збереження файлу даних
- •2.2 Додавання та видалення змінних та випадків
- •2.3 Встановлення специфікацій змінної
- •Розділ 3 Модуль Basic Statistics/Tables – Основні статистики/Таблиці
- •3.1 Обчислення описових статистик
- •3.2 Перевірка статистичної однорідності вибіркових сукупностей
- •3.2.1 Перевірка статистичної однорідності незалежних вибірок
- •3.2.2 Перевірка статистичної однорідності залежних вибірок
- •3.2.3 Побудова графіків типу “ящик з вусами”
- •Розділ 4 Модуль Nonparametric/Distribution – Непараметричні статистики/Розподіли
- •4.1 Перевірка гіпотез про закони розподілу випадкових величин
- •4.2 Побудова гістограми розподілу
- •Розділ 5 Модуль Multiple Regression – Множинна регресія
- •5.1 Розрахунок коефіцієнтів лінійної множинної регресії
- •5.2 Побудова та розрахунок коефіцієнтів нелінійних регресійних залежностей
- •5.3 Оцінка якості регресійних залежностей
- •5.3.1 Оцінка значущості рівняння та факторів регресії
- •5.3.2 Аналіз залишків
- •5.3.3 Розрахунок кореляційної матриці
- •5.4 Швидка побудова графіків парної регресії та їх інтерактивний аналіз за допомогою засобу “пензель”
- •Література
3.2 Перевірка статистичної однорідності вибіркових сукупностей
Для перевірки статистичної однорідності вибіркових сукупностей використовується тест Стьюдента (T-test). За допомогою цього тесту перевіряється статистична гіпотеза про суттєвість відмінностей між двома вибірковими сукупностями.
3.2.1 Перевірка статистичної однорідності незалежних вибірок
Для перевірки статистичної однорідності незалежних вибірок використовується статистична процедура T-test for independent samples – T-тест для незалежних вибірок. У цьому випадку досліджувані вибірки можуть мати різну кількість випадків. Виконання тесту виконується у такій послідовності:
1) для реалізації процедури необхідно викликати діалогове вікно статистичних процедур модуля (рис. 3.1) та активізувати у ньому пункт . Після натискання кнопкиОК чи подвійного натискання миші на обраному пункті на екрані з’явиться діалогове вікно T-Test for Independent Samples (Groups) – Т-тест для незалежних вибірок (груп) (рис. 3.6);
Рисунок 3.6 – Діалогове вікно Т-тесту для незалежних вибірок
2) у полі Input File – Вихідний файл зі списку вибрати необхідний варіант представлення вихідних даних. Від варіанту представлення вихідних даних залежить зовнішній вигляд діалогового вікна Т-тесту. Дані для аналізу у файлі даних можуть бути представлені двома способами:
|
Рисунок 3.8 – Представлення даних без групування |
|
Рисунок 3.7 – Використання групової змінної |
– Each variable contains the data for one group – Кожна змінна містить дані для однієї групи. В цьому випадку тест проводиться між вибірками, кожна з яких є окремою змінною. Наприклад, дані попереднього прикладу можуть бути представлені у вигляді окремих змінних (рис. 3.8). Таким чином, для кожної групи даних виділено окрему змінну. Зовнішній вигляд діалогового вікна Т-тесту в такому випадку наведений на рис. 3.9.
3) у випадку використання змінної групування натиснути кнопку , після чого у діалоговому вікніSelect one group variable and the dependent variables – Вибір однієї змінної групування та залежних змінних вказати необхідні змінні для аналізу (рис. 3.10). Після цього у полях Code for Group 1 – Код для групи 1 та Code for Group 2 – Код для групи 2 ввести значення змінної групування для досліджуваних вибірок (текстові значення вводяться в лапках). Після виконання цих дій діалогове вікно Т-тесту має вигляд, подібний представленому на рис. 3.6;
Рисунок 3.9 – Діалогове вікно Т-тесту при
представленні даних без групування
Рисунок 3.10 – Вибір змінної групування та залежних змінних
4) у випадку, коли змінна групування не використовується слід натиснути кнопку , після чого у діалоговому вікніSelect two variables lists (lists of groups) – Вибір двох списків змінних (списки груп) вибрати змінні у двох списках (рис. 3.11). При аналізі Т-тест буде проводитись для кожної пари змінних з цих списків. Після виконання цих дій діалогове вікно Т-тесту має вигляд, подібний представленому на рис. 3.9;
Рисунок 3.11 – Вибір змінних у списки для аналізу
без використання змінної групування
5) для виконання обчислень натиснути кнопку діалогового вікна Т-тесту. У випадку використання змінної групування результати обчислення виводяться у електронну таблицю та мають вигляд, подібний представленому на рис. 3.12. У рядках цієї таблиці містяться досліджувані змінні. У стовпчиках таблиці наведені різні описувальні та розрахункові статистики, такі яксередні значення та стандартні відхилення для груп даних, розрахункове значення критерію Стьюдента (t-value), кількість ступенів волі (df), гранична імовірність прийняття гіпотези про однорідність вибірок (p), тощо;
Рисунок 3.12 – Результати Т-тесту при
використанні змінної групування
У випадку проведення Т-тесту без змінної групування електронна таблиця результатів розрахунку має вигляд, подібний наведеному на рис. 3.13. Назви рядків цієї таблиці містять імена пар змінних, для яких проведений тест.
Рисунок 3.13 – Результати Т-тесту без
використання змінної групування
6
Розбіжність
між вибірками вважається несуттєвою,
якщо розрахункове значення граничної
імовірності p
перевищує прийнятий для тесту рівень
значущості.
Рівень значущості – імовірність неправильного скасування гіпотези, коли вона є вірною, зазвичай приймається рівною 0.1 чи 0.05. По умовчанню у системі STATISTICA встановлений рівень значущості 0.05. Таким чином, при рівні значущості 0.05 для наведених прикладів можна вважати, що відмінність, наприклад, між вибірками Г_ПРОБІГ та К_ПРОБІГ є несуттєвою (0.242 > 0.05) та вибірки можна вважати однорідними, а між вибірками Г_ПРОБІГ та К_АВАРІЇ є суттєвою (0.00019 < 0.05) і вони не можуть вважатись однорідними.
При порівнянні імовірностей слід використовувати підказку системи STATISTICA. Якщо відмінність між вибірками є значущою (тобто, вибірки неоднорідні) система підсвічує відповідний рядок червоним кольором. Для встановлення рівня значущості, що відрізняється від прийнятого по умовчанню при наявності на екрані вікна результатів тесту використовують кнопку , розташовану під головним меню системи. Натиснення на кнопку викликає появу менюChange alpha level (highlight) – Змінити рівень значущості (підсвічування), після вибору якого відкривається діалогове вікно Alpha Level – Рівень значущості (рис. 3.14). У цьому вікні можна вказати необхідний рівень значущості, при якому суттєві розбіжності будуть підсвічуватися.
Рисунок 3.14 – Діалогове вікно зміни рівня значущості