- •Міністерство освіти і науки україни
- •Розділ 1 Структура основних модулів statistica Елементи інтерфейсу користувача
- •1.1 Загальна структура системи
- •1.2 Структура основних модулів та їх характеристика
- •1.3. Перемикач модулів. Вибір статистичного модуля
- •1.4 Загальна структура головного вікна системи statistica
- •Розділ 2 Робота з даними
- •2.1 Створення, відкриття та збереження файлу даних
- •2.2 Додавання та видалення змінних та випадків
- •2.3 Встановлення специфікацій змінної
- •Розділ 3 Модуль Basic Statistics/Tables – Основні статистики/Таблиці
- •3.1 Обчислення описових статистик
- •3.2 Перевірка статистичної однорідності вибіркових сукупностей
- •3.2.1 Перевірка статистичної однорідності незалежних вибірок
- •3.2.2 Перевірка статистичної однорідності залежних вибірок
- •3.2.3 Побудова графіків типу “ящик з вусами”
- •Розділ 4 Модуль Nonparametric/Distribution – Непараметричні статистики/Розподіли
- •4.1 Перевірка гіпотез про закони розподілу випадкових величин
- •4.2 Побудова гістограми розподілу
- •Розділ 5 Модуль Multiple Regression – Множинна регресія
- •5.1 Розрахунок коефіцієнтів лінійної множинної регресії
- •5.2 Побудова та розрахунок коефіцієнтів нелінійних регресійних залежностей
- •5.3 Оцінка якості регресійних залежностей
- •5.3.1 Оцінка значущості рівняння та факторів регресії
- •5.3.2 Аналіз залишків
- •5.3.3 Розрахунок кореляційної матриці
- •5.4 Швидка побудова графіків парної регресії та їх інтерактивний аналіз за допомогою засобу “пензель”
- •Література
3.2 Перевірка статистичної однорідності вибіркових сукупностей
Для перевірки статистичної однорідності вибіркових сукупностей використовується тест Стьюдента (T-test). За допомогою цього тесту перевіряється статистична гіпотеза про суттєвість відмінностей між двома вибірковими сукупностями.
3.2.1 Перевірка статистичної однорідності незалежних вибірок
Для перевірки статистичної однорідності незалежних вибірок використовується статистична процедура T-test for independent samples – T-тест для незалежних вибірок. У цьому випадку досліджувані вибірки можуть мати різну кількість випадків. Виконання тесту виконується у такій послідовності:
1) для
реалізації процедури необхідно викликати
діалогове вікно статистичних процедур
модуля (рис. 3.1) та активізувати у ньому
пункт
.
Після натискання кнопкиОК
чи подвійного натискання миші на обраному
пункті на екрані з’явиться діалогове
вікно T-Test
for
Independent
Samples
(Groups)
–
Т-тест для незалежних вибірок (груп)
(рис. 3.6);

Рисунок 3.6 – Діалогове вікно Т-тесту для незалежних вибірок
2) у полі Input File – Вихідний файл зі списку вибрати необхідний варіант представлення вихідних даних. Від варіанту представлення вихідних даних залежить зовнішній вигляд діалогового вікна Т-тесту. Дані для аналізу у файлі даних можуть бути представлені двома способами:
|
|
|
Рисунок 3.8 – Представлення даних без групування |
|
|
|
Рисунок 3.7 – Використання групової змінної |
– Each variable contains the data for one group – Кожна змінна містить дані для однієї групи. В цьому випадку тест проводиться між вибірками, кожна з яких є окремою змінною. Наприклад, дані попереднього прикладу можуть бути представлені у вигляді окремих змінних (рис. 3.8). Таким чином, для кожної групи даних виділено окрему змінну. Зовнішній вигляд діалогового вікна Т-тесту в такому випадку наведений на рис. 3.9.
3) у
випадку використання змінної групування
натиснути кнопку
,
після чого у діалоговому вікніSelect
one
group
variable
and
the
dependent
variables
– Вибір однієї змінної групування та
залежних змінних
вказати необхідні змінні для аналізу
(рис. 3.10). Після цього у полях Code
for
Group
1 – Код для групи 1 та
Code
for
Group
2 – Код для групи 2 ввести
значення змінної групування для
досліджуваних вибірок (текстові значення
вводяться в лапках). Після виконання
цих дій діалогове вікно Т-тесту має
вигляд, подібний представленому на рис.
3.6;

Рисунок 3.9 – Діалогове вікно Т-тесту при
представленні даних без групування

Рисунок 3.10 – Вибір змінної групування та залежних змінних
4) у
випадку, коли змінна групування не
використовується слід натиснути кнопку
,
після чого у діалоговому вікніSelect
two
variables
lists
(lists
of
groups)
– Вибір двох списків змінних (списки
груп)
вибрати змінні у двох списках (рис.
3.11). При аналізі Т-тест буде проводитись
для кожної пари змінних з цих списків.
Після виконання цих дій діалогове вікно
Т-тесту має вигляд, подібний представленому
на рис. 3.9;

Рисунок 3.11 – Вибір змінних у списки для аналізу
без використання змінної групування
5) для
виконання обчислень натиснути кнопку
діалогового вікна Т-тесту. У випадку
використання змінної групування
результати обчислення виводяться у
електронну таблицю та мають вигляд,
подібний представленому на рис. 3.12. У
рядках цієї таблиці містяться досліджувані
змінні. У стовпчиках таблиці наведені
різні описувальні та розрахункові
статистики, такі яксередні
значення та стандартні відхилення для
груп даних,
розрахункове
значення критерію Стьюдента
(t-value),
кількість
ступенів волі
(df),
гранична
імовірність прийняття гіпотези про
однорідність вибірок
(p),
тощо;

Рисунок 3.12 – Результати Т-тесту при
використанні змінної групування
У випадку проведення Т-тесту без змінної групування електронна таблиця результатів розрахунку має вигляд, подібний наведеному на рис. 3.13. Назви рядків цієї таблиці містять імена пар змінних, для яких проведений тест.

Рисунок 3.13 – Результати Т-тесту без
використання змінної групування
6
Розбіжність
між вибірками вважається несуттєвою,
якщо розрахункове значення граничної
імовірності p
перевищує прийнятий для тесту рівень
значущості.
Рівень значущості – імовірність неправильного скасування гіпотези, коли вона є вірною, зазвичай приймається рівною 0.1 чи 0.05. По умовчанню у системі STATISTICA встановлений рівень значущості 0.05. Таким чином, при рівні значущості 0.05 для наведених прикладів можна вважати, що відмінність, наприклад, між вибірками Г_ПРОБІГ та К_ПРОБІГ є несуттєвою (0.242 > 0.05) та вибірки можна вважати однорідними, а між вибірками Г_ПРОБІГ та К_АВАРІЇ є суттєвою (0.00019 < 0.05) і вони не можуть вважатись однорідними.
При
порівнянні імовірностей слід
використовувати підказку системи
STATISTICA.
Якщо
відмінність між вибірками є значущою
(тобто, вибірки неоднорідні) система
підсвічує відповідний рядок червоним
кольором.
Для встановлення рівня значущості, що
відрізняється від прийнятого по умовчанню
при наявності на екрані вікна результатів
тесту використовують кнопку
,
розташовану під головним меню системи.
Натиснення на кнопку викликає появу
менюChange
alpha
level
(highlight)
– Змінити рівень значущості (підсвічування),
після вибору якого відкривається
діалогове вікно Alpha
Level
– Рівень значущості
(рис. 3.14). У цьому вікні можна вказати
необхідний рівень значущості, при якому
суттєві розбіжності будуть підсвічуватися.
![]()
Рисунок 3.14 – Діалогове вікно зміни рівня значущості


