- •Нечипоренко о. В. Математичні методи в психології
- •Розробники:
- •Рецензенти:
- •Лекція 1 проблема вимірювання в психології
- •Виміри та шкали
- •Лекція 2 основні статистичні поняття
- •Лекція 3 підготовка даних до математичної обробки
- •Графічне представлення результатів
- •Визначення квантилів
- •Лекція 4 міри центральної тенденції
- •Середнє арифметичне значення
- •Міри мінливості
- •Дисперсія
- •Середньоквадратичне (стандартне) відхилення
- •Коефіцієнт варіації
- •Перевірка статистичних гіпотез
- •Розподіл змінних величин
- •2. Характеристики форми розподілу
- •5.4. Типи ексцесу
- •3. Критерій хі-квадрат (χ2) Пірсона
- •Формулюються статичні гіпотези:
- •Підраховується загальна кількість виборів.
- •Складення таблиці для вирахування емпіричного значення χ2.
- •1. Формулюються статистичні гіпотези.
- •2. У таблиці підраховуються суми частот по рядках і по стовпцях.
- •4. Критерій Колмогорова – Смірнова (l)
- •Дослідження взаємозв’язку ознак Кореляція
- •Класифікації коефіцієнтів кореляції
- •Класифікація коефіцієнтів кореляції за силою
- •Класифікація коефіцієнтів кореляції за значимістю
- •Визначення значимості кореляції
- •Лінійна кореляція
- •Дихотомічний коефіцієнт кореляції (φ)
- •Коефіцієнт рангової кореляції Кендалла (тау Кендалла, t )
- •Точковий бісеріальний коефіцієнт кореляції (rpb)
- •Оцінка достовірності відмінностей Класифікація критеріїв
- •Непараметричний критерій q Розенбаума
- •Критерій φ⃰ - кутового перетворення Фішера
- •Біноміальний критерій m
- •Міри впливу Сутність проблеми
- •Оцінка достовірності зсуву в значеннях досліджуваної ознаки
- •Класифікація зсувів та критеріїв оцінки їх статистичної достовірності
- •Непараметричні міри впливу
- •Критерій χr2 Фрідмана
Дисперсія
Дисперсія
(S2)
як
статистична, величина характеризує,
наскільки окремі значення відхиляються
від середньої величини в даній вибірці
та є
сумою квадратів відхилень від середнього
(суму квадратів відстаней між xi
і
):
Для
значень 1; 9; 2
Такий показник як дисперсія використовується для оцінки точності проведення вимірювань. З двох аналогічних вимірювань більш точним вважається те, для результатів якого дисперсія матиме менше значення.
Дисперсія також є складовою різних процедур статистичної обробки результатів дослідження. Зокрема дисперсійного аналізу, кореляційного аналізу та ін..
Середньоквадратичне (стандартне) відхилення
Стандартне відхилення (Sх) – квадратний корінь з дисперсії. Поряд з дисперсією є однією з найбільш часто використовуваних заходів варіабельності ознаки.
Середнє квадратичне відхилення також є складовою в різних методиках статистичної обробки результатів дослідження.
Коефіцієнт варіації
Коефіцієнт варіації – (coefficient of variation) Показник мінливості щодо середньої величини.
Коефіцієнт
варіації дозволяє оцінити однорідність
виміряного явища. Якщо коефіцієнт
варіації ˃0,1
(V0,1),
то
виміряне явище визначають неоднорідним.
В іншому випадку – однорідним (V
).
Критеріальним
значенням квадратичного коефіцієнта
варіації V
служить 0,333 або 33,3%, тобто якщо V
менший або дорівнює 0,333 –
варіація вважається слабкою, а якщо
більше 0,333 –
сильною. У разі сильної варіації
досліджувана статистична сукупність
вважається неоднорідною, а середня
величина –
нетиповою і її не можна використовувати
як узагальнюючий показник цієї сукупності.
Перевірка статистичних гіпотез
Статистичні гіпотези поділяються на нульові й альтернативні.
Нульова гіпотеза є припущенням, про відсутність відмінностей у значеннях ознак, які зіставляють. Її позначають як Н0.
Альтернативна гіпотеза – це припущення про існування відмінностей. Її позначають як Н1.
Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростування гіпотези. Статистичні критерії поділяються на параметричні й непараметричні. До формули розрахунку параметричних критеріїв належать показники розподілу, наприклад середні, дисперсії. Це класичні критерії, як z – критерій, t – критерій Стьюдента, F – критерій Фішера.
t-критерій Стьюдента. Це один з найбільш відомих параметричних критеріїв, який застосовується для визначення того, чи відносяться дві вибірки до однієї генеральної сукупності чи ні, або, по-іншому, для встановлення того, наскільки сильно відрізняються середні і дисперсії двох розподілів:
Особливості його наступні:
Може бути використаний для встановлення відмінностей між двома вибірками в рівні досліджуваної ознаки, оскільки в його формулу обов'язково входить різниця середніх арифметичних двох вибірок;
Чим більше різниця між середніми арифметичними двох вибірок, тим більше буде емпіричне значення t-критерия і тим більше вірогідне виявлення відмінностей;
Критерій дозволяє сформулювати направлені гіпотези;
Змінні повинні бути зміряні в шкалах інтервалів або відносин і, принаймні, теоретично, схильні до нормального розподілу;
Вибірки можуть бути скільки завгодно великими.
|
X |
Y |
|
|
|
97 |
99 |
25 |
1 |
|
103 |
98 |
1 |
0 |
|
92 |
98 |
100 |
0 |
|
101 |
97 |
1 |
1 |
|
105 |
100 |
9 |
4 |
|
106 |
95 |
16 |
9 |
|
99 |
99 |
9 |
1 |
|
94 |
98 |
64 |
0 |
|
93 |
98 |
81 |
0 |
|
109 |
|
49 |
|
|
110 |
|
64 |
|
|
115 |
|
169 |
|
Середні |
102 |
98 |
|
|
Суми |
|
|
588 |
16 |
Порівнюємо
отримані в експерименті значення t
з табличним значенням з урахуванням
ступенів свободи, рівних за формулою
.
Ступені свободи – це кількість можливих напрямків мінливості деякої змінної. Загальноприйнятим позначенням числа ступенів свободи є df (від англ.. – degrees of freedom). У таблицях критичних значень наводяться або показники об’єму вибірки, або показники ступенів свободи. Cтупінь свободи (позначається як df або ν) – це величина, залежна від об’єму вибірки. Якщо ми не визначили ступінь свободи, то ми не зможемо користуватися статистичними таблицями. число ступенів свободи – це число даних з вибірки, значення яких можуть бути випадковими.
Якщо у нас є дві незалежні вибірки, то число ступенів свободи для першої з них складає n1 – 1, а для другої – n2–1. Таким чином, число ступенів свободи для цих незалежних вибірок становитиме (n1 + n2) – 2.
У разі залежних вибірок число ступенів свободи дорівнює n–1.
t0.05
= 2.09, t0.01
= 2.86
Якщо tемп ≥ tкр, то робиться висновок про те, що отримані результати є статистично значимими (не випадковими) лише такі результати підтверджують експериментальну або альтернативну гіпотези.
Якщо tемп ≤ tкр, то робиться висновок про статистичну незначимість експериментальних результатів. Такі результати не можуть підтвердити експериментальну або альтернативну гіпотези, вони вважаються отриманими випадково.
Висновок: розподіли X і Y статистично не відрізняються (або, по-іншому, вибірки відносяться до однієї генеральної сукупності), оскільки tемп < t0.05.
Коли ми маємо справу з двома нормальними розподілами, що відрізняються один від одного за середнім значенням і дисперсією, застосовується спрощена формула наближених розрахунків:
Де
і
– середні арифметичні для результатів
отриманих при першому і другому значеннях
незалежної змінної.
і
– це дисперсії.
і
– кількість результатів, отриманих при
x
та y
відповідно значеннях незалежної змінної.
F-критерій Фішера. Параметричний критерій, що дозволяє оцінити відмінності в розподілі ознаки в двох вибірках, що мають однакові середні значення (тобто в тих випадках, коли t - критерій Стьюдента непридатний):
,
при цьому в чисельнику завжди повинна бути більша дисперсія, а в знаменнику менша.
Як достоїнства, так і недоліки у нього ті ж, що і у t-критерия Стьюдента, але він виявляється непридатний для випадків, коли середні двох вибірок різні, оскільки отриманий висновок буде артефактом.
|
X |
Y |
|
|
|
|
|
100 |
99 |
0 |
-1 |
0 |
1 |
|
101 |
102 |
1 |
2 |
1 |
4 |
|
103 |
110 |
3 |
10 |
9 |
100 |
|
98 |
96 |
-2 |
-4 |
4 |
16 |
|
97 |
97 |
-3 |
-3 |
9 |
9 |
|
98 |
101 |
-2 |
1 |
4 |
1 |
|
102 |
100 |
2 |
0 |
4 |
0 |
|
101 |
96 |
1 |
-4 |
1 |
16 |
|
99 |
99 |
-1 |
-1 |
1 |
1 |
|
101 |
|
1 |
|
1 |
|
Середні |
100 |
100 |
|
|
|
|
Суми |
|
|
|
|
34 |
148 |
F0.05
= 3.23, F0.01
= 5.47
df1 – n-1=9-1=8
df2 – n-1=10-1=9
Ступені свободи для більшої дисперсії розміщені по горизонталі, а для меншої ступені свободи розміщені по вертикалі.
Висновок: відмінності між двома розподілами статистично достовірні на 5% рівні значущості, оскільки Fемп > F0.05, але недостовірні на 1% рівні, оскільки Fемп < F0.01
Лекція 5-6
