
- •3. Обработка эмпирических данных
- •Понятие о выборке и шкалах измерения Генеральная и выборочная совокупности
- •3.2. Статистические таблицы
- •Распределение (2х2)
- •3.3. Средние величины
- •3. 4. Понятие корреляции
- •3.5. Т-критерий Вилкоксона
- •Результаты методики Филлипса до и после проведения коррекционной работы
- •3.6. Факторный анализ
- •Корреляционная матрица
Распределение (2х2)
В
отличие от распределения (1х2), где
рассматривался только один признак, в
распределении (2х2) их два. Пусть в качестве
данных признаков используются А
и В.
Они принадлежат одному элементу измерения
и выступают в виде комбинаций:
т.е. каждый элемент измерения определяется
одной из приведенных комбинаций. Каждая
комбинация — число элементов измерения
(эмпирическая частота встречаемого
свойства) — должна отвечать условиям:
. (3.4)
Если условия (4) не выполняются, необходимо изменить значения признаков А и В.
Таблица распределения (2х2) имеет вид:
Таблица 3. 3
|
|
|
|
|
|
|
|
|
Сумма всех эмпирических частот a, b, c, и d должна быть не меньше 30 (т.е. не меньше нижней границы средней выборки, см. раздел 3.1, стр. 28).
Для
расчета
предварительно проверяется требование
Юла и Кендалла, относящееся к теоретическим
таблицам распределения.
Требование
Юла и Кендалла:
каждая теоретическая частота в клетках
таблицы должна быть не меньше 5. Тогда
требование Юла и Кендалла для эмпирической
частоты
запишется как
, (3.
5)
для
частоты
:
,(3.6)
для
частоты
:
,(3.
7)
для
частоты
:
,(3.
8)
где
и
теоретические частоты распределения.
Если
требование Юла и Кендалла выполняется
для каждой теоретической частоты, т.е.
то можно переходить к построению
теоретической таблицы распределения
и расчету
.
Таблица распределения теоретических частот для распределения (2х2) имеет вид:
Таблица 3. 4
|
|
|
|
|
|
|
|
|
Формула
для вычисления
:
. (3.
9)
Статистическая
значимость различия устанавливается
путем сравнения
с меньшим значением
и установления уровня значимостир
по
таблице:
Таблица 3. 5
|
2.71 |
3.84 |
5.41 |
6.64 |
10.83 |
p(%) |
10 |
5 |
2 |
1 |
0.1 |
Статистическое различие считается достоверным, если уровень значимости р≤0,05; если р=0,1, то говорят о наличии тенденции к статистической значимости, и если р>0,1, то статистическое различие (статистическая значимость) не имеет места.
На
основе
-критерия
для распределения (2х2) устанавливается
связь между рассматриваемыми признакамиА
и B,
которая относится к столбцам и строкам
матрицы. Величина связи определяется
с помощью коэффициента сопряженности
К
(Чупрова) по формуле:
,(3.
10)
где
Если
то
связь
между
изучаемыми признаками
слабая,
если
то
связь
умеренная,
и если
то
связь
сильная.
Примечание. Коэффициент сопряженности К (Чупрова) изменяется в пределах от 0 до 1 и содержит в себе информацию только о величине связи, а не о ее направлении.
Пример. Пусть признак А — конфликтность, тогда А1 — низкий уровень конфликтности и А2 — высокий уровень конфликтности. Пусть признак В — пол, тогда В1 — женский пол и В2 — мужской пол. Необходимо установить существует ли статистически значимая связь между признаками А и В. Воспользуемся расчетом ХИ‑квадрат критерия.
Предположим, что по результатам исследования для комбинаций признаков (А1+В1) имеем 30 испытуемых, т.е. эмпирическая частота а=30 (количество женщин с низким уровнем конфликтности); (А2+В1) — 10, т.е. эмпирическая частота в=10 (количество женщин с высоким уровнем конфликтности), (А1+В2) — 15, т.е. эмпирическая частота с=15 (количество мужчин с низким уровнем конфликтности), (А2+В2) — 25, т.е. эмпирическая частота d=25 (количество мужчин с высоким уровнем конфликтности). Учитывая полученные значения эмпирических частот, строим эмпирическую таблицу распределения:
-
А1
А2
В1
30
10
В2
15
25
Проверим выполнимость требования Юла и Кендалла, рассчитав каждую теоретическую частоту, и осуществим переход к теоретической таблице распределения. Получим:
,
,
,
.
Итак, требование Юла и Кендалла выполняется для каждой теоретической частоты, и таблица распределения теоретических частот будет иметь вид:
-
22,5
17,5
22,5
17,5
Далее
переходим к расчету
.
Получаем:
11,43.
Делаем
вывод о статистической значимости
полученного результата. Для этого
сравниваем рассчитанное значение
11,43
с меньшим значением
=10,83
и устанавливаем уровень значимости
р=0,001
(см. таблицу 3.5, стр. 34). Так как
11,43
=10,83,
то результат является статистически
значимым с уровнем значимости р=0,001.
Установим силу связи между изучаемыми признаками, рассчитав коэффициент сопряженности К (Чупрова) по формуле:
Так как значение К0,3 принадлежит промежутку 0,3; 0,5), то сила связи слабая.
Итак,
учитывая полученные результаты, можно
заключить, что изучаемые признаки
(конфликтность и пол) находятся в
статистически значимой зависимости
(11,43
и р=0,001).
Это также подтверждается значением
коэффициента сопряженности К
(Чупрова),
указывающем на силу связи между
признаками.
Распределение (2х3)
В отличие от распределений (1х2) и (2х2), где признаки представлены в номинальной шкале, в распределении (2х3) один из признаков представлен в порядковой шкале, где он принимает значения, имеющие смысл трех уровней (низкий, средний, высокий) или трех рангов (первый, второй, третий).
Таблица для распределения (2х3) имеет вид:
Таблица 3. 6
|
|
|
|
|
|
|
|
|
|
|
f |
Необходимо
обратить внимание на то, чтобы эмпирические
частоты
удовлетворяли следующим условиям:
,
(a+b+c+d+e+f)50. (3. 11)
Для
расчета
предварительно проверяется требование
Юла и Кендалла, относящееся к теоретическим
таблицам распределения.
Требование
Юла и Кендалла:
каждая теоретическая частота в клетках
таблицы должна быть не меньше 5 (т.е.
).
Тогда
теоретические
частоты, определяемые по формулам:
. (3.
12)
Формула
расчета
для распределения (2х3):
(3.
13)
где
теоретические
частоты, определяемые по формулам (3.
12).
Уровень
значимости р
определяется с помощью таблицы для
:
Таблица 3. 7
|
4.60 |
5.99 |
7.82 |
9.21 |
13.82 |
p (%) |
10 |
5 |
2 |
1 |
0.1 |
Для
рассчитанного значения
в таблице находятменьшее
,
устанавливают уровень значимостир
и делают вывод о статистической
значимости. Статистическое
различие
считается
достоверным,
если уровень значимости р≤0,05;
если
р=0,1,
то говорят о наличии
тенденции
к
статистической
значимости,
и если
р>0,1,
то статистическое
различие
(статистическая значимость)
не
имеет
места.
На основе ХИ-квадрат-критерия рассчитывается величина связи между рассматриваемыми признаками. Показатель величины связи – коэффициент сопряженности К (Чупрова), определяемый для распределения (2х3) по формуле:
, (3.
14)
где 0.84 – нормирующий коэффициент, позволяющий получить более точные значения связи при малых выборках,
.
Если
то
между изучаемыми признаками существует
слабая связь,
если
то
– связь
умеренная,
и если
то
– связь
сильная.