Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
текст.doc
Скачиваний:
30
Добавлен:
14.02.2015
Размер:
3.33 Mб
Скачать

Раздел 3 методы статистической обработки данных

Методами статистической обработки материалов называют математические приемы, способы расчетов, с помощью которых количественные показатели, полученные в ходе эксперимента, можно приводить в систему, выявлять скрытые закономерности, доказывать достоверность данных. Речь идет о таких закономерностях статистического характера, которые существуют между изучаемыми в эксперименте переменными величинами.

Методы статистической обработки условно можно подразделить на две группы: первичной и вторичной обработки.

Первая группа включает приемы элементарной математической статистики: процентное отношение, выборочное среднее (среднее арифметическое), медиана, мода, среднее квадратичное отклонение, дисперсия и др.

Вычисление процентного отношения – это, как правило, первая процедура, которой подвергаются полученные количественные данные. Применение этой процедуры позволяет установить процентное отношение между испытуемыми, отнесенными к той или иной группе. Вычисляется по нижеприведенной формуле (1):

(1)

m1, m2, …mn

P = . 100

N

N – количество испытуемых в группе,

m1, m2, … mn – число испытуемых в той или иной выборке.

Выборочная средняя величина (средняя арифметическая) представляет собой среднюю оценку измеряемого в эксперименте качества в целом у группы. Может подсчитываться средний балл за выполнение задания или среднее значение конкретных показателей (например, число воспроизведенных в опыте слов на запоминание). Сравнивая средние значения двух или нескольких выборок, можно судить об относительной степени развития оцениваемого качества в группах. Эта величина вычисляется, как правило, с точностью, превышающей 0,1 (одну десятую) и определяется по формуле (2):

(2)

x

M =

N

x – частные значения,

N – общее число значений.

Подсчитаем среднее выборочное для нижеприведенных цифровых значений.

В выборке дошкольников, состоящей из 10 испытуемых, при проведении методики «Запомни рисунки» продуктивность запоминания каждого ребенка оказалась таковой:

Таблица 4 – Данные о продуктивности запоминания испытуемых

Номер испытуемого

1

2

3

4

5

6

7

8

9

10

Количество рисунков (x)

7

5

11

14

10

10

12

15

13

9

М = (7+5+11+14+10+10+12+15+13+9) / 10 = 10,6

Медиана – это значение изучаемого признака, которое делит выборку, упорядоченную по величине данного признака, пополам. Справа и слева от медианы в упорядоченном ряду остается по одинаковому количеству признаков. Например, для выборки 2, 3, 4, 4, 5, 6, 7, 8, 9 медианой будет значение 5, так как слева и справа от него остается по четыре показателя. Если ряд включает в себя четное число признаков, то медианой будет среднее, взятое как полусумма величин двух центральных признаков ряда.

Упорядочим ряд цифровых данных нашей выборки.

5, 7, 9, 10, 10, 11, 12, 13, 14, 15.

Для этого ряда медиана будет равна 10,5.

Медиана необходима для того, чтобы установить, является ли распределение частных значений изученного признака симметричным и приближенным к так называемому нормальному распределению. Средняя и медиана при нормальном распределении обычно совпадают или очень мало отличаются друг от друга.

Мода – еще одна элементарная математическая характеристика распределения эмпирических данных. Модой называют количественное значение признака, наиболее часто встречающееся в выборке. В нашем случае это число 10, так как оно встречается чаще других значений (два раза). Для симметричных распределений признаков, в том числе для нормального, значение моды совпадает со значениями среднего и медианы. Для других типов распределений это не характерно.

Если в книге по математической статистике указано, что тот или иной метод обработки данных можно применять только при условии нормального или близкого к нему распределения, то необходимо неукоснительно следовать этому правилу и полученное эмпирическое распределение признаков проверять на нормальность. Если такого указания нет, то статистические приемы применимы к любому распределению признаков.

Но значение указанных величин еще недостаточно для полной статистической характеристики данных. Нужно знать, в какой степени единичные показатели отклоняются от средней арифметической. С этой целью вычисляется среднее квадратическое отклонение.

Алгоритм действий в этом случае таков.

1. Из каждого значения x вычитают значение средней, получают величину отклонений d (3):

(3)

d = xM

xчастное значение,

Mвыборочная средняя величина.

2. Возводят величины отклонений от индивидуальных показателей в квадрат (d²). Это делается потому, что если вычислять среднее отклонение на этом этапе, то сумма всех значений окажется равной нулю, поскольку одни отклонения положительны, а другие – отрицательны, что делает бессмысленными последующие расчеты.

3. Далее суммируют квадраты отклонений (d² ).

4. Полученную сумму делят на число показателей (N), получают величину σ², которая называется дисперсией (4).

(4)

d²

σ² =

N

d – отклонение от средней выборочной,

N число показателей.

5. Из дисперсии извлекают квадратный корень – это и есть среднее квадратическое отклонение (5).

(5)

σ= √ σ²

Вычислим среднее квадратическое для нашего ряда (таблица 5).

Таблица 5 – Данные частных значений и частных отклонений от среднего арифметического

х

d

d²

5

7

9

10

10

11

12

13

14

15

– 5,6

– 3,6

– 1,6

– 0,6

– 0,6

+ 0,4

+ 1,4

+ 2,4

+ 3,4

+ 4,4

31,36

12,96

2,56

0,36

0,36

0,16

1,96

5,76

11,56

19,36

М=10,6

∑ d=0

d²=86,4

σ²=8,64

σ=2,94

Среднее квадратическое отклонение показывает, насколько велики единичные отклонения от среднего арифметического по группе. Это позволяет сделать вывод о величине разброса индивидуальных показателей: чем выше эта величина, тем в большей степени отклоняются индивидуальные результаты от среднего по выборке, и наоборот, чем ниже σ, тем ближе индивидуальные результаты к среднему показателю.

В том случае, если число исходных частных данных довольно большое, для сокращения числа проводимых математических операций иногда прибегают к замене исходной частной выборки на интервалы. Интервалом называется группа упорядоченных по величине значений признака, заменяемая в процессе расчетов средним.

Пример (из книги Р.С.Немова). Представим ряд частных признаков: 0, 1, 1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 11, 11, 11. Этот ряд включает в себя 30 значений. Разобьем представленный ряд на шесть подгрупп по пять признаков в каждом. Первая подгруппа включит в себя первые пять цифр, вторая – следующие пять и т.д. Вычислим средние значения для каждой из пяти образованных подгрупп чисел, они, соответственно, будут равны 1,2; 3,4; 5,2; 6,8; 8,6; 10,6. Таким образом, удалось свести исходный ряд с 30-ю значениями к ряду, содержащему всего 6 значений и представленному средними величинами. Это и будет интервальный ряд, а проведенная процедура – разделением исходного ряда на интервалы. Теперь все статистические расчеты можно производить не с исходным рядом признаков, а с полученным интервальным рядом, но результаты будут иметь отношение и к исходному ряду. Однако число совершаемых математических операций будет гораздо меньше и процесс расчетов облегчится.

С помощью методов вторичной статистической обработки экспериментальных данных непосредственно проверяются, доказываются или опровергаются выдвинутые в эксперименте гипотезы.

В настоящем пособии мы рассмотрим лишь те методы, которые наиболее целесообразны для использования в студенческих исследовательских работах.

Критерий Стьюдента (t-критерий). Применяется в тех случаях, когда необходимо установить достоверность различий между выборками, количественными данными и др. Вычисляется по формуле (6):

(6)

M2M1

t =

m1² + m2²

М1 и М2 средние значения,

m1 и m2показатели отклонений частных значений из двух сравниваемых выборок от соответствующих им средних величин;

N число частных показателей.

Значения m1 и m2 в свою очередь вычисляются по следующей формуле (7):

(7)

σ²

m² =

N

σ – дисперсия,

Nчисло частных показателей.

Обратимся к конкретному примеру.

В методике «Запомни рисунки» в двух выборках дошкольников 5-6 лет были получены результаты, приведенные в таблице 6.

Таблица 6 – Данные о продуктивности запоминания испытуемыми предъявленной информации

Выборка

Индивидуальные результаты

первая

Номер испытуемого

1

2

3

4

5

6

7

8

9

10

Количество рисунков

7

5

10

14

11

10

12

15

13

9

вторая

Номер испытуемого

1

2

3

4

5

6

7

8

9

10

Количество рисунков

9

10

11

9

12

11

8

13

12

9

Алгоритм расчетов по критерию Стьюдента таков:

1) занести в таблицу частные значения x;

2) определить среднее арифметическое (М);

3) просчитать величины отклонений d от среднего арифметического (d = x –M);

4) возвести в квадрат полученные значения d (d²);

5) просуммировать квадраты отклонений (∑d²);

6) вычислить дисперсию (σ²), разделив сумму квадратов на число испытуемых (N);

7) подсчитать величины значений m1 и m2 по формуле (8)

(8)

σ²

m² =

N

8) подставить все цифровые значения в основную формулу.

9) сопоставить полученное эмпирическое значение t-критерия с критическим значением, представленным в таблице. Если первое превышает или по крайней мере равно критическому значению на определенном уровне значимости (p ≤ 0,05, p ≤ 0,01 или p ≤ 0,001), то можно утверждать, что между исследуемыми выборками имеются существенные различия. Соответственно, если полученный результат меньше табличного, то предположение о наличии значимых различий не подтверждается.

Итак, занесем все данные в таблицу 7 и произведем необходимые расчеты согласно представленному алгоритму.

Таблица 7 – Таблица расчетов по критерию Стьюдента

x1

d1

d12

x2

d2

d22

7

5

10

14

11

10

12

15

13

9

-3,6

-5,8

-0,6

+3,4

+0,4

-0,6

+1,4

+4,4

+2,4

-1,6

12,96

31,36

0,36

11,56

0,16

0,36

1,96

19,36

5,76

2,56

9

10

11

9

12

11

8

13

12

9

-1,4

-0,4

+0,6

-1,4

+1,6

+0,6

-2,4

+2,6

+1,6

-1,4

1,96

0,16

0,36

1,96

2,56

0,36

5,76

6,76

2,56

1,96

М1=10,6

d1=0

d12=86,4

М2=10,4

d2=0

d22=24,4

σ1²=8,66

m1²=0,866

σ 2²=2,44

m2²=0,244

Подставим все цифровые значения в основную формулу.

M2–M1 10,4 – 10,6 0,2

t == = =0,19

√m1²+ m2²√ 0,866 + 0,244 1,054

Итак, мы получили число t, равное 0,19. Полученный результат сопоставим с табличными данными (Приложение Е). Просматривается результат для вероятностной ошибки в 0,05; 0,01 или 0,001, что означает вероятность допустимой ошибки в 5%, 1% или 0,1%. Отыскиваем в таблице значение для числа 18 (число степеней свободы К = N + N – 2). Для данного числа степеней свободы критические значения t-критерия Стьюдента при различных уровнях значимости р являются таковыми.

2,10 для р ≤ 0,05

tкр 2,88 для р ≤ 0,01

3,92 для р ≤ 0,001

Полученное нами значение, равное 0,19, ниже критического табличного, из чего следует вывод, что различия между средними показателями статистически недостоверны.

В исследовании, предполагающем целенаправленное воздействие на определенную сторону психики субъекта (формирующий, обучающий эксперимент), появляется необходимость установить общее направление сдвига исследуемого признака – положительного или отрицательного. С этой целью используется критерий знаков G. Он позволяет выявить, в какую сторону изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения или, наоборот, в сторону ухудшения. При этом можно определять направление сдвига и по отдельным показателям изучаемого признака, и по сумме показателей в целом.

Определим типичность сдвига, ориентируясь на данные, приведенные в примере.

В исследовании произвольного запоминания у детей по методике «Выучи слова» детям предлагалось запомнить 12 слов, при этом давалось пять попыток. Результаты по двум замерам приведены в таблице 8.

Таблица 8 – Количество воспроизведенных слов до и после эксперимента

п/п

Количество воспроизведенных слов и оценка сдвига по попыткам

1-я

2-я

3-я

4-я

5-я

до

после

сдвиг

до

после

сдвиг

до

после

сдвиг

до

после

сдвиг

до

после

сдвиг

1

3

4

+1

3

3

0

5

4

1

4

4

0

4

8

+4

2

7

7

0

8

8

0

7

9

+2

9

10

+1

8

10

+2

3

3

6

+3

4

7

+3

5

6

+1

4

7

+3

4

8

+4

4

7

8

+1

9

10

+1

8

9

+1

10

11

+1

10

11

+1

5

5

7

+2

5

7

+2

6

9

+3

7

8

+1

7

9

+2

6

5

6

+1

5

8

+3

6

9

+3

7

9

+2

8

10

+2

7

6

6

0

7

7

0

8

8

0

8

9

+1

9

9

0

8

4

6

+2

5

7

+2

6

7

+1

5

8

+3

3

8

+5

9

4

6

+2

5

7

+2

5

7

+2

5

9

+4

5

8

+3

10

5

8

+3

6

9

+3

6

9

+3

7

9

+2

6

10

+4

Алгоритм расчета критерия знаков G

  1. Подсчитать количество нулевых сдвигов и исключить их из рассмотрения. В результате общее количество (n) уменьшится на количество нулевых сдвигов. При этом количество сопоставляемых пар (положительных и отрицательных сдвигов) в сумме должно быть не менее 5, в противном случае критерий неприменим.

  2. Определить преобладающее направление изменений. Считать сдвиги в преобладающем направлении «типичными».

  3. Определить количество «нетипичных» сдвигов. Считать это число эмпирическим значением G (Gэмп).

  4. По специальной таблице определить критическое значение G (Gкр) для данного n.

  5. Сопоставить Gэмп и Gкр. Если Gэмп меньше Gкр или как минимум равно ему, сдвиг в типичную сторону можно считать достоверным.

Если в эксперименте участвуют две группы (экспериментальная и контрольная), расчеты следует производить по каждой из них.

Итак, обратимся к нашему примеру. Подсчитаем сначала количество положительных, отрицательных и нулевых сдвигов в попытках (при этом нужно помнить, что учитывается только направление сдвига, но не его величина). Отбросив нулевые сдвиги, подсчитаем общее количество сдвигов (n) по попыткам и в целом (таблица 9).

Таблица 9 – Расчет количества положительных, отрицательных и нулевых сдвигов в группе испытуемых по каждой попытке

Количество сдвигов

Попытки

Всего

1-я

2-я

3-я

4-я

5-я

положительных

8

7

8

9

9

41

отрицательных

1

1

нулевых

2

3

1

1

1

8

n

8

7

9

9

9

42

Из данных таблицы мы видим, что наиболее типичны положительные сдвиги, нетипичным являет отрицательный – его мы обозначим как Gэмп.

Теперь сопоставим эмпирические значения критерия знаков с критическими (Приложение Ж). В таблице 10 находим критические значения G-критерия для соответствующего числа n.

Таблица 10 – Фрагмент таблицы критических значений критерия знаков G для уровней статистической значимости p ≤ 0,05 и p ≤ 0,01

n

p

0,05

0,01

5

0

6

0

7

0

0

8

1

0

9

1

0

42

15

13

Теперь внесем данные, выделенные цветом, в нижеприведенную таблицу (такую таблицу желательно приводить в приложениях).

Таблица 11 – Сопоставление значений Gэмп и Gкр по попыткам и по обследованию в целом

Попытка

Количество сдвигов

Gэмп

Gкр

«+»

«–»

общее, n

0,05

0,01

1-я

8

0

8

0

1

0

2-я

7

0

7

0

0

0

3-я

8

1

9

1

1

0

4-я

9

0

9

0

1

0

5-я

9

0

9

0

1

0

Итого

41

1

42

1

15

13

Итак, лишь в третьей попытке эмпирическое значение G-критерия равно критическому на уровне p ≤ 0,05, следовательно, в этом случае достоверность положительного сдвига оценивается на данном уровне значимости. Во всех остальных попытках и по обследованию в целом мы можем утверждать, что типичность положительного сдвига фиксируется на более высоком уровне статистической достоверности – при вероятности допустимой ошибки в 0,01% (p ≤ 0,01).

При сопоставлении результатов экспериментальной и контрольной групп может оказаться, что сдвиг типичен в обеих группах. При таком варианте в целях проверки достоверности сдвига следует воспользоваться критериями для сравнения двух независимых выборок – Q–критерия Розенбаума, U–критерия Манна-Уитни и критерия φ* Фишера. С алгоритмом расчетов по этим критериям можно ознакомиться в специальной литературе по математической статистике.

В тех случаях, когда количество положительных и отрицательных сдвигов равно, критерий знаков G не применим. В этом случае делается вывод о том, что установить типичность сдвига невозможно, следовательно, сдвиг является случайным.

Если сдвиги варьируют в достаточно широком количественном диапазоне, лучше использовать критерий Т Вилкоксона, который считается более мощным в определении достоверности сдвига, чем критерий знаков. Этот критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Ценно то, что он позволяет установить не только направленность изменений, но и их интенсивность, т.е. выраженность. Критерий можно применить и в случае одинакового числа отрицательных и положительных сдвигов – это позволит установить, какой из них является более выраженным.

Алгоритм подсчета критерия Т Вилкоксона

  1. Составить список испытуемых в любом порядке, например, алфавитном.

  2. Вычислить разность между индивидуальными значениями в первом и втором замерах (например, на исходном и итоговом этапе эксперимента). Определить, типичный сдвиг (типичным будет считаться сдвиг в более часто встречающемся направлении, нетипичным или редким – сдвиг в более редко встречающемся направлении). Нулевые сдвиги следует отбросить, соответственно, число n уменьшается на количество этих сдвигов.

  3. Перевести разности в абсолютные величины и записать их отдельным столбцом (иначе трудно будет отвлечься от знака разности).

  4. Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.

  5. Отметить кружками или другими знаками ранги, соответствующие сдвигам в «нетипичном» направлении.

  6. Подсчитать сумму этих рангов по формуле Т=∑ Rr, где Rr – ранговые значения сдвигов с более редким знаком.

  7. Определить критические значения Т для данного n по таблице. Если Тэмп меньше или равен Ткр, сдвиг в «типичную» сторону по интенсивности совпадает.

Итак, определим, является ли сдвиг положительным после проведения формирующего эксперимента.

Внесем полученные данные в таблицу 12.

Таблица 12 – Сопоставление результатов двух замеров по количеству воспроизведенных картинок

Код имени испытуемого

Количество воспроизведенных картинок

Разность

tдоtпосле

Абсолютное значение разности

до эксперимента (tдо)

после эксперимента

(tпосле)

1

Г.

13

16

+3

3

2

К.

10

10

0

0

3

Ин.

8

13

+5

5

4

Иг.

11

12

+1

1

5

М.

10

9

-1

1

6

Мих.

12

15

+3

3

7

Ал.

14

15

+1

1

8

Ан.

14

14

0

0

9

Кр.

15

14

-1

1

10

Е.

9

11

+2

2

11

Н.

10

8

-2

2

12

Ек.

12

16

+4

4

Определяя ранг, необходимо помнить, что в случае одинаковых количественных значений высчитывается среднее арифметическое занимаемых ими рангов, которое и проставляется как ранговое значение. Определим ранги для наших значений, имея в виду, что нулевые сдвиги отбрасываются (таблица 13, с. 57).

Таблица 13 – Ранжирование результатов тестирования

Абсолютное значение разности

Ранжированные значения

Ранг

Реальный ранг

(сумма рангов/кол-во)

3

1

1

2,5

5

1

2

2,5

1

1

3

2,5

1

1

4

2,5

3

2

5

5,5

1

2

6

5,5

1

3

7

7,5

2

3

8

7,5

2

4

9

9

4

5

10

10

Теперь проверим правильность ранжирования. Для этого применим формулу (9):

(9)

N х (N+1)

Сумма рангов = 1+2+3+…N =

2

Nколичество ранжируемых признаков.

В нашем случае число ранжируемых признаков N=10, поэтому сумма рангов, рассчитанных по формуле должна равняться

10 (10 + 1) 10 х 11

= = 55

2 2

Сложим величины рангов отдельно по столбцам «Ранг» (левый столбец) и «Реальный ранг» (правый столбец).

1+2+3+4+5+6+7+8+9+10= 55 – для левого столбца

2,5+2,5+2,5+2,5+5,5+5,5+7,5+7,5+9+10=55 для правого столбца

Суммы рангов и левой части и в правой совпали, значит, ранжирование произведено правильно. Подобную проверку необходимо проделывать после каждого ранжирования.

Теперь «нетипичные» сдвиги отметим каким-либо способом, в нашем случае мы выделили их в таблице 13 цветовым тоном (с. 57). Сумма этих рангов и составляет эмпирическое значение Т критерия (10):

(10)

Т = Σ Rr

Rr – ранговые значения сдвигов с более редким знаком (у нас отрицательным).

Итак, подставим ранговый номер разности в формулу:

Тэмп = 2,5 + 2,5 + 5,5 = 10,5.

Далее по таблице определяем критические значения Т для n=10 (Приложение К).

10 для р ≤ 0,05

Ткр

5 для р ≤ 0,01

Полученное эмпирическое значение Т–критерия больше критического. Следовательно, интенсивность положительного сдвига не превышает интенсивность отрицательного и положительный можно считать случайным. Это факт говорит против свидетельства о позитивном продвижении испытуемых в запоминании визуального материала (картинок) от одного замера к другому. Значит, полученные после эксперимента данные не могут быть доказательством эффективности проведенной работы.

Иногда возникает необходимость сравнения дисперсий двух выборок, чтобы выяснить, какая из двух программ или методик обучения (развития, формирования) обеспечивает одинаково успешное усвоение знаний (формирование какого-либо качества) у испытуемых с разными способностями. Доказательством справедливости гипотезы о том, что одна программа дает возможность позитивно влиять на испытуемых с разными способностями, а другая таким свойством не обладает, является индивидуальный разброс данных: в одной выборке он может быть меньше (больше), чем в другой. В этих случаях можно применить критерий Фишера (F) – формула (11).

(11)

σ1²

F (n1 - 1) (n2 - 1) = ,

σ2²

где n1 – количество значений признаков в первой выборке;

n2 – количество значений признаков во второй выборке;

σ1² – дисперсия в первой выборке;

σ2² – дисперсия во второй выборке.

При подсчете необходимо помнить следующее: если отношение выборочных дисперсий в формуле оказывается меньше единицы, то числитель и знаменатель в ней нужно поменять местами и вновь определить значение F-критерия.

Вычисленное с помощью этой формулы значение F-критерия сравнивается с табличным. Если оно превосходит табличное для избранной вероятности допустимой ошибки и заданного числа степеней свободы, то делается вывод о том, что гипотеза о различиях в дисперсиях подтверждается. В противоположном случае такая гипотеза отвергается и считается, что в дисперсиях нет существенной, статистически достоверной разницы.

Предположим, что необходимо сравнить два ряда значений (для облегчения расчетов возьмем уже имеющиеся у нас данные).

Таблица 14 – Данные о числе воспроизведенных рисунков

Частные значения

М

σ²

№ п/п

1

2

3

4

5

6

7

8

9

10

1-й ряд

7

5

10

14

11

10

12

15

13

9

10,6

8,66

2-й ряд

9

10

11

9

12

11

8

13

12

9

10,4

2,44

Средние значения для этих двух рядов соответственно равны 10,6 и 10,4. Их дисперсии составляют 8,66 и 2,44. Частное от деления большей дисперсии на меньшую равно 3,54. Это и есть искомый показатель F-критерия. Сравним его с табличным значением (Приложение Л). Для этого отыскиваем критическое значение критерия на уровне значимости р≤0,05 на пересечении двух чисел степеней свободы в числителе и знаменателе: n1 –1= 9 (10 – 1= 9) и n2 – 1= 9 (10 – 1= 9). Критическое значение критерия F Фишера в данном случае равно 3,18. Полученное нами значение выше критического, что дает основания для вывода о различиях в дисперсиях двух выборок с вероятностью допустимой ошибки не более 0,05. Более эффективными следует признать результаты в той выборке, где меньшая дисперсия, т.е. во второй выборке.

Критерий хи-квадрат (χ²) – это один из наиболее часто использующихся в психологических исследованиях статистических критериев, поскольку он позволяет решать большое число разных задач. Кроме того, исходные данные для него могут быть получены в любой шкале, начиная со шкалы наименований.

Чаще всего критерий используется в двух вариантах:

  • сравнение эмпирического распределения с теоретическим;

  • сравнение двух экспериментальных распределений.

Основная расчетная формула критерия хи-квадрат выглядит следующим образом (12):

(12)

ν ( fэf т)²

χ² = ∑ ,

k=1 f т

fэ – эмпирическая частота,

f т – теоретическая частота

k – количество разрядов признака

Рассмотрим первый случай – сравнение эмпирического распределения с теоретическим.

В эксперименте испытуемый должен произвести выбор левого или правого стола с заданиями. В инструкции психолог подчеркивает, что задания на обоих столах одинаковы. Из 150 испытуемых правый стол выбрали 98 человек, а левый – 52 человека. Можно ли утверждать, что подобный выбор левого или правого стола равновероятен или он обусловлен какой-либо причиной, неизвестной психологу.

Алгоритм расчетных действий таков.

1. Вычислить параметры теоретического распределения («идеального», равномерного) по формуле (13):

(13)

fт = n : k

nколичество наблюдений,

kколичество разрядов признака

В нашем случае признак – альтернативы выбора стола, количество наблюдений – число выборов, сделанных испытуемыми

fт = 150 : 2 = 75

2. Занести в таблицу наименования разрядов и соответствующие эмпирические частоты, рядом с эмпирическими величинами записать теоретические частоты.

1

2

3

4

5

6

Альтернативы выбора стола

fэ

f т

1 (правый)

98

75

2 (левый)

52

75

Сумма

150

150

3. Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать в столбец 4.

1

2

3

4

5

6

Альтернативы выбора стола

fэ

f т

fэ – f т

1 (правый)

98

75

23

2 (левый)

52

75

- 23

Сумма

150

150

0

Сумма разностей равна нулю. В дальнейших расчетах эта величина не используется, но ее обязательно каждый раз надо вычислять, так как ее равенство нулю гарантирует правильность расчетов на данном этапе.

4. Возвести в квадрат полученные разности и внести значения в столбец 5.

1

2

3

4

5

6

Альтернативы выбора стола

fэ

f т

fэ – f т

(fэ – f т)2

(fэ – f т)2

f т

1 (правый)

98

75

23

529

7,05

2 (левый)

52

75

- 23

529

7,05

Сумма

150

150

0

5. Разделить полученные квадраты разностей на теоретическую частоту и записать результаты в столбец 6.

1

2

3

4

5

6

Альтернативы выбора стола

fэ

f т

fэ – f т

(fэ – f т)

(fэ – f т)2

f т

1 (правый)

98

75

23

529

7,05

2 (левый)

52

75

- 23

529

7,05

Сумма

150

150

0

χ²эмп = 14,1

6. Просуммировать значения шестого столбца. Полученную сумму обозначить как χ²эмп и проставить значение в нижней строке таблицы.

7. Определить число степеней свободы по формуле (14):

(14)

v = k - 1

kколичество разрядов признака (количество строк в таблице)

8. Определить по таблице критические значения критерия для числа степеней свободы 1 (2–1=1). В нашем случае

3,841 для Р ≤ 0,05

χ²кр

6,635 для Р ≤ 0,01

Полученное эмпирическое значение больше критического на уровне допустимой ошибки в 1%. Следовательно, между теоретическим и эмпирическими распределениями имеются существенные различия. Это дает основания для вывода о том, что испытуемые значимо предпочитают выбор правого стола.

На практике значительно чаще бывают ситуации, когда необходимо сравнивать эмпирическое распределение не с теоретическим, а два эмпирических распределения между собой. В этом случае производится оценка однородности двух и более независимых выборок и таким образом проверяется гипотеза о наличии или отсутствии различий.

Второй случай применения χ²-критерия – сравнение двух эмпирических распределений.

В двух школах района выяснялась успешность знания алгебры учащимися десятых классов. Для этого в обеих школах случайным образом были отобраны 50 учащихся и сними проведены контрольные работы. проверялось предположение о том, что существенной разницы в знаниях алгебры учеников двух школ не существует.

Представим результаты выполнения контрольной работы в таблице 15.

Таблица 15 – Результаты выполнения контрольной работы

Школа

Оценка

Сумма

2

3

4

5

школа 1

О11= 3

О12= 19

О13= 18

О14= 10

50

школа 2

О21 = 9

О22 = 24

О23 = 12

О24 = 5

50

Сумма

О11 + О21= 12

О12 + О22= 43

О13 + О23= 30

О14 + О24= 15

100

Визуальный анализ показывает, что во второй школе висло «двоечников» в три раза больше, чем в первой, число отличников в два раза меньше. Но окончательные выводы можно делать только на основе статистической проверки.

Для подобных задач подсчет эмпирического значения хи-квадрат-критерия осуществляется по следующей формуле (15):

(15)

1 (n1 х O2i – n2 х O1i)2

χ²эмп = Х Σ

n1 х n2 O1i + O2i

Подставим данные нашего примера в формулу, получим:

1 (50 х9 – 50 х 3)2 (50 х 24 – 50 х 19)2

χ²эмп = х + +

50 х 50 3 + 9 19 + 24

(50 х 12 – 50 х 18)2 (50 х 5 – 50 х 10)2

++ =6,45

18 + 12 10 + 5

Число степеней свободы в данном случае подсчитывается иначе (16):

(16)

v = (k – 1) (с – 1),

kчисло строк,

с – число столбцов

Подсчитаем: (2-1) (4 – 1) = 3.

По таблице находим значения критерия:

7,815 для Р ≤ 0,05

χ²кр

11,345 для Р ≤ 0,01

Полученное значение меньше критического, следовательно, попадает в зону незначимости. Иными словами, следует признать, что уровень знания учащимися алгебры в двух разных школах статистически значимо не отличается.

Можно использовать хи-критерий и при проверке распределений, полученных до и после эксперимента. Если в значениях исходного среза нет нулевых величин, то можно воспользоваться первой формулой. Если же имеет место отсутствие данных на этапе до эксперимента, то лучше применить вторую (формула 15). Рассмотрим второй случай - сравнение замеров до и после эксперимента.

Допустим, что в результате проведения формирующей работы в экспериментальной группе в количестве 20 человек ситуация изменилась в позитивную сторону (данные взяты из выпускной квалификационной работы О.Н. Романовой и отражены в таблице 16). Дает ли это основание для утверждения о наличии различий между двумя замерами, следовательно, можно ли сделать вывод об успешности и эффективности реализованной программы психолого-педагогических мероприятий?

Таблица 16 – Сводная таблица результатов исследования познавательных интересов по итогам констатирующего и контрольного этапов эксперимента

в абсолютных величинах

Уровень

Этапы эксперимента

до

после

высокий

-

3

выше среднего

2

12

средний

11

5

ниже среднего

6

0

низкий

1

0

всего испытуемых

20

20

Действуем по следующему алгоритму.

  1. Составим таблицу.

Таблица 17 – Образец таблицы для расчета различий между двумя замерами

Срез

Уровень

Сум-ма

высокий

выше среднего

средний

ниже среднего

низкий

до экспер.

О11= 0

О12= 2

О13= 11

О14= 6

О15= 1

20

после эксп.

О21 = 3

О22= 12

О23 = 5

О24 = 0

О25 = 0

20

Сумма

О11 + О21= 3

О12 + О22= 14

О13 + О23= 16

О14 + О24= 6

О15 + О25= 1

40

2. Подставим значения в формулу:

1 (n1 х O2i – n2 х O1i)2

χ²эмп = х Σ

n1 х n2 O1i + O2i

1 (20 х 3 – 20 х 0)2 (20 х 12 – 40 х 2)2

χ²эмп = х + +

20 х 20 0 + 3 2 + 12

(20 х 5 – 20 х 11)2 (20 х 0 – 20 х 6)2 (20 х 0 – 20 х 1)2

++ + =16,821

11 + 5 6 + 0 1 + 0

3. Определим число степеней свободы, имея в виду, что kэто число строк, а с – количество столбцов:

v = (k – 1)(с – 1) = (2 – 1)(5 – 1) = 4

4. Сопоставим полученное значение с табличным критическим значением χ²– критерия для заданного числа степеней свободы (Приложение М)

9,488 для Р ≤ 0,05

χ²кр

13,277 для Р ≤ 0,01

Итак, полученное нами значение χ²эмп= 16,821 превышает критическое значение χ²– критерия при допустимости вероятной ошибки р ≤ 0,01. Следовательно, между показателями двух замеров имеются статистически значимые различия. На основе этих данных можно утверждать, что гипотеза о значимых изменениях, которые произошли в выборке в результате апробации формирующей программы, нашла экспериментальное подтверждение.

Методы вторичной статистической обработки весьма разнообразны. Приведенная ниже таблица поможет выбрать наиболее целесообразные из них (Таблица 18, с. 67).

Таблица 18 – Классификация задач и методов их решения (из книги Е.В.Сидоренко)

Задачи

Условия

Методы решения

1

Выявление различий в уровне исследуемого признака

А) 2 выборки испытуемых

Q – критерий Розенбаума

U – критерий Манна-Уитни

φ٭критерий (угловое преобразование Фишера)

Б) 3 и более выборок испытуемых

S – критерий тенденций Джонкира

G – критерий знаков

H – критерий Крускала-Уоллиса

2

Оценка сдвига значений исследуемого признака

А) 2 замера на одной и той же выборке испытуемых

T – критерий Вилкоксона

G – критерий знаков

φ٭критерий (угловое преобразование Фишера)

Б) 3 и более замеров на одной и той же выборке испытуемых

χr² – критерий Фридмана

L – критерий тенденций Пейджа

3

Выявление различий в распределении признака

А) при сравнении эмпирического распределения с теоретическим

χ² – критерий Пирсона

λ – критерий Колмогорова-Смирнова

m – биноминальный критерий

Б) при сопостав-лении двух эмпи-рических распре-делений

χ² – критерий Пирсона

λ – критерий Колмогорова-Смирнова

φ٭критерий (угловое преобразование Фишера)

4

Выявление степени согласованности изменений

А) двух признаков

rs – коэффициент ранговой корреляции Спирмена

Б) двух иерархий или профилей

rs – коэффициент ранговой корреляции Спирмена

5

Анализ изменений признака под влиянием контролируемых условий

А) под влиянием одного фактора

S – критерий тенденций Джонкира

L – критерий тенденций Пейджа

Однофакторный дисперсионный анализ Фишера

Б) под влиянием двух факторов одновременно

Двухфакторный дисперсионный анализ Фишера

Чтобы определить, какой метод следует использовать для статистической обработки полученных эмпирических данных, следует действовать в такой последовательности.

  1. по первому столбцу определить, какая из задач стоит в исследовании;

  2. по второму столбцу определить, каковы условия решения стоящей задачи, например, сколько выборок обследовано или на какое количество групп можно разделить обследованную выборку;

  3. обратиться к соответствующей специальной литературе, где дается описание необходимой статистической процедуры. При этом нужно убедиться в том, что полученные фактические данные отвечают обозначенным ограничениям к использованию выбранного статистического критерия.

Детальная информация о методах статистической обработки данных представлена в источниках, обозначенных в списке литературы.