Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие по ОНМД.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
742.4 Кб
Скачать

Определение коэффициента корреляции при оценке качественных признаков.

Если показатели измерены в шкале наименований (т.е. им можно присвоить определенные числа, но нельзя говорить, что один из них больше другого), то рассчитывать описанные ранее коэффициенты корреляции нельзя. В том случае, когда анализируется связь только между двумя качественными признаками (например, выполнение и невыполнение заданий, пол мужской и женский и др.) и когда каждый из них может иметь лишь два состояния (0 и 1, + и –, да и нет и др.), для исследования взаимосвязи пользуются тетрахорическим коэффициентом сопряженности (корреляции). Обозначается он как Т4 и вычисляется по формуле:

Т4 = ,

где: А – значение, которое соответствует числу испытуемых (попыток),

совпадающих по обоим показателям X и Y т. е. 1–1;

В – значение, которое соответствует числу совпадений 0 – X и 1 – Y;

С – значение, соответствующее числу совпадений 1 – X и 0 – Y;

D – значение совпадений 0 – X и 0 – Y; n – объем выбор­ки.

Рассмотрим пример. Группа испытуемых (10 человек) выполняла два разных по трудности двигательных задания. Выполнение фиксировалось как «1», невыполнение «0». Определим степень эквивалентности двух заданий. Для этого необходимо рассчитать тетрахорический коэффициент сопряженности. Данные представлены в таблице 4.

Таблица 4

Исходные данные для расчета тетрахорического коэффициента сопряженности

№ п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

X

1

1

0

1

1

0

1

0

0

1

1

0

1

1

0

Y

0

1

1

1

0

0

1

1

0

1

0

1

1

0

1

Чтобы вычислить коэффициент Т4, данные сгруппируем в четырехпольную корреляционную таблицу (табл. 5) и подсчитаем число совпадений соответственно для A, B, C, и D клеток.

Таблица 5

Расчет тетрахорического коэффициента сопряженности

Y

X

1

0

1

A = 5

B = 4

A+B 5+4=9

0

C = 4

D = 2

C+D 4+2=6

A+C 5+4=9

B+D 4+2=6

A+B+C+D 5+4+4+2=15

Подставим эти значения в формулу и рассчитаем тетрахорический коэффициент сопряженности:

Т4 = = = – = – = – 0,028

Коэффициент Т4 изменяется в пределах от –1 до +1. Следователь­но, значение Т4=0,028 характеризует несущественную отрицатель­ную взаимосвязь, т. е. два задания практически не эквивалентны.

  1. 4. Статистические гипотезы и достоверность статистических

характеристик

Часто при анализе какого-либо явления приходится по некоторым измерениям показателя делать обобщающий вывод. Например, после тренировочного занятия 10 бегунов у трех наблюдается неполное восстановление. Можно ли на этом основании судить о трудности тренировочного процесса или это случайность? Наверное, если такой неприятный факт случится со всеми 10 спортсме­нами, сомнений в неправильном построении занятия не будет. Следовательно, в данном случае можно говорить о представительности (репрезентативности) выборки, на основании которой можно сделать вывод. Этот же вопрос можно сформулировать иначе: сколько испытуемых необходимо обследовать, чтобы получить достоверные результаты измерений? Это очень важно для исследователя, так как является необходимостью научно решаемых задач. Эти вопросы и такие, как сравнение средних результатов различных групп, при проведении параллельного эксперимента с участием контрольной и экспериментальной групп, оценка результатов, полученных в начале и в конце эксперимента в одной и той же группе, решаются с использованием некоторых приемов проверки статистических гипотез. С этой целью рассчитывается достоверность различий.

Статистической гипотезой называется проверяемое математическими методами предположение относительно статистиче­ских характеристик результатов измерений.

При сравнении статистических характеристик почти никогда не встречается случая их абсолютного равенства. В силу каких-то случайных или закономерных причин значения их отличаются друг от друга. Задача при проверке гипотез состоит в том, чтобы отличить случайные влияния от закономерных. Например, пусть среднее значение длины тела студентов России равно 178 см, а в БФСГУ – 180 см. Можно ли говорить на основе этих данных, что наши студенты в среднем выше испытуемых генеральной совокупности, или это различие чисто случайное?

Ясно, что если отклонение маленькое, то оно может быть случай­ным с очень большой степенью вероятности; если отклонение большое, вероятность его случайного появления мала. Можно выбрать такое критическое отклонение, вероятность появления кото­рого по случайным причинам настолько мала, что оно практически невозможно, и поэтому если оно в действительности имело место, то это свидетельствует, что предположение о том, что средняя длина тела студентов БФСГУ равна средней по России, не удовлетворяет фактам. Например, если бы различия в длине тела составляли, скажем, 15–20 см, то, очевидно, наши испытуемые действительно выше испытуемых генеральной совокупности. Вероятность появления таких различий в силу случайных причин настолько мала, что ее можно было бы не принимать во внима­ние.

При проверке статистической гипотезы решение экспериментатора никогда не принимается с уверенностью, т. е. всегда существует некоторый риск принять неправильное решение. Оценка степени этого риска и представляет собой суть проверки статистической гипотезы. Ясно, что исключить на 100% этот риск невозможно. Но экспери­ментатор может выбрать вероятность или уровень значимости, который характеризует вероятность отклонения, признаваемого невозможным в силу лишь случайных причин. Самыми распространенными уровнями являются: 0,001; 0,01; 0,05. В педагогических исследованиях различия считаются достоверными при 5%-ном уровне значимости. Уровень 0,05 означает, что выборочное значение может встретиться в среднем не чаще чем 5 раз в 100 наблюдениях.

Построение доверительных интервалов статистических характеристик

Статистические характеристики (среднее арифметическое, среднее квадратическое отклонение, коэффициент вариации) не дают необходимой оценки генеральной совокупности т.к. остаются неизвестными нижние (Хниж) и верхние (Хверх) граничные значения, между которыми можно с определенной вероятностью ожидать генеральную статистическую характеристику.

Для теории педагогических оценок, построения шкал оценок, построения доверительных интервалов необходимо знать процент результатов, лежащих в различном диапазоне варьирования, или колеблемости.

Для оценки варьирования результатов измерений используют следующие соотношения:

 1,96 σ интервал включает 95% всех результатов;

 2,58 σ интервал включает 99% всех результатов;

 3,29 σ интервал включает 99,9% всех результатов.

Таким образом, отклонения от больше чем на 2 σ следует ожидать в 4–5 случаях из 100, отклонения большего, чем 2,5 σ – в одном случае из 100, большего, чем 3,3 σ – в одном из 1000. В статистике существует «правило трех сигм», использующееся при исключении сильно отклоняющихся результатов измерений. Результаты измерений, отклоняющиеся от более, чем на 3 σ, можно считать «ошибочными» и исключить из расчетов.

Доверительные границы Хниж и Хверх определяют по формуле:

Хниж.(верх)=  US ,

где U – значение нормированного отклонения для данного уровня значимости  (0,05, 0,01 или 0,001), S – стандартная ошибка средней арифметической.

Предположим у 100 студентов измерили рост, произвели расчет основных статистических характеристик и получили следующие данные:

= 178,4 см; σ = 5,72 см; S = 0,57.

Выберем 5%-й уровень значимости, значит U = 1,96 (для  = 0,05).

Определим нижние и верхние граничные значения.

Хниж= – U = 178,4 – 1,96  0,57 = 177,28

Хверх= + U = 178,4 + 1,96  0,57 = 179,52

Значения доверительных границ для  = 0,01 (U = 2,58) будут следующими:

Хниж= – U = 178,4 – 2,58  0,57 = 176,93

Хверх= + U = 178,4 + 2,58 0,57 = 179,87

Следовательно, в 95% случаев значения длины тела студентов, охваченных обследованием, будут находится в интервале от 177,28 до 179,52 см, а в 99% – в интервале от 176,93 до 179,87 см.

Сравнение двух средних арифметических. Несвязанные выборки.

Определение достоверности различий между результатами двух исследований по шкалам интервальной и отношений производится при помощи t-критерия Стьюдента. В этом случае должны быть известны следующие статистические характеристики: 1, 2, σ1, σ2, и объемы выборок n1 и n2 для двух сравниваемых групп (например, экспериментальной и контрольной). Вычисление t-критерия Стьюдента производится по следующим формулам.

  1. В случае, когда равны объемы выборки, но не равны дисперсии:

n = n1 = n2; σ1  σ2;

tрасчет = число степеней свободы  = 2n – 2.

2. В случае, когда не равны объемы выборки и не равны дисперсии:

n1  n2; σ1  σ2;

tрасчет = число степеней свободы  = n1 + n2 – 2.

3. В случае неравных объемов выборки и равных дисперсий:

n1  n2; σ = σ1 = σ2;

tрасчет = число степеней свободы  = n1 + n2 – 2.

После того как вычислено tрасчет, по специальной таблице (приложение 7) его сравнивают с критическим значением tкрит. При 5%-ном (t0,05) или 1%-ном (t0,01) уровнях значимости и определенном числе степеней свободы. Если tрасчет окажется больше граничного значения tкрит, то различия между средними арифметическими двух групп считаются достоверными при выбранном уровне значимости. Если tрасчет окажется меньше граничного значения tкрит, то при выбранном уровне значимости различия между средними арифметическими двух групп считаются недостоверны.

Предположим, что две группы студентов выполняли контрольное упражнение в подтягивании на перекладине. В одной группе было 10 человек (n1 = 10), в другой – 12 (n2 = 12). Студенты первой группы подтянулись в среднем 12 раз ( 1= 12), студенты второй – 14 раз ( 2 = 14). Показатели вариации составили соответственно: σ1=3,5 и σ2=4,8.

Так как и объем групп и дисперсии неравны, значение tрасчет вычисляем по формуле 2.

tрасчет = = = 1,13

Число степеней свободы  = n1 + n2 – 2 = 10+12–2 = 20. Выбираем уровень значимости равным 0,05. Для значения p = 0,05 и  = 20 по таблице граничных значений t-критерия Стьюдента (приложение 7) находим критическое значение tкрит. Оно равно 2,09, что больше tрасчет. – различия статистически не достоверны. Таким образом, группы не отличаются друг от друга по изучаемому показателю. Наблюдаемые различия следует рассматривать как случайные.

Сравнение двух средних арифметических. Связанные выборки.

Часто экспериментальные исследования проводятся с участием одной группы испытуемых и измерения проводятся до и после эксперимента. При этом стараются определить – повлиял ли внесенный фактор на исследуемые показатели, или нет. При проведении таких экспериментов выборки всегда равны и они называются связанными. Для того, чтобы определить tрасчет, предварительно вычисляют для каждого испытуемого разность между первым и вторым измерениями (di), рассчитывают среднюю арифметическую разностей ( d) и находят стандартное отклонение средней разности (Sd). Для расчета tрасчет нужно знать две формулы:

Sd = ; tрасчет = число степеней свободы  = n – 1.

Поясним на примере. Группа студентов из 8 человек для повышения силовых способностей применяла в течение семестра новую методику тренировки. В начале и в конце семестра были проведены контрольные тестирования в подтягивании на перекладине. Результаты тестирования и порядок расчета промежуточных значений представлены в таблице 6.

Таблица 6

Расчет достоверности различий для связанных выборок

№ п/п

Результаты теста

di

di2

Sd = = = =1,04

tрасчет = = = 2,64

 = n – 1 = 8 – 1 = 7

tрасчет>tкрит; 2,64>2,37 при Р=0,05

исходн.

заключ.

1

10

12

–2

4

2

8

11

–3

9

3

11

14

–3

9

4

12

14

–2

4

5

9

12

–3

9

6

14

16

–2

4

7

15

17

–2

4

8

10

15

–5

25

Сумма ()

–22

68

Среднее арифметич. ( )

–2,75

По таблице (приложение 7) для заданного уровня значимости (зададим его равным 0,05) и степени свободы (7) находим tкрит. Оно равно 2,37. Наше расчетное tрасчет больше табличного значения, значит различия статистически достоверны. Таким образом, применяемая студентами методика повышения силовых способностей позволила статистически достоверно (Р=0,05) улучшить результаты в подтягивании на перекладине.

Непараметрические критерии. Определение достоверности различий

по Т-критерию Уайта

Вычисление непараметрических критериев не требует предварительного определения параметров данных ( , σ и др.). Непараметрические критерии вычисляются для шкал порядка и наименований. Они проще параметрических, но обладают меньшей мощностью. Непараметрические критерии уместно использовать, когда возникают сомнения в точности выводов, которые делаются на основании параметрических критериев, когда недостаточно ясна форма распределения.

Одним из критериев, применяемых при сравнении двух независи­мых распределений для установления достоверности различий, является непараметрический Т-критерий Уайта, который применим к выборкам равного и неравного объема.

Порядок определения достоверности различий на основе этого критерия следующий. Ре­зультаты экспериментальных и контрольных групп ранжируют (упорядочивают) в общий ряд и находят их ранги. В случае, когда в обеих группах попадутся одинаковые оценки, для этих оценок ставится средний ранг, полученный путем деления суммы рангов этих оценок. Затем эти ранги суммируют отдельно по каждой выборке. Если выборки не отличаются друг от друга, то и суммы их рангов должны быть равны. Чем значительнее расхождение между полученными ре­зультатами, тем больше разница между суммами их рангов. Правильность вычислений определяется следующим образом. Рассчитывается общая сумма рангов (Rобщ.) по формуле:

Rобщ. =

где n – сумма количества результатов в обеих группах.

Для оценки критерия Т всегда берется меньшая из двух сумм рангов, которая сравнивается с табличным (стан­дартным) значением этого критерия для n1 и n2 (число испытуемых в группах 1 и 2). Если Тстанд., определяемая по таблице (приложение 8), больше Тфактич. (меньшая сумма рангов), то различия считаются достоверными, если меньше или равно Тфактич., то недостоверными.

Покажем определение Т-критерия Уайта на приме­ре. Две группы студентов (экспериментальная – 6 человек и контрольная – 7 человек) обучались гимнастическим упражнениям по разным методикам. Экспертная комиссия поставила оценки за выполнение упражнений на основе 10-бальной шкалы (шкала порядка).

Были получены следующие оценки: эксперименталь­ная группа – 7,5; 7,7; 7,3; 8,0; 8,1; 8,2; контрольная груп­па – 6,7; 6,9; 7,2; 7,0; 6,8; 7,3; 7,4. Проранжируем все полученные оценки в возрастающем порядке независимо от группы и поместим их для наглядности в таблицу (табл. 7).

В верхних рядах расположим оценки, а в нижних – их ранги.

Таблица 7

Результаты экспертной оценки выполнения гимнастических упражнений

Группы

n

Очки

Эксп.

6

7,3

7,5

7,7

8,0

8,1

8,2

Контр.

7

6,7

6,8

6,9

7,0

7,2

7,3

7,4

Rэ.

6,5

9

10

11

12

13

Rк.

1

2

3

4

5

6,5

8

Вычислим сумму рангов отдельно для экспериментальной и контрольной групп.

Rэ. = 6,5+9+10+11+12+13 = 61,5

Rк. = 1+2+3+4+5+6,5+8 = 29,5

Проверим правильность вычислений.

Rобщ. = = = 91

Сумма вычисленных рангов тоже равна 91 (Rэ. + Rк = 61,5+29,5 = 91), значит расчеты произведены верно. Далее меньшую сумму рангов (Тфактич.) сравниваем с табличным критерием Тстанд. (приложение 8) при 5%-ном уровне значимости. Для этого в левом столбце отыскивает цифру, соответствующую большему количеству студентов в группе (7), в верхней строчке – меньшему (6). На пересечении этих цифр находим значение Тстанд. Оно равно 27. Так как Тстанд. = 27 < Тфактич = 29,5, различия между полученными результатами следует признать недостоверными. Таким образом, экспериментальная методика не оказала достоверно значимого положительного эффекта при обучении технике выполнения гимнастических упражнений по сравнению с методикой, применяемой контрольной группой. В данном случае нужно или вносить коррективы в методику обучения, или увеличить количество испытуемых и еще раз провести эксперимент.

Определение достоверности различий по критерию знаков

Критерий знаков основан на рассмотрении знаков разностей (di) у отдельных испытуемых. Этот критерий используется при сравнении двух парных (связанных) выборок. Если изменений (прироста) результатов нет, то «+» и «–» разности должны встречаться в среднем одинаково часто. Однако при ограниченном числе наблюдений одних разностей может оказаться больше (в силу случайностей), чем других.

Для применения критерия знаков необходимо:

  • определить знаки разностей (di) у всех испытуемых;

  • подсчитать число разностей, встречающихся в наименьшем количестве (отсутствие разницы –«0» при этом отбрасывается и число наблюдений соответственно уменьшается);

  • сравнить полученное количество разностей с граничным значением (приложение 9) при выбранном уровне значимости.

Например, группе студентов из 15 человек в течение двух месяцев в занятиях по физической культуре отводили время для силовой подготовки с целью улучшения результата в подтягивании на перекладине и затем оценили эффективность этих тренировок. Результаты исследования представлены в таблице 7.

Таблица 7.