Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы научно-методической деятельности студент...doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
22.21 Mб
Скачать
    1. Математико-статистические методы

Оценка педагогического процесса происходит, как правило, с качест­венных и количественных позиций. Количественные критерии позволяют более объективно интерпретировать произошедшие изменения, установить степень достоверности различий или же отсутствие таковых, выявить существующие взаимосвязи, а также определить множественные связи между теми или иными факторами. Однако использование методов математической статистики в физическом воспитании и спорте требует соответствующих знаний. Недопустимо неумелое, формальное «жонглирование» цифрами. Вводя в педагогический анализ математическую обработку данных, мы, естественно, оказываемся стоящими перед вопросом о точности, достоверности педагогических выводов, вытекающих из соответствующих математических формул.

Адекватность методов математической статистики применительно к каждой курсовой или дипломной работе, конечно, должна быть определена студентом совместно с научным руководителем. Мы же приведём способы вычисления основных статистических величин, наиболее часто встречающихся в работах подобного типа.

Во-первых, следует сделать акцент на том, что информация о любой совокупности цифрового материала должна содержать в себе как необходимый минимум три компонента: среднюю арифметическую величину, ее разброс и число испытуемых.

Вычисление средней арифметической величины (М или X), (несмотря на её кажущуюся простоту), предполагает придерживаться некоторых правил:

1) М не может характеризовать количественную меру тех признаков, которые одной части совокупности присущи, а другой нет. Например, два человека не проплывают ни одного метра (т.е. не умеют плавать), а двое других способны проплыть по 4 км. Если формально следовать вычислению М., то эти 4 человека в среднем проплывают по 2 км. Налицо абсурдность такого утверждения;

  1. М должна включать все показатели, полученные в конкретном исследовании. Произвольное исключение некоторых из них неизбежно приведёт к неверным результатам;

  2. М должна отражать только однородную совокупность (по воз­расту, полу, социальному статусу, занимающихся или не занимающихся спортом и т.п.)

  3. М должна вычисляться на достаточном для данного исследования количестве измерений (испытуемых);

  4. М может быть не информативна при объяснении того или иного педагогического явления. Объяснение этому свойству М будет дано ниже при описании вычисления среднего квадратического отклонения. Средняя арифметическая величина определяется по формуле:

где  - знак суммирования,

V - полученные в исследовании значения (варианты),

n — число вариант (случаев, испытуемых, измерений).

Например, в исследовании получены следующие результаты: 56, 42, 18, 84, 56, 107, 90, 68, 31, 48. М при этом будет:

Сравнение М различных групп возможно лишь в том случае, когда мы учитываем разброс полученных вариантов, поэтому необходимо вычислить его.

Вычисление среднего квадратического отклонения (стандартного отклонения) позволяет установить порядок отклонений всех вариант в данной совокупности измерений. Условное обозначение его – σ

где - (V)2 - сумма квадратов отклонений отдельных вариант от средней арифметической,

n – число вариант (если n ≤ 30, то в знаменателе будет n – 1)

В качестве примера вычисления σ возьмём тот же ряд полученных вариант, что в примере вычисления М.

56

-4

16

42

-18

324

18

-42

1764

84

24

576

56

-4

16

107

47

2209

90

30

900

68

8

64

31

-29

841

48

-12

144

М=60,0

6854

Таким образом, данную совокупность можно представить как 60,0±26,18.

Быстро, но приблизительно, σ можно определить по так называемому размаху:

где V макс. - наибольшее значение варианты,

V мин. - наименьшее значение варианты,

К - коэффициент, который находится по таблице.

Число вариант

0

1

2

3

4

5

6

7

8

9

0

-

-

1,13

1,69

2,06

2,33

2,53

2,70

2,85

2,97

10

3,08

3,17

3,26

3,34

3,41

3,47

3.53

3,59

3,64

3,69

20

3,74

3,78

3,82

3,86

3,9

3,93

3,96

4,0

4,03

4,06

30

4,09

4,11

4,14

4,16

4,19

4,21

4,24

4,26

4,28

4,30

Как видно из таблицы, К зависит от числа вариант. Для вышеприведенной совокупности вариант σ по размаху будет равна:

Исследования показали, что при обоих способах вычисления имеют место вполне близкие их значения. Для курсовых и дипломных работ вычисление σ по размаху вполне допустимо, особенно такой подход более уместен, когда имеется небольшое число вариант (испытуемых), не более 20.

Для нормального (симметричного) распределения вариант относительно средней арифметической величины характерно, что варианты расположены в границах ± 3 σ. В этих пределах находится около 99,7% всех вариант определённой совокупности. Надёжным критерием того, что варианты распределены симметрично (нормально) является то, что n >25 и М находится в границах ± 3 σ В рассмотренном примере вряд ли можно считать, что распределение вариант имеет нормальный вид, так как, во-первых, n =10, во-вторых, σ ± 26,18, т.е. 60,0 ± 26,18. Если бы было, допустим, n = 30, а σ при этой средней арифметической было бы, допустим, 18,7, т.е. 60,0 ± 18,7, то такое распределение с большой долей вероятности можно было бы принять за нормальное (симметричное). Вообще в математической статистике имеются специальные критерии для проверки нормальности распределения вариант. Такая проверка имеет конкретный практический смысл для применения тех или иных критериев, определяющих наличие различий (или отсутствие таковых) между двумя средними арифметическими. Например, многие начинающие исследователи для вычисления различий между двумя средними арифметическими используют критерий t - Стьюдента. Между тем, правомерность его применения допустима лишь при условии, если распределение вариант имеет нормальный вид. В том случае, если небольшое число испытуемых (<25), да ещё 3 σ значительно превышают М, должны применяться другие критерии различий (об этом более подробно будет сказано в разделе «Вычисление различий между двумя средними арифметическими величинами».

Вычисление средней ошибки среднего арифметического выявляет разброс вариант, который был бы и в других подобных исследованиях.

Эта величина обозначается символами m или Sх. Она является произ­водной от σ величиной и определяется по формуле:

В нашем примере

Это означает, что полученная средняя арифметическая величина (М = 60,0) может иметь в других аналогичных исследованиях значения от 51,72 (60,0-8,28) до 68,28 (60,0±8,28).

Таким образом, данную совокупность можно представить как 60,0±8,28.

Вычисление различий между средними арифметическими величинами осуществляется путём определения конкретных критериев различий. Разумеется, что различия следует находить между явлениями одного порядка (свойства). Например, между результатами в беге на 30 м в начале года и соответствующими показателями в этом же тесте через какой-либо промежуток времени у тех же лиц; или, допустим, различия в результатах этого теста в различных возрастных группах. Но совершенно абсурдно, например, определять различия между результатами в названном тесте и в прыжках в длину с места, между длиной тела и массой тела и т.п.

Разберём вычисление двух показателей: критерия t - Стьюдента и T-критерия Уайта.

Как уже говорилось ранее, t-критерий можно без проверки нор­мальности распределения использовать, если n > 25 и М находится в границах З σ. Он находится по формуле:

где М₁ - средняя арифметическая величина первого измерения,

М2 - средняя арифметическая величина второго измерения,

m₁ - средняя ошибка М₁,

m2 - средняя ошибка М2

Например, 28 мальчиков 10 лет перед занятием в секции ОФП имели в беге на 1000 м результат в среднем 273,91 + 2,94 с (М1 + m1). После года занятий их результат составил в среднем 253,68 + 3,82 с (М2 +m2). Определяем t-критерий:

По таблице Коэффициентов t -Стьюдента определяем, что граничное значение t для 28 испытуемых (n= 28) при Р = 0,001 составляет 3,67. В нашем же примере t = 4,20. Следовательно, различия достоверны при 0,1 - процентной значимости, т.е. Р< 0,001.

В исследованиях по физическому воспитанию и спорту различия считаются достоверными при 5 - процентном уровне значимости, т.е. вероятность ошибки измерений (эксперимента, наблюдений, тестирования и др.) допускается в пределах 5%, т.е. Р< 0,05.

Для практического пользования приводим коэффициенты t - Стьюдента при Р<0,05, когда сравниваются две группы испытуемых.

С

0,05

С

0,05

С

0,05

С

0,05

С

0,05

4

2,78

5

2,57

6

2,45

7

2,37

8

2,31

9

2,26

10

2,23

11

2,20

12

2,18

13

2,16

14

2,15

15

2.13

16

2,12

17

2,11

18

2,10

19

2,09

20

2,09

21

2,08

22

2,07

23

2,07

24

2,06

25

2,06

26

2,06

27

2,05

28

2,05

29

2,05

30

2,04

32

2,04

34

2,03

36

2,03

38

2,02

40

2,02

42

2,02

44

2,02

46

2,01

46

2,01

50

2,01

55

2,00

Примечание: С - число степеней свободы, С = (n₁+n2) -2

В случаях, когда число испытуемых менее 25. распределение вариант может быть ассиметричным. в ситуациях, когда варианты имеют порядковое, а не количественное выражение (например, занятые спортсменами места на соревнованиях или командные места и т. п.) применяют так называемые непараметрические критерии различия: критерии Уайта, Вилкоксона, ван дер Вардена (Б.А. Ашмарин, 1978).

В качестве примера приводим вычисление Т-критерия Уайта.

Достоверность различий между двумя признаками оценивается с помощью Т-критерия Уайта, по специальной таблице. Имеются таблицы с неодинаковым числом случаев (например, когда в одной группе n не превышает 27, а в другой – 15). При равных по количеству группах число испытуемых (измерений) в каждой из них не должно превышать 15. Для оценки критерия Т всегда берется меньшая из двух сумма рангов, которая сравнивается с табличным (стандартным) значением этого критерия. Если Т стандартное (табличное) > Т факт. (меньшая сумма рангов), то имеется достоверность различий.

Например, в одной группе (Э₁) были показаны результаты в беге на 30 м: 3,2; 3,3; 3,5; 3,5; 3,6; 4,8; 3,7 (с); в другой – (Э₂) – 3,5; 4,1; 3,5; 3,9; 3,6; 4,9; 4,0 (с).

Ранжируем эти результаты ( в возрастающем или в понижающем) порядке независимо от групп:

Э₁

Rэ₁

Э₂

Rэ₂

3,2

1

3,5

4,5

3,3

2

3,5

4,5

3,5

4,5

3,6

7,5

3,5

4,5

3,9

10

3,6

7,5

4,0

11

3,7

9

4,1

12

4,8

13

4,9

14

В случае, когда будет иметь место одинаковые результаты в группах им дается средний ранг. В нашем примере это результаты 3,5 и 3,6 с.

Следующая операция – вычисление суммы рангов отдельно для Э₁ ( Rэ₁) и Э₂ ( Rэ₂).

 Rэ₁ = 1+2+4,5+4,5+7,5+9+13= 41,5

 Rэ₂ = 4,5+4,5+7,5+10+11+12+14= 63,5

Меньшую сумму рангов (Т факт. = 41,5) сравниваем с табличным значением критерия Тстанд. для n=7 при 5-процентном уровне значимости.

Из таблицы видно, что Тстанд.= 36. Так как Тстанд. Т факт. (36  41,5), следует, что различий между Э₁ и Э₂ нет, т.е. они недостоверны (Т=41,5 при Р>0,05).

Значение Т-критерия Уайта при уровне значимости р≤0,05

Число наблюдений во второй группе

Число наблюдений в первой группе

2

3

4

5

6

7

8

9

10

11

12

13

14

15

4

11

5

6

11

17

6

7

12

18

26

7

7

13

20

27

36

8

3

8

14

21

29

38

49

9

3

8

15

22

31

40

51

63

10

3

9

15

23

32

42

53

65

78

11

4

9

16

24

34

44

55

68

81

96

12

4

10

17

26

35

46

58

71

85

99

115

13

4

10

18

27

37

48

60

73

88

103

119

137

14

4

11

19

28

38

50

63

76

91

106

123

141

160

15

4

11

20

29

40

32

65

79

94

110

127

145

164

185

16

4

12

21

31

42

54

67

82

97

114

131

150

169

17

5

12

21

32

43

56

70

84

100

117

135

154

18

5

13

22

33

45

58

72

87

103

121

139

Вычисление коэффициента корреляции позволяет установить наличие или отсутствие взаимосвязи между какими-либо факторами. Математически он выражается коэффициентом от -1 (максимальная отрицательная связь) до +1 (максимальная положительная связь) десятичными дробями с точностью до второго знака после запятой (например, 0,73). Коэффициент корреляции обозначается буквой r.

Количественная мера связи зависит от величины коэффициента корреляции и числа измерений (испытуемых). Ориентировочно она следующая:

слабая связь - r = <0,30

средняя связь - r = 0,31-0,69

сильная (тесная) связь - => 0,70

Определение количественных показателей взаимосвязи в физическом воспитании и спорте имеет большое значение для практики. Например, выявленная связь между такими физическими качествами как быстрота и сила, позволила определить эффективные средства развития скорости в беге в зрелом возрасте, когда уже возможности развивать скорость собственно упражнениями на быстроту значительно исчерпаны в силу возрастных закономерностей формирования этого качества. Поэтому вступает в процесс тренировки быстроты принцип «скорость через силу».

Самый простой способ вычисления коэффициента корреляции это ранговая корреляция Спирмена (Спирмен является автором этого способа нахождения г). Она даёт приблизительную информацию о взаимосвязи. Но в отдельных случаях это единственно возможный метод вычисления r (когда варианты не имеют конкретных измерений, а выражаются, например, занятыми местами).

Расчет коэффициента ранговой корреляции выполняется в следующем порядке:

  1. Расположить показатели вариант (V₁ и У2) в столбик (графы 1 и 2).

  2. Дать ранги (места) вариантам в каждом из предыдущих столбиков (графы 3 и 4).

  3. Определить разность между рангами по каждой варианте в срав­ниваемых признаках (графа 5).

  4. Возвести в квадрат каждую разность (графа 6).

  5. Определить сумму всех квадратов разностей (сумму цифр в графе 6).

  6. Вычислить коэффициент корреляции по формуле:

где - (VV₂)² - сумма квадратов разности рангов,

n - число коррелируемых пар.

Дополняем сказанное соответствующим конкретным примером. Выявляем между двумя признаками у младших школьников: пробегаемым расстоянием со скоростью 60% от максимальной (м) (V₁) и временем пробегания 30 м с ходу (с) (V2).

V₁

V2

Ранги по V₁

Ранги по V₂

Разность рангов

Квадраты разности рангов

750

3.7

4

6

2

4

1000

4,8

1

7

6

36

500

3,6

7

5

2

4

700

3,5

5

4

1

1

800

3,4

2,5

3

0,5

0,25

800

3,3

2,5

2

0,5

0,25

600

3,2

6

1

5

25

n = 7

= 70,5

Примечание: в случаях одинаковых результатов, вариантам дают средний ранг. В нашем примере два испытуемых пробежали одинаковое количество метров - по 800. Они соответственно разделили 2-3 места. Следовательно, даём им средний рант, т.е. 2,5.

Далее вычисляем r по указанной выше формуле:

Т.е. r= - 0,26.

Критические значения коэффициента корреляции Спирмена

Число коррелируемых пар

Уровень значимости, Р

Число коррелируемых пар

Уровень значимости, Р

0,05

0,01

0,05

0,01

1

2

3

4

5

6

4

1,00

-

16

0,42

0,60

5

0,90

1,00

18

0,40

0,56

6

0,83

0,94

20

0,38

0,53

7

0,71

0,89

22

0,36

0,51

1

2

3

4

5

6

8

0,64

0,83

24

0,34

0,48

9

0,60

0,78

26

0,33

0,46

10

0,56

0,74

28

0,32

0,45

12

0,51

0,71

30

0,31

0,43

14

0,46

0,64

-

-

-

По таблице устанавливаем количественную меру достоверности связи между назваными факторами. В нашем случае, когда для 7 коррелируемых пар граничное значение r составляет 0,71, г=-0,26 говорит о том, что эти два показателя не взаимосвязаны друг с другом, т.е. указанная связь не является достоверной (Р>0,05). Методическое заключение можно сделать такое: нет оснований утверждать, что мальчики, показывающие более высокие результаты в тесте «Бег со скоростью 60% от максимальной», способны пробегать 30 м с ходу с более высокой скоростью и наоборот - показывающие более высокие результаты в беге на 30 м с ходу не пробегают большего расстояния в тесте на выносливость.

Вычисление коэффициента корреляции обладает более высокой степенью точности в установлении связи между двумя факторами по сравнению с коэффициентом корреляции Спирмена. Порядок действий при этом следующий:

  1. В первых двух колонках записывают варианты (V₁ и У2) корре- лируемых пар (графы I и 2).

  2. Определяют средние арифметические двух коррелируемых признаков (графы 1 и 2., см. значения М₁ и М2).

3 . Выявить отклонения вариант от своих средних арифметических величин (графы 3 и 5), обратив внимание на правильность знака «+» или «-». Из варианты вычитается М, а не наоборот. Например, 750 – 735,7=+ 14,3 (см. графу 3), но 3,7-3,64 = —0,06 (в данном случае, чем большее число по времени пробегания, тем ниже результат), т.е. этот испытуемый показал время на 0,06 с хуже, чем среднее значение (М2 = 3,64). поэтому и отклонение со знаком «-».

  1. Отклонения вариант от своих М возвести в квадраты (графы 4 и 6). Подсчитать сумму этих квадратов (см. внизу граф 4 и 6 значения сумм: 153571,5 и 1, 74 соответственно).

  2. Определить произведения отклонений вариант от своих средних арифметических, т.е. перемножить цифры в графах 3 и 5. Например, + 14,3×(-0,06) =-0,86. При этом следует обратить внимание на правильность знака (графа 7). Далее найти сумму цифр в графе 7 (см. внизу графы 7: - 344,3).

  3. Вычислить коэффициент корреляции по формуле:

где - V₁ -варианты первого фактора,

V2 - варианты второго фактора,

М₁ - средняя арифметическая величина первого фактора,

М₂ - средняя арифметическая величина второго фактора.

Дополняя сказанное конкретным соответствующим примером, приводим таблицу, где наглядно представлена последовательность действий при вычислении r. Для него берем тот же случай, что и в примере определения рангового коэффициента корреляции Спирмена. Этот пример особенно интересен и в плане сравнения двух способов вычисления r.

V₁

V₂

V₁-M₁

V₁-M₁)²

V₂-M₂

V₂-M₂)²

V₁-M₁)

V₂-M₂)

750

3,7

+14,3

204,5

-0,06

0,0036

- 0,86

1000

4,8

+264,3

69854,5

-1,16

1,3456

-306,59

500

3,6

-235,7

55554,5

+0,04

0,0016

-9,43

700

3,5

-35,7

1274,5

+1,14

0,0196

-5,00

800

3,4

+64,3

4134,5

+0,24

0,0576

+15,43

800

3,3

+64,3

4134,5

+0,34

0,1156

+21,86

600

3,2

-135,7

18414,5

+0,44

0,1936

-59,71

M₁=735,7

M₂=3,64

 153571,5

 1,74

 =-344,5

Определяем r по формуле:

Т.е. r = - 0,66

По таблице устанавливаем, достоверна связь между названными факторами или нет.

Критические значения коэффициента корреляции

Число коррелируемых пар

Уровень значимости, Р

Число коррелируемых пар

Уровень значимости, Р

0,05

0,01

0,05

0,01

1

2

3

4

5

6

3

0,98

0,99

16

0,50

0,62

4

0,95

0,99

17

0,48

0,61

5

0,88

0,96

18

0,47

0,59

6

0,81

0,92

19

0,46

0,57

7

0,75

0,87

20

0,44

0,56

8

0,71

0,83

21

0,43

0,55

9

0,67

0,80

22

0,42

0,54

10

0,63

0,76

25

0,40

0,50

11

0,60

0,73

30

0,36

0,46

12

0,58

0,71

35

0,33

0,43

13

0,55

0,68

40

0,31

0,41

14

0,53

0,66

45

0,29

0,38

15

0,51

0,64

50

0,28

0,36

В данном примере для 7 коррелируемых пар граничное значение r при 5-процентной значимости составляет 0,75. Следовательно, найденный r = -0,66 является недостоверным (Р>0,05), т.е. скоростные возможности не зависят от показателей общей выносливости, определённые по указанным выше тестам.

Как было сказано ранее, значения r Спирмена и r не совпадают. Ко­эффициент r Спирмена даёт лишь приблизительную информацию о связи двух факторов, r же более точен. В первом случае ранговый г = -0,26, во втором же г = - 0,66, но оба этих коэффициента указывают на наличие недостоверной связи коррелируемых факторов (Р >0,05).

В некоторых исследованиях (в подобных случаях) часто говорят о неких тенденциях при недостоверных r. С точки зрения математической статистики это утверждение не является верным. Наличие выявленных недостоверных r говорит лишь об одном - отсутствии связи между теми или иными факторами, т.е. у нас нет оснований утверждать о существовании каких-то «тенденций», так как с точностью до 5% мы не можем гарантировать об их присутствии в изучаемом явлении.

Рассмотренные способы вычисления r относятся к нахождению парных связей, т.е. они свидетельствуют о наличии или отсутствии зависимости одного фактора от другого. Но, как известно, в физическом воспитании и спорте эта зависимость, как правило, не является однозначной, она многофакторна. Например, у не занимающихся спортом людей физические качества, обладают широким спектром взаимовлияния друг на друга и, поэтому определение лишь парных корреляций может привести к ошибочным методическим выводам о связи (влиянии) какого-то фактора с другими факторами. С целью исключения подобного рода ошибочных суждений в математической статистике существует «метод множественного регрессионного анализа (Н.А. Масальгин, 1974)». Суть его заключается в нахождении количественной меры влияния нескольких факторов (независимых переменных) на определённый фактор (зависимую переменную). Число независимых переменных зависит от педагогической целесообразности, Содержащейся в рабочей гипотезе того или иного исследования. Например, нас интересует вопрос: «Какие факторы влияют на результат в беге на 1000 м младших школьников?». В этом случае в качестве зависимой переменной принимаем результат в беге на 1000 м, а в качестве независимых переменных - результаты в тестах на быстроту, скоростно-силовые качества, силу, физическую работоспособность (ФР₁₇₀) и др. Другими словами, мы выявляем в какой степени эти факторы объясняют результативность в беге на 1000 м.

Такой метод математической обработки полученных данных отно­сительно редко применялся в научно-методических работах по физическому воспитанию и, безусловно, с его помощью можно получить новые оригинальные научные данные.