Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка по ВКР.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
718.85 Кб
Скачать

4.3. Методы математической статистики

Применяя в исследовании те или иные методы, в конечном итоге экспериментатор получает большую или мень­шую совокупность различных числовых показателей, призванных характеризовать изучаемое явление. Но без систематизации и надлежащей обработки полученных результатов, без глубокого и всестороннего анализа фактов не удается извлечь заключенную в них информацию, от­крыть закономерности, сделать обоснованные выводы. Приведенные в тексте самые элементарные и вполне доступные для каждого студента приемы матема­тической обработки результатов носят демонстрационный характер. Это означает, что примеры иллюстрируют применение того или иного математико-статистического метода, а не дают его развернутую интерпретацию.

Средние величины и показатели вариации. Прежде чем говорить о более существенных вещах, необходимо уяснить такие статистические понятия, как генеральная и выборочная совокупности. Группа чисел, объединяемых каким-либо признаком, называется совокупностью. Наблюдения, проводимые над какими-то объектами, могут охватывать всех членов изучаемой совокупности без исключения или ограничиваться обследованием лишь некоторой ее части. В первом случае наблюде­ние будет называться сплошным, или полным, во втором - частичным, или выборочным. Сплошное обследование проводится очень редко, так как в силу ряда причин оно практически либо невыполни­мо, либо нецелесообразно. Так, невозможно, например, об­следовать всех мастеров спорта по легкой атлетике или всех школьников десятых классов страны. Поэтому в подавля­ющем большинстве случаев вместо сплошного наблюдения изучению подвергают какую-то часть обследуемой совокупности, по которой и судят о ее состоянии в целом.

Совокупность, из которой отбирается часть ее членов для совместного изучения, называется генеральной, а ото­бранная тем или иным способом часть данной совокупности получила название выборочной совокупности или просто выборкой. Следует уточнить, что понятие генеральной совокупности является относительным. В одном случае это все спортсмены (школьники, студенты и т.п.) страны, а в дру­гом - города, вуза. Так, например, генеральной совокупностью могут быть все студенты вуза, а выборкой - студенты специализации футбола. Число объектов в любой совокупности называется объемом (объем генеральной совокупности обозначается N, а объем выборки n). Предполагается, что выборка с должной достоверностью представляет генеральную совокупность только в том случае, если ее элементы избраны из генеральной нетенденциозно. Для этого существует несколько путей: отбор выборки в соответствии с таблицей случайных чисел, разделение генеральной совокуп­ности на ряд непересекающихся групп, когда из каждой выбирается определенное количество объектов, и др.

Что касается объема выборки, то в соответствии с основными положениями математической статистики выборки тем представительнее (репрезентативнее), чем она полнее. Исследователь, стремясь к рентабельности своей работы, заинтересован в минимальном объеме выборки, и в такой ситуации количество объектов, отбираемых в вы­борку, является результатом компромиссного решения. Чтобы знать, насколько выборка достаточно достоверно представляет генеральную совокупность, необходимо оп­ределить ряд показателей (параметров).

Вычисление средней арифметической величины. Средняя арифметическая величина выборки характеризует сред­ний уровень значений изучаемой случайной величины в наблюдавшихся случаях и вычисляется путем деления сум­мы отдельных величин исследуемого признака на общее число наблюдений:

, (1)

где хi - вариант ряда;

п - объем совокупности.

Суммой Σ принято обозначать суммирование тех данных, ко­торые стоят справа от него. Нижние и верхние показатели Σ ука­зывают, с какого числа следует начать сложение и какими показателями его закончить. Так, обозначает, что необходимо сложить все х, имеющие порядковые номера от 1 до п. Знак показывает суммирование всех х от первого до последнего показателя.

Таким образом, вычисления по формуле (1) предполагают следующий порядок действий:

1. Суммируют все полученные хi, т. е. ,

2. Найденную сумму - делят на объем совокупности п.

Для удобства и наглядности работы с показателями необходимо составить таблицу, так как сложению подлежат xi, перебираемые от первого до последнего числа.

Например, средняя арифметическая определяется по формуле:

Результаты измерений приведены в таблице 1.

Таблица 1

Результаты тестирования спортсменов

№ п/п

1

2

3

4

5

6

7

8

хi

1,25

1,30

1,32

1,36

1,38

1,40

1,42

1,45

10,88

Обратим внимание на то, что точность вычислений и точность измерений должны совпадать: если измеренные величины име­ют точность до сотых, то и про­межуточные вычисления и ко­нечный результат должны быть представлены с точностью до сотых.

Таким образом, полученные показатели, представленные вари­ационным рядом, имеют типич­ную характерную для всего ряда величину = 1,36 (с).

Среднее арифметическое дает возможность:

а) оха­рактеризовать исследуемую совокупность одним числом;

б) сравнить отдельные величины со средним арифметичес­ким;

в) определить тенденцию развития какого-либо явле­ния;

г) сравнить разные совокупности;

д) вычислить дру­гие статистические показатели, так как многие статистические вычисления опираются на среднее арифметическое.

Однако одно только среднее арифметическое не дает воз­можности глубоко анализировать сущность того или ино­го явления и их взаимные различия.

Вычисление среднего квадратического (стандартного) отклонения. При анализе статистической совокупности одним из важных показателей является расположение значений эле­ментов совокупности вокруг среднего значения (варьирование). Для характеристики варьирования в практике исследовательской работы рассчитывают среднее квадратическое отклонение (оно называется также стандартным отклонением и обозначается буквой S), которое отражает степень отклонения результатов от среднего значения, выражается в тех же единицах измерения. Для большинства исследователей привычно обозначать эту величину греческой буквой σ (сигма). На самом деле, в специальной лите­ратуре по статистике σ - стандартное отклонение в генеральной совокупности, a S - оценка этого параметра в исследованной выборке. Но чтобы не запутывать начинаю­щих исследователей, будем обозначать стандартное отклонение знаком σ и вычислять по формуле:

, (2)

где - сумма разности между каждым показателем и средней арифметической величиной (сумма квадратов отклонений);

п - объем выборки (число измерений или испытуемых).

Если число измерений не более 30, т.е. n ≤ 30, используется формула:

, (3)

Необходимо подчеркнуть, что чем сильнее варьирует признак, тем больше величина этого показателя, и, наоборот, чем слабее он варьирует, тем меньше среднее квадратическое отклонение.

Для вычисления σ надо произвести следующие действия:

1. Определяют среднюю арифметическую .

2. Из каждого варианта вычитают среднюю арифметическую: xi- .

3. Найденную разность возводят в квадрат: (xi- )2.

4. Определяют сумму всех квадратов разностей.

5. Найденную сумму делят на объем совокупности п.

Исходные данные заносятся в таблицу и последовательно выполняются перечисленные выше действия. Пример.

Таблица 2

Результаты вычислений средней арифметической

№ п/п

xi

xi-

(xi- )2

1

2

3

4

1

1,25

-0,11

0,0121

2

1,30

-0,06

0,0036

3

1,32

-0,04

0,0016

4

1,36

0,00

0,0000

5

1,38

0,02

0,0004

6

1,40

0,04

0,0016

7

1,42

0,06

0,0036

8

1,45

0,09

0,0081

10,88

-

0,031

В целом данные столбца 3 показывают, как все варианты рассеиваются относительно средней величины.

При определении среднего квадратического от­клонения большое значение имеет стол­бец 3, в котором от каждого варианта вычитается значение сред­ней арифметической. Таким образом, показатели столбца 3 указы­вают на то, как каждый конкретный вариант соотносится со сред­ним значением. Если средняя величина определена верно, то сумма отрицательных величин по мо­дулю должна быть равна сумме положительных величин.

Вычисляя среднюю арифметическую, группу исходных данных заменили одной величиной, самой типичной и характерной. Те­перь необходимо заменить все показатели рассеивания одним показателем - средней арифметической всех показателей рас­сеивания. Однако при правильном исчислении средняя сумма отрицательных показателей должна быть равна сумме положитель­ных показателей, т.е. при вычислении средней арифметической их сумма должна быть равна нулю. Поэтому предлагается возвес­ти все знаковые показатели в квадрат, а потом найти среднюю арифметическую всех квадратов. Именно с этой целью в столбце 4 находятся квадраты разностей (х - )2 с целью определения средней арифметической среди них.

Таким образом, среднее квадратическое от­клонение представляет собой среднюю ариф­метическую величину всех (xi- )2. Эта величина указывает на рассеивание исходных данных относительно средней арифмети­ческой (в квадрате).

Обратим внимание также на то, что вычисле­ния среднего квадратического отклонения следует рассчитывать с большей точностью. При нахождении среднего квадратического отклонения, извлекая ко­рень, мы возвращаемся к исходной точности.

Чем меньше величина σ, тем плотнее результаты око­ло средней, что может говорить как о стабильности пока­зателей одного испытуемого, так и о ровности результатов группы или одинаковой подготовленности спортсменов.

Существует и более простой способ вычисления стан­дартного отклонения по следующей формуле:

, (4)

где Vmax - наибольшее значение показателя;

Vmin - наименьшее значение показателя;

К - табличный коэффициент (табл. 3), обусловлен­ный объемом выборки (n).

Математическими исследованиями установлено, что при обоих методах расчета имеются вполне удовлетворительные совпадения величин. Кроме того, вычислить σ по размаху выгодно при малом числе измерений (не более 20) (Таблица 3).

Таблица 3

Коэффициенты (К) для вычисления среднего квадратического отклонения по амплитуде вариационного ряда

0

1

2

3

4

5

6

7

8

9

0

1,13

1,69

2,06

2,33

2,53

2,70

2,85

2,97

10

3,08

3,17

3,26

3,34

3,41

3,47

3,53

3,59

3,64

3,69

20

3,74

3,78

3,82

3,86

3,90

3,93

3,96

4,00

4,03

4,09

Следует иметь в виду, что подавляющее большинство признаков в однородной группе подчиняется закону так называемого нормального распределения. Это значит, что максимальная частота встречаемости признака находится около средней арифметической величины. Чем больше величины отклоняются от в ту или другую сторону, тем реже встречаются. В зависимости от величины σ форма нормальной кривой может быть пологой (при большой величине σ) и более или менее крутой (при небольшой величине σ). Во всех случаях нормальная кривая строго симметрична относительно центра распределения и сохраняет правильную колоколообразную форму. Для того чтобы убедиться в том, что распределение близко к нормальному, необходимо сопоставить значения средней арифметической, моды и медианы. Если данные показатели приблизительно совпадают, то распределение можно считать нормальным.

При нормальном распределении варианты расположены в определенных границах. Так, в пределах расположено 99,7% всех результатов измерений.

В практике спортивных исследований часто возникают затруднения, связанные с тем, что один или несколько показателей оказываются резко отличающимися от ос­тальных. В таких случаях при исключении сильно откло­няющихся «ошибочных» результатов измерений исполь­зуется «Правило трех сигм». Производится это следующим образом: 1) вычисляется и σ без варианта, который резко отличается от остальных; 2) вычисляется величина ; 3) если сомнительный вариант выходит за пределы , его исключают из дальнейших расчетов.

Пример. При измерении угла в коленном суставе ноги, стоящей на задней колодке, в стартовом положении у 20 спорт­сменов получили величины от 100 до 140°. При этом только одно измерение составило 140°, а остальные - от 100° до 120°. Сле­дует ли измерение 140° исключить из дальнейших расчетов?

По известным формулам проводим расчет и σ (при этом сомнительный вариант 140° не учитываем!). Получаем = 111º σ = 7,3°, 3σ = 3 ∙ 7,3° = 22°. Следовательно, вариант 140° не должен выходить за пределы от 111º - 22° = 89° до 111º + + 22°=133°. Поскольку он больше верхнего предела 133°, его следует исключить из дальнейших расчетов.

Вычисление коэффициента вариации. Как уже отмечалось, σ выражается в тех же едини­цах, что и характеризуемый его признак. Поэтому, когда возникает необходимость сравнивать изменчивость при­знаков, выраженных разными единицами, приходится пользоваться относительными показателями вариации. Одним из таких показателей является коэффициент вари­ации (V). Этот показатель определяется как отношение среднего квадратического отклонения к среднему ариф­метическому, выраженное в процентах. Вычисляется он по формуле:

, (5)

По формуле находим значение коэффициента вариации, определяющего, какой процент от средней арифметической составляет показатель рассеивания.

Это означает, что рассеивание показателей относительно средней арифметической составляет 1,54 %.

В практике физической культуры и спорта не существует такого критерия, однако сам коэффициент вариации часто употребляется и отражает рассеивания группы весьма характерно. Так, например, коэффициент вариации может указать на квалификацию испытуе­мого. Известно, что высококвалифицированные спортсмены показывают очень близкие результаты, т. е. рассеивание их данных незначительно и коэффициент вариации должен быть невысоким, в то время как показатели спортсменов невысокой квалификации силь­но разнятся, поэтому их коэффициенты вариации должны быть выше.

Пример. Рассмотрим результаты забега (с) на 200 м десяти юношей. Данные приведены в таблице. Определим среднюю арифметическую, среднее квадратическое отклонение и коэффициент вариации:

Таблица 4

Результаты забега юношей

№ п/п

xi

xi-

(xi- )2

1

2

3

4

5

6

28,0

28,5

27,8

27,4

27,0

26,8

0,4

0,9

0,2

-0,2

-0,5

-0,8

0,16

0,81

0,04

0,04

0,25

0,64

165,5

-

1,94

Теперь рассмотрим результаты спортсменов высокого класса.

Таблица 5

Результаты забега спортсменов высокого класса

№ п/п

yi

yi-

(yi- )2

1

2

3

4

5

6

21,0

21,2

21,3

21,4

21,6

21,7

-0,36

-0,16

0,06

0,04

0,24

0,34

0,1296

0,0256

0,0036

0,0016

0,0576

0,1156

Всего

128,2

-

0,3327

Определим среднюю арифметическую, дисперсию, среднее квадратическое отклонение и коэффициент вариации:

Итак, проанализировав результаты спортсменов при помощи коэффициента вариации и среднего квадратического отклонения, можно сделать вывод, что рассеивание исходных дан­ных у них значительно меньше, а значит, и квалификация спорт­сменов выше.

Коэффициент вариации выражается относительным числом в процентах. Это создает возможность сравнения показателей с раз­личными наименованиями.

В статистике принято среднюю арифметическую относить к мерам центральной тенденции, а среднее квадратическое отклонение и коэффициент вариа­ции - к мерам вариабельности.

По аналогии с биологическими исследованиями принято считать, что группа показателей, коэффициент вариации которых не превышает 10-15%, представляет собой стабильные измерения, мало отличающиеся друг от друга. Если же V больше, то группа неоднородна.

Следует учитывать, что в спортивных исследованиях применение интервала 10-15% для определения однородности показателей является весьма условным и зависит от того, какие объекты исследуются. Не надо проводит специальных расчетов, чтобы убедиться, например, в существовании различий между результатами спортсменов высших и низших разрядов. Понятно, что результаты спортсменов высших разрядов должны быть более однородны и стабильны, чем результаты спортсменов низших разрядов. Следовательно, в первом случае коэффициент вариации должен быть значительно ниже, чем во втором.

Вычисление стандартной ошибки средней арифметической. Как правило, выборочные характеристики не совпадают по абсолютной величине с соответствующими генеральными параметрами, поскольку, какой бы репрезента­тивной ни была выборка, ее объем меньше генеральной совокупности. Величина отклонения выборочной средней от ее генерального параметра называется статистической стан­дартной ошибкой выборочного среднего арифметического или ошибкой репрезентативности. Иногда этот показатель называется просто ошибкой средней. Следует иметь в виду, что статистическая «ошибка» - это не ошибка, допускае­мая при измерении объектов педагогики. Возникает она исключительно в процессе отбора варианта из генераль­ной совокупности и к ошибкам измерений отношения не имеет. Этот показатель (обычно он обозначается символом т) характеризует меру представительности данной выбор­ки в генеральной совокупности. Иными словами, ошибка указывает на величину различия между средними арифме­тическими - генеральной и выборочной совокупностями. Определить ошибку средней арифметической можно двумя способами.

1. Если выборочная совокупность составлена та­ким образом, что любой объект генеральной может попасть в выборку несколько раз, то ошибка сред­ней арифметической определяется по формуле:

, (6)

где σ - среднее квадратическое отклонение выбо­р очной совокупности;

п - объем выборки (число измерений или испы­туемых).

Более точной является формула:

, (7)

При объемах выборки n ≥ 30 различие между n и (n - 1) практически не ощущается, вследствие чего можно пользоваться любой из формул - (6) и (7). При выборках численностью менее 30 такое разли­чие более ощутимо, и в этом случае предпочтитель­на формула (7).

2. Если выборка образована из генеральной таким образом, что любой объект генеральной совокупности не может быть в ней повторим, ошибка может быть определена по формуле:

, (8)

где σ - среднее квадратическое отклонение выборочной совокупности;

п - объем выборки;

N - объем генеральной совокупности.

Совершенно очевидно, что, пользуясь формулой (8), необходимо знать численность генеральной совокупности N, без чего можно обойтись в формулах (6) и (7). Отсюда следует, что если численность генеральной неизвестна, как это характерно для работ на материале спорта, нужно пользоваться формулами (6) и (7).

Например, в приведенном ранее примере определялся угол в коленном суставе ноги, стоящей на задней стартовой колодке, у 20 спортсме­нов и была получена , равная 111º. А в какой мере эта величина будет показательна, если исследовать несколько сотен спортсменов? Ответ на этот вопрос и даст значение стандартной ошибки средней арифметической, которая определяется по формуле (7):

Следовательно, ± т = 111±2°. Это обозначает, что полученная средняя арифметическая величина =111° в других аналогичных исследованиях может иметь значения 109° (111-2=109) до 113° (111+2=113).

Как рассчитывать т, если известна генеральная совокупность, покажем на примере.

Пример. В школе 730 мальчиков 14 лет. Из них у группы школьников двух классов (n=50) фиксировалось количество приседаний за 20 с. Определено: = 13,0 раз, σ = 2,2. В соответствии с формулой (8) определяем величину ошибки сред­ней арифметической для 50 школьников:

Найденное значение = 0,3) свидетельствует, что величину средней арифметической генеральной совокуп­ности (730 школьников) так же, как и у 50 школьников, можно принять за 13,0 раз. При этом погрешность такого предположения составит 0,3 приседания.

Таким образом, можно заключить, что при увеличении числа испытуемых m будет уменьшаться и стремиться к 0.

Взаимосвязь результатов исследования. В математике существует две формы взаимосвязи процессов или явлений. Функциональная связь отражает такое взаимное влияние признаков, когда одному значе­нию какого-либо признака точно соответствует одно опре­деленное значение другого признака. Например, повыше­ние t° на 10° ускоряет химическую реакцию в два раза, пло­щадь круга равняется квадрату его радиуса, умноженному на константу р, и т.д. Такого рода связи встречаются в точных науках (физике, геометрии и др.) и очень редко в физической культуре и спорте. Здесь наиболее часто наблюдается взаимная связь между признаками, когда значению одного призна­ка соответствует множество значений другого. Подобная взаимосвязь называется корреляционной связью или корреляцией. Если такая связь велика, говорят, что признаки тесно (или сильно) коррелируют, в противном случае - они слабо коррелируют. Мерой зависимости (теснотой связи) между признаками является коэффициент корреляции, а его вычисление - корреляционным анализом.

По своему характеру корреляция бывает прямой (по­ложительной) и обратной (отрицательной). Прямая корре­ляция отражает однотипность в изменении признаков: с увеличением значений первого признака увеличивается значение и другого, или с уменьшением первого - уменьшается второй. Например, повышение силовых возможностей мышц нижних конечностей сказывается на росте результата в тройном прыжке с места, а улучшение (уменьшение времени) результата в беге на 30 м с ходу приводит к улучшению (снижению времени) в беге на 100 м со старта. Обратная корреляция указывает на увеличение первого признака при уменьшении второго, или уменьшение первого признака при увеличении второго. Например, повышение силовых показателей мышц нижних конечностей приводит к снижению времени (улучшению) результата в беге на 100 м, а уменьшение времени опоры и полета сказывается на увеличении скорости бега. В студенческой среде бытует ошибочное логическое представление, что положительная корреляция - это хорошо, а отрицательная - плохо. Как видим, знак коэффициента корреляции отражает направленность зависимости между показателями, а абсолютное значение коэффициента (от 0 до 1) оценивает количественную меру связи.

Существует три способа выражения корреляции: корреляционный график; корреляционное поле и коэффициент корреляции.

По сравнению с численными значениями графики не несут в себе никакой новой информации, их отличительная черта - наглядность. В самом деле, если данные наблюдений нанести на график, то по нему можно определить, есть ли корреляция и какова ее характеристика.

В целом по графику можно определить следующие моменты:

- если экспериментальные точки рассеяны по полю графика хаотично и по ним невозможно провести линию, то корреляция отсутствует;

- если точки группируются вдоль какой-либо линии, то кор­реляция есть, и она тем теснее, чем плотнее располагаются эти точки;

- по направлению линии, вдоль которой группируются точки, можно определить вид корреляции (положительная или отрицательная).

Виды корреляционных связей между измеренными признака­ми могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна - если с увеличением или уменьшением одной переменной X, вторая переменная Y в среднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не лине­ен, а описывается другими законами.

Корреляция будет поло­жительной, если с увеличе­нием переменной X переменная Y в среднем также увеличивается, а если с уве­личением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции. Возможна ситуация, когда между переменными невоз­можно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи. Подчеркнем, однако, что нередко встречаются задачи, в которых традиционная и наибо­лее часто встречающаяся в исследованиях ли­нейная корреляционная связь отсутствует, в то время как имеется высокозначимая криволинейная связь, например, полиноми­альная или гиперболическая.

Прямая соединительная линия 22 Прямая соединительная линия 24 у у

Прямая соединительная линия 23

Полилиния 21

х х

Прямая соединительная линия 20 Прямая соединительная линия 19

Рис.1. Прямая корреляционная связь Рис.2. Обратная связь

Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (ли­нейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты и, наконец, к проверке уровня значимо­сти полученных коэффициентов корреляции.

Корреляционное поле представляет собой таблицу, отражающую масштаб обоих признаков хi и уi. В клеточки таблицы вписывается количество точек, соответствующее экспериментальным.

Корреляционное поле показывает следующие моменты:

- если точки рассеяны по полю бессистемно, хаотично и окаймляющая их кривая приближается к виду окружности, то корреляции между признаками нет;

- если окаймляющая кривая вытянута, т.е. приближается по виду к линии, то корреляция есть;

- если площадь вытянута и напоминает кривую, т. е. корреляция есть, и по наклону этой предполагаемой кривой, соотнеся ее с возрастанием или убыванием масштаба, можно определить вид корреляции (положительная или отрицательная).

а

Прямая соединительная линия 18

Овал 17

Прямая соединительная линия 16

Сильная положительная линейная корреляционная зависимость

Прямая соединительная линия 14 Овал 13 б

Сильная отрицательная линейная корреляционная зависимость

в

Прямая соединительная линия 12 Овал 11

Отсутствие статистической зависимости

Полилиния 9 г

Сильная нелинейная статистическая зависимость

Рис.3. Корреляционное поле

На рисунке (а) окаймляющая кривая вытянута, приближается по виду к линии, наклон которой отражает возрастание как первого хi ,так и второго признака уi. Следовательно, в этом случае имеет место корреляция положительная.

На следующем рисунке (б) показана корреляционная связь, отражающая отрицательную корреляцию, так как наклон предпола­гаемой кривой указывает на увеличение признака хi при умень­шении признака уi.

Третий рисунок (в) отражает отсутствие связи, четвертый (г) представляет нелинейную корреляционную связь.

Самым точным выражением корреляции является ее оценка при помощи специальных коэффициентов корреляции: 1) коэффи­циента корреляции в случае прямолинейной связи и 2) корреля­ционных отношений, если корреляция криволинейная.

Таким образом, перед вычислением коэффициента корреляции следует оценить с помощью корреляционного поля форму статистической взаимосвязи. Сделав это, на защите работы на вопрос: «Выбирая данный коэффициент корреляции, учитывали ли Вы форму зависимости и как Вы это делали?» Вы можете ответить: «Мы проводили визу­альный анализ корреляционного поля». Дальше без ком­ментариев.

Вычисление линейного коэффициента корреляции. Для оценки взаимосвязи, когда форма зависимости линейная, используется парный коэффициент корреляции Бравэ-Пирсона. Обозначается он латинской буквой r, и вычисляют его чаще всего по формуле:

, (9)

где rxy - коэффициент корреляции между признаками х и у; хi и уi - значения наблюдаемых величин х и у; и - средние арифметические значения признаков х и у;

п - объем совокупности.

Коэффициент корреляции не должен превы­шать единицу.

Таким образом, -1 < rxy < 1.

Если принять во внимание абсолютное значение rxy, т.е. без учета знака, его возможные значения могут быть заключены в интервале 0 < | rxy| < 1. Этот интервал позволяет исследователю ориентироваться по тесноте взаимосвязи: чем ближе расчетный коэффициент к еди­нице, тем теснее коррелируют признаки; чем ближе к нулю, тем меньше взаимосвязь.

В практике ФКС условно приняты следующие интервалы:

1) 0,99 < r < 0,9 – очень сильная взаимосвязь;

2) 0,89-0,7 – сильная;

3) 0,69-0,5 – заметная;

4) 0,49-0,3 – умеренная;

5) 0,29-0,1 – слабая;

6) 0,09-0 – нет взаимосвязи.

Кроме того, при расчете взаимосвязи и оценке показателей спортсменов высокой квалификации тренировочных воздействий тесная корреляция может быть равной 0,85 и выше. По знаку коэффициента корреляции определяется, какова корреляция - положительная или отрицательная.

Коэффициент корреляции может быть вычислен и по следующей формуле:

, (10)

Пример. Оцените по данным, приведенным в таблице, взаимосвязь силы удара при броске мяча в гандболе хi (Н) и дальностью полета мяча уi (м).

1. Вычисляем и . Суммы столбцов 2 и 3 разделим на n = 6.

2. Вычисляем в столбце 4 отклонения отдельных результатов от средней , ( ), а в столбце 5 отклонения отдельных результатов от средней , ( ).

3. Вычисляем произведение отклонений ( )∙( ) в столбце 6 и находим сумму этих произведений ∑( )∙( ) = 8,55.

4. В столбце 7 и 8 вычисляем квадраты отклонений ( )2 и ( )2 соответственно и находим суммы этих квадратов.

5. Вычисляем rxy по формуле (9), подставив полученные значения в столбцах 6,7,8.

Таблица 6

Взаимосвязь силы удара и дальности полета мяча

№ п/п

хi

уi

хi -

уi -

i - )( уi- )

(хi - )2

i- )2

1

2

3

4

5

6

7

8

1

2

3

4

5

6

10,12

10,30

10,65

11,00

11,90

12,30

25,2

26,4

27,2

27,9

28,5

31,2

-0,92

-0,74

-0,39

-0,04

0,86

1,26

-2,5

-1,3

-0,5

0,2

0,8

3,5

2,30

0,96

0,19

0,00

0,69

4,41

0,85

0,55

0,15

0,00

0,74

1,59

6,25

1,69

0,25

0,04

0,64

12,25

66,27

166,4

-

-

8,55

3,88

21,12

Обратим внимание на знак полученного коэффициента. Знаменатель формулы дает всегда положительное число, а числитель зависит от знака произведения (хi - )∙(уi - ). В данном случае этот знак положительный (+8,55), поэтому знак коэффициента корреляции тоже положительный.

Итак, в примере коэффициент корреляции rxy= 0,94.

Статистические выводы: 1) в связи с тем, что rxy = 0,94 > 0, корреляция между признаками х и у имеет место; 2) так как значение rxy= 0,94 близко к верхнему пределу интервала 0 < | rxy | < 1, то связь является очень тесной; 3) поскольку знак коэффициента положительный, корреляция является прямой: с увеличением первого признака х второй признак у также увеличивается.

Педагогический вывод. Дальность полета мяча у испытуемых существенно зависит от силы броска.

Этот коэффициент получил повсеместное распространение в спортивных исследованиях, в частности в практике ФКС он при­меняется во всех корреляционных расчетах.

При вычислении линейного коэффициента корреляции Бравэ-Пирсона следует учесть, что выводы дают корректные результаты в том случае, когда признаки распределены нормально и когда рассматривается взаимосвязь между большим количеством признаков. Для получения коэффициентов корреляции, свободных от значительных случайных ошибок, нужно не менее нескольких десятков измерений. В нашем примере при шести испытуемых вероятность ошибок очень велика. Напоминаем, что примеры в данном пособии носят характер иллюстрации методов, а не подробного изложения каких-либо научных экспериментов.

Для полноты информации на основании коэффициента корреляции определяют коэффициент детерминации D, который вычисляется по формуле:

, (11)

Этот коэффициент показывает часть общей вариа­ции одного показателя, которая объясняется вариацией другого показателя. Так, например, если определен коэф­фициент корреляции между результатом в прыжках в дли­ну и бегом на 30 м, равный - 0,777, то коэффициент детер­минации будет равен:

D = (-0,777)2∙100% = 60,3%

Следовательно, можно предполагать, что 60,3 % вза­имосвязи спортивного результата в прыжках в длину и в беге на 30 м объясняется их взаимовлиянием. Остальная часть (100% - 60,3 %=39,7%) вариации объясняется вли­янием других неучтенных факторов. Таким образом, Вы можете рассчитать «свои» коэффици­енты детерминации и интерпретировать их по аналогии с вышеописанным.

Вычисление рангового коэффициента корреляции. В некоторых случаях невозможно определить ко­личественные значения признаков. Например, невозможно определить комплексную характеристику веде­ния боя у фехтовальщиков, однако можно установить последовательность в оценке фехтовальщиков, исходя из количества выигранных боев. Этот же пример можно отнести к гимнастам, борцам, игровикам и т.д. В таких случаях применяется ранговый коэффициент корреля­ции. Наименование корреляции «ранговая» связано с понятием «ранг», т.е. имеющий порядковый номер. Кро­ме того, ранговый коэффициент корреляции позволяет измерить степень сопряженности между признаками не­зависимо от закона распределения. Поэтому он исполь­зуется для быстрой оценки взаимосвязи, когда показа­тели или признаки не могут быть измерены точно, но могут быть ранжированы.

Во всех этих случаях корреляционную связь между признаками можно оценить при помощи рангового коэффициента корреляции Спирмена (обозначается греческой ρ («ро»). Его вычисляют по формуле:

, (12)

где d = dx - dy - разность рангов данной пары показателей х и у, n - объем выборки.

Ранговый коэффициент имеет те же свойства, что и коэффициент Пирсона, и поэтому статистические выводы соответствуют статистическим выводам коэффициента Пирсона.

Пример 1. При выполнении программ одиночного ката­ния места среди фигуристов распределились по порядку в обязательных хz и произвольных уz упражнениях. Существует ли связь между распределением мест в произвольных и обязательных упражнениях?

Исходные данные и основные расчеты приведены в таблице 7.

Таблица 7

Взаимосвязь распределения произвольных и обязательных упражнений

№ п/п

1

2

3

4

5

6

7

хz (dx)

1

2

3

4

5

6

7

-

уz (dу)

2

1

3

5

6

4

7

-

dxdу

-1

1

0

-1

-1

2

0

-

(dxdу)2

1

1

0

1

1

4

0

8

1. Проранжируем (упорядочим и присвоим порядковые номера) показатели х и у (строки 2 и 3), в строки 2 и 3 заносим соответствующие испытуемым ранги по тому или иному показателю.

2. Вычисляем разность рангов dxdу в строке 4.

3. Вычисляем квадраты разности рангов (dxdу)2 и определяем их сумму в строке 5.

4. Вычисляем ρ, подставив полученные значения в формулу (12):

Полученный коэффициент ранговой корреляции ρ = 0,86 свидетельствует о тесной взаимосвязи. Статистический вывод. Поскольку ρ = 0,86, то связь между признаками есть, она - тесная, положительная.

Педагогический вывод. У наблюдаемых спортсменов отмечается тесная связь между выполняемыми произвольными и обязательными упражнениями.

Расположение исходных данных по рангу можно осуществить и тогда, когда они выражены в абсолютных числах. В этом случае, оценивая величины их показателей, назначают им ранги.

Рассмотрим пример, в котором ранги назначаются на основании расположения по порядку абсолютных величин.

Пример 2. Время отталкивания гандболиста при броске мяча хi (с); результативность броска мяча в ворота - уi (% за игру).

Оцените, существует ли связь между этими показателями у вось­ми спортсменов. Исходные данные и основные расчеты приведе­ны в таблице 8.

Таблица 8

Взаимосвязь между временем отталкивания при броске и результативностью попадания мяча в ворота

№ п/п

хi

уi

dx

dу

dxdу

(dxdу)2

1

0,18

24,2

1,5

8

-6,5

42,25

2

0,18

24,9

1,5

7

-5,5

30,25

3

0,17

25,6

3

6

-3,0

9,00

4

0,16

26,7

4

5

-1,0

1,00

5

0,15

27,8

5,5

4

1,5

2,25

6

0,15

28,4

5,5

3

2,5

6,25

7

0,14

29,9

7

2

5,0

25,00

8

0,13

30,5

8

1

7,0

49,00

Всего

-

-

-

-

-

165,00

Напомним, что, как и в случае с критериями согласия, в выборочном методе равным значениям наблюдаемых величин присваиваются одинаковые ранги. С этой целью соответствующие ранги делятся между ними поровну.

Так, признак хi содержит первые два одинаковых значения, равные 0,18, поэтому места между ними делятся поровну: . Если значения были бы неодинаковыми, то они заняли бы I и II порядковые места. Показатель 0,17 занимает следующее после них III место. На IV месте - показатель 0,16; на V и VI - два одинаковых значения 0,15, которые имеют ранг 5,5, т.е. , и т.д.

Аналогичным образом назначаем ранги признаку уi. Учитывая, что в первом случае (т.е. у признака хi) ранги назначались от боль­шего числа к меньшему (от 0,18 к 0,13), тот же принцип соблюдается и для признака у, - наименьший ранг (I место) следует назначить наибольшему числу, равному 30,5.

Остальные вычисления производятся так же, как и в приме­ре 1. Ранговый коэффициент

Статистический вывод. Между рассмотренными признаками хi и уi существует тесная корреляционная связь обратного вида.

Педагогический вывод. У испытуемых наблюдается закономер­ность: чем быстрее они отталкиваются при броске (меньшее время отталкивания), тем точнее они попадают в ворота.

Поскольку в основу вычисления ран­гового коэффициента корреляции положены значения последова­тельности расположения объектов, а не собственно значения объек­тов, то теснота связи определяется слабее и точность исследований снижается, однако возрастает скорость обработки информации.

Следует подчеркнуть, что вычисление рангового ко­эффициента корреляции рекомендуется проводить в том случае, когда связанных пар больше пяти и когда доста­точно получить лишь приблизительную информацию. В тех случаях, когда признаки поддаются количественному учету и есть основание считать, что их распределение под­чинено нормальному закону распределения, преимуще­ство должно оставаться за параметрическим коэффици­ентом Пирсона, как более мощным и надежным в прак­тической работе.

Степень достоверности статистических показателей. В практике исследовательской работы решение той или иной задачи не обходится без сравнения. Сравнивать приходится данные контрольной и экспериментальной групп, показатели спортсменов до и после серии тренировок, различные меняющиеся с возрастом характеристики физической подготовленности и развития у школьников за несколько лет и т.д. Во всех этих и подобных случаях наличие существенного различия между параметрами совокупностей укажет на принципиальное отличие в группах по рассматриваемому признаку.

Чтобы решать вопрос об истинной значимости различий, наблюдаемых между выборочными средними, исходят из статистических гипотез - предположений или допущений о неизвестных генеральных параметрах, которые могут быть проверены на основании выборочных показателей. Поскольку в науке результаты исследований и вытекающие из них выводы никогда не принимаются со 100%-й уверенностью, т.е. всегда имеется некоторый риск в интерпретации результатов, который связан с существованием каких-то случайных причин. Экспериментатор может выбрать уровень значимости (обозначается р или α) - значение вероятности, при котором различия, наблюдаемые между выборочными показателями, можно считать несущественными, случайными. Самыми распространенными уровнями значимости в спортивных исследованиях являются 0,05 и 0,01, каждому из которых соответствует определенное значение надежности или доверительной вероятности (Р), а именно 0,95 (95%) и 0,99 (99%). Уровень значимости 0,05 указывает на то, что в силу случайности возможна ошибка в 5% случаев, т.е. не чаще, чем 5 раз в 100 наблюдениях. Если нужна большая доказательность (достоверность) результатов, то уровень значимости должен быть повышен до 0,01. Чем цифра меньше, тем уровень значимости, а следовательно, и достоверность результатов (степень доверия) выше. При уровне значимости 0,01 вывод не обоснован только в одном случае из 100.

Оценку статистической достоверности производят при помощи специальных методов - критериев значимости. Следует знать, что критерии бывают параметрические (Стьюдента, Фишера) и непараметрические (Уайта, Вилкоксона, Ван дер Вардена и др.). Первые применимы («работают») лишь в тех случаях, когда генеральная совокупность, из которой взята выборка, распределяется нормально, а параметры сравниваемых групп равны между собой (σ12). В действительности же эти условия выполняются не всегда, и в таких случаях корректнее применять непараметрические критерии, где оценка на достоверность связана с ранжированием исходных данных. В студенческих работах (и не только в них) на это часто закрывают глаза и используют во всех случаях только t-критерий Стьюдента. Кроме того, следует учитывать, что часто пытаются с помощью одной и той же формулы найти достоверность различий как между двумя независимыми группами (контрольной и экспериментальной), так и при определении изменений, происходящих с течением времени, когда сравнивают данные, зарегистрированные на той же группе «до» и «после», не учитывая, что выборки в этом случае коррелированы.

Статистическая достоверность имеет существенное значение в расчетной практике физической культуры и спорта. Ранее было отмечено, что из одной и той же генеральной совокупности может быть избрано множество выборок:

- если они подобраны корректно, то их средние показатели и показатели генеральной совокупности незначительно отличаются друг от друга величиной ошибки репрезентативности с учетом принятой надежности;

- если они избираются из разных генеральных совокупностей, различие между ними оказывается существенным. В статистике по­всеместно рассматривается сравнение выборок;

- если они отличаются несущественно, непринципиально, не­значительно, т.е. фактически принадлежат одной и той же гене­ральной совокупности, различие между ними называется стати­стически недостоверным.

Статистически достоверным различием выборок называется выборка, которая различается значимо и принципиально, т.е. при­надлежит разным генеральным совокупностям.

В физической культуре и спорте оценка статистической достоверности различий выбо­рок означает решение множества практических задач. Например, введение новых методик обучения, программ, комплексов упраж­нений, тестов, контрольных упражнений связано с их экспери­ментальной проверкой, которая должна показать, что испытуе­мая группа принципиально отлична от контрольной. Поэтому при­меняют специальные статистические методы, называемые крите­риями статистической достоверности, позволяющие обнаружить наличие или отсутствие статистически достоверного различия между выборками.

Оценка достоверности различий средних несвязанных (независимых) выборок. В большинстве исследований по спорту могут решаться задачи на выявление эффективности той или иной методики обучения и тренировки с применением определенных средств, приемов и способов организации занятий. Решение подобных задач осуществляется путем проведения сравнительного эксперимента с выделением различных групп, результаты которых в теории статистики принято называть независимыми (несвязанными). В практике спорта в таких случаях наиболее востребованным является t-критерий Стьюдента.

Критерий Стьюдента назван в честь английского ученого К. Госсета (Стьюдент - псевдоним), открывшего данный метод. Критерий Стьюдента является параметрическим, используется для сравнения абсолютных показателей выборок. Выборки могут быть различными по объему. Критерий Стьюдента определяется следующим образом:

1. Находим критерий Стьюдента t по формуле:

(13)

где , - средние арифметические сравниваемых выборок;

т1, m2ошибки репрезентативности, выявленные на основании показателей сравниваемых выборок.

2. Практика физической культуры и спорта показывает, что для спортивной работы достаточно принять надежность счета Р = 0,95.

Для надежности счета: Р= 0,95 (α = 0,05), при числе степеней свободы k = n1 + п2 - 2 по таблице приложения находим величину критического (стандартного) значения критерия (tкр).

3. На основании свойств нормального закона распределения критерия Стьюдента осуществляется сравнение t и tкр.

Делаем выводы:

- если ttкр, то различие между сравниваемыми выборками статистически достоверно;

- если t < tкр, то различие статистически недостоверно.

Для исследователей в области физической культуры и спорта оценка статистической достоверности является первым шагом в решении конкретной задачи: принципиально или непринципиально различаются между собой сравниваемые выборки. Последующий шаг заключается в оценке этого различия с педагогической точки зрения, что определяется условием задачи.

Рассмотрим применение критерия Стьюдента на конкретно примере.

Пример. Группа испытуемых оценена на ЧСС (уд./мин) в количестве 18 человек до xi и в количестве 16 человек после yi разминки.

Оценить эффективность разминки по показателю ЧСС. Исходные данные и расчеты представлены в таблицах 9,10.

Таблица 9

Обработка показателей ЧСС до разминки

№ п/п

xi

ni

xi ni

xi-

(xi- )2

(xi- )2 ni

1

150

1

150

-7

49

49

2

154

3

462

-3

3

9

3

156

5

780

-1

1

5

4

158

4

632

1

1

4

5

160

3

480

3

9

27

6

164

2

328

7

49

98

Всего

-

18

2832

-

-

192

Таким образом, до разминки показатели группы составили: ± σх = (157 ± 3) уд./мин.

Таблица 10

Обработка показателей ЧСС после разминки

№ п/п

yi

ni

yi ni

yi-

(yi- )2

(yi- )2 ni

1

164

2

328

-5

25

50

2

166

3

498

-3

9

27

3

169

4

676

0

0

0

4

170

3

510

1

1

3

5

172

2

344

3

9

18

6

174

2

348

5

25

50

Всего

-

16

2704

-

-

148

Таким образом, после разминки показатели группы составили ± σу = (169±3) уд./мин.

Теперь определим обе ошибки репрезентативности. Выявляется различие между средними показателями и некоей огромной генеральной совокупностью N=∞, которая нам фактически не­известна и из которой избрана первая xi а затем вторая yi выборки.

Для определения ошибки используем формулу (7), так как число членов генеральной совокупности неизвестно (N = ∞) и объем выборки мал (менее 20 элементов). Таким образом,

; .

Ошибки по обеим группам совпали, так как объемы выборок равны (исследуется одна и та же группа при различных условиях), а средние квадратические отклонения составили σх = σу = 3 уд./мин.

Переходим к определению критерия Стьюдента:

Задаем надежность счета: Р = 0,95.

Число степеней свободы k = n1 + п2 - 2 = 18 + 16 - 2 = 32. По таблице приложения находим tгр = 2,04.

Статистический вывод. Поскольку t = 11,88, а критическое tкр = 2,04, то 11,88 > 2,04, т.е. t > tгр, поэтому различие между выбор­ками статистически достоверно.

Педагогический вывод. Установлено, что по показателю ЧСС различие между состоянием группы до и после разминки является статистически достоверным, т.е. значимым, принципиальным. Итак, по показателю ЧСС можно сделать вывод, что разминка эффективна.

Оценка достоверности различий средних связанных (зависимых) выборок. В исследованиях часто на одних и тех же спортсменах проводятся измерения через некоторое время (до и после тренировки, этапа подготовки, определенного воздействия экспериментальной методики и т.п.), а также в различных условиях (на уровне моря или в условиях высокогорья и т.д.). При этом стараются определить, произошли ли изменения в состоянии спортсменов. В данной ситуации не применяют некоторые выше описанные методы, в этом случае смысл проверки достоверности заключается в следующем.

1. Наблюдаемое значение критерия (t) рассчитывают по формуле:

, (14)

где - среднее значение разности (d) сравниваемых пар ( );

- ошибка средней репрезентативности, вычисляемая по формуле 6.

2. Критическое значение (tкр) находится по таблице (см. приложение) для определенного уровня значимости и числа степеней свободы (k = n -1). В данном случае число степеней свободы на единицу времени меньше числа сравниваемых пар.

Пример. Измерялся результат прыжка в высоту с места до нагрузки (пробегание марафонской дистанции) (Х1, см) и после нагрузки (Х2, см) у пяти спортсменов. Определить достоверность влияния нагрузки на результат в прыжке.

Таблица 11

Расчет достоверности различий средних связанных выборок

п/п

Результаты до нагрузок (х1)

Результаты после нагрузок (х2)

Разность (d)

Отклонение от средней ( )

Квадраты отклонений

( )2

1

2

3

4

5

6

1

55

40

15

4

16

2

65

60

5

-6

36

3

60

50

10

-1

1

4

70

60

10

-1

1

5

65

50

15

4

16

-

-

55

-

70

1. Определяем разность соответствующих пар (столбец 4) и их сумму:

∑d = 15 + 5 + 10 + 10 + 15 = 55.

2. Определяем среднее значение разности пар

3. Вычисляем отклонение разности от средней (столбец 5).

4. Вычисляем квадраты отклонений и их сумму (столбец 6).

5. Вычисляем стандартное отклонение σ по формуле (3):

6. Находим ошибку средней md, вычисляемой по формуле (6):

7. Определяем t по формуле (14):

8. Находим tкр по приложению и сравниваем его с t.

tкр = 4,60 (при р = 0,01 и k = 5 - 1 = 4); t > tкр (5,26>460).

Это означает, что нагрузка влияет на результат в прыжках в высоту с места, т.е. с вероятностью 99% можно утверждать, что разница между средними величинами статистически существенна и не случайна.

Что касается технологии применения непараметрических критериев, то желающие воспользоваться последними могут обратиться к специальной литературе. А для изучения явлений, не имеющих количественного выражения, довольно объективным и удобным в расчетах является метод экспертных оценок.