Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УМК по спортивной метрологии.doc
Скачиваний:
120
Добавлен:
10.11.2019
Размер:
3.46 Mб
Скачать

Лекция № 3 статистические методы обработки результатов измерений

Предметом математической статистики является анализ результатов массовых, повторяющихся измерений. Результаты таких измерений всегда более или менее отличаются друг от друга. Даже если измеряется тот же самый объект в неизменных условиях, нельзя получить одинаковых данных. Из-за многочисленных причин, не поддающихся контролю и варьирующих от одного измерения к другому, результаты измерений всегда претерпевают случайное рассеивание. Аналогичное рассеивание бывает при однотипных измерениях в группе однородных объектов (например, измерения высоты прыжка у группы школьников одного класса). Хотя результат каждого отдельного измерения при случайном рассеивании заранее предсказать нельзя, это не означает, что мы имеем дело с полным хаосом. Массовые измерения однородных объектов, обладающих качественной общностью, обнаруживают определенные закономерности. Математическая статистика создает методы выявления этих закономерностей. Выделяют три основных этапа статистических исследований.

I. Статистическое наблюдение, которое представляет собой планомерный, научно обоснованный сбор данных, характеризующих изучаемый объект. Оно должно удовлетворять следующим требованиям:

а) объекты наблюдения (в частном случае испытуемые) должны быть одинаковыми (однородными) с точки зрения их свойств (квалификация, специализация, возраст, стаж занятий и др.);

б) число объектов наблюдения должно быть достаточным, чтобы можно было выявить закономерности и обобщить их свойства.

II. Статистические сводка и группировка. Они являются важной подготовительной частью к статистическому анализу данных. Этот этап предусматривает:

а) систематизацию (группировку) данных;

б) оформление определенных статистических таблиц.

III.Анализ статистического материала. Это завершающий этап статистического подхода. Его проводят с использованием соответствующих математико-статистических методов.

ОДНОМЕРНЫЕ РЯДЫ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ

Составление рядов распределения и их графические представления

В процессе наблюдения или измерения какого-либо показателя получают ряд чисел. Численные результаты подразделяют на дискретные (от англ. discrete — прерывный) — и непрерывные. К дискретным относят число подтягиваний на перекладине, число попыток и т. д., т. е. результаты, выражаемые целым числом; к непрерывным — время прохождения дистанции, время реакции, скорость движения и т. п., т. е. результаты, которые могут выражаться дробным числом, в частности бесконечной дробью.

Будем считать, что Х1 — результат измерения изучаемого показателя у 1-го спортсмена, Х2 — у 2-го спортсмена и т. д. Всего спортсменов — п. Такой ряд результатов измерений, представленный случайными числами, называется выборочной совокупностью или выборкой. Совокупность всех значений, которые можно было бы получить для изучаемой выборки, называется генеральной совокупностью. Например, длина тела студентов одного института физической культуры — выборочная совокупность, а длина тела студентов всех институтов физической культуры России — генеральная; в то же время длина тела студентов — выборка по отношению к генеральной совокупности — всём студентам земного шара.

Генеральную совокупность мысленно можно представить так: это все объекты наблюдения (спортсмены, например), которые обладают теми же свойствами, что и объекты выборки.

Выборки большого объема разбивают на интервалы. Например, когда необходимо отобрать худших и лучших спортсменов.

Анализ вариационных рядов упрощается при графическом представлении. Рассмотрим основные графики вариационного ряда.

1.Полигон распределения. График строится в прямоугольной системе координат. Величины измеряемого показателя откладываются на оси абсцисс, частоты — на оси ординат.

2. Гистограмма распределения (рис. 3). График строится аналогично полигону распределения, однако на оси абсцисс откладываются не точки (середины интервалов), а отрезки, отображающие интервал, и вместо ординат, соответствующих частотам, или частостям отдельных вариантов, строят прямоугольники с высотой, пропорциональной частотам интервала.

3. Кумулята (кривая сумм) — рис. 4. График строится в прямоугольной системе координат. На оси ординат откладываются отрезки, длина которых пропорциональна накопленной частоте, или частости, а на оси абсцисс — значения измеряемого показателя.

Графическое представление результатов измерений не только существенно облегчает анализ и выявление скрытых закономерностей, но и позволяет правильно выбрать последующие статистические характеристики и методы.

Основные статистические характеристики ряда измерений

Рассматривая основные статистические характеристики ряда измерений (вариационного ряда), оценивают центральную тенденцию выборки и колеблемость, или вариацию. Раскроем содержание этих понятий. Центральную тенденцию выборки позволяют оценить такие статистические характеристики, как среднее арифметическое значение, мода, медиана.

Среднее арифметическое значение X для неупорядоченного ряда измерений вычисляют по формуле:

Модой (обозначается символом Мо) называют результат выборки или совокупности, наиболее часто встречающейся в этой выборке. Для интервального вариационного ряда модальный интервал выбирается по наибольшей частоте.

М е д и а н а (обозначается символом Me) — результат измерения, который находится в середине ранжированного ряда. Например, в некоторых видах спорта, где оценка спортсмену выставляется несколькими судьями (как в гимнастике), самые высокие и самые низкие оценки отбрасываются, и в зачет идет медиана. Моду и медиану используют для оценки среднего при измерении в шкалах порядка (а моду также и в номинальных шкалах).

К характеристикам вариации, или колеблемости, результатов измерений относят размах, дисперсию, среднее квадратическое отклонение, коэффициент вариации и др.

Все средние характеристики дают общую характеристику ряда результатов измерений. На практике нас часто интересует, как сильно каждый результат отклоняется от среднего значения. Однако легко можно представить, что две группы результатов измерений имеют одинаковые средние, но различные значения измерений. Поэтому средние характеристики всегда необходимо дополнять показателями вариации, или колеблемости. Самой простой характеристикой вариации является размах варьирования. Его определяют как разность между наибольшим и наименьшим результатами измерений. Однако он улавливает только крайние отклонения, но не отражает отклонений всех результатов.

Чтобы дать обобщающую характеристику, можно вычислить отклонения от среднего результата.

Среднее квадратическое отклонение (оно называется также стандартным отклонением) имеет те же единицы измерения, что и результаты измерения, т. е. характеризует степень отклонения результатов от среднего значения в абсолютных единицах. Однако для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения, эта характеристика не пригодна. Для этого используется коэффициент вариации.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах.

Коэффициент вариации имеет важное значение в спортивной метрологии, так как, будучи величиной относительной (измеряется в процентах), позволяет сравнивать между собой колеблемость результатов измерений, имеющих различные единицы измерения. Коэффициент вариации можно использовать лишь в том случае, если измерения выполнены в шкале отношений.

Выбор статистических характеристик определяется двумя основными факторами: шкалой измерений, которой пользуется исследователь, и законом распределения результатов измерений. Последний фактор рассмотрим подробнее.

Кривая нормального распределения

При анализе распределения результатов измерений (см. табл. 6) всегда делают предположение о том распределении, которое имела бы выборка, если бы число измерений было очень большим. Такое распределение (очень большой выборки) называют распределением генеральной совокупности или теоретическим, а распределение экспериментального ряда измерений — эмпирическим.

Корреляционное поле

Анализ взаимосвязи начинается с графического представления результатов измерений в прямоугольной системе координат. Предположим, что у шести испытуемых зарегистрирован такой показатель, как число подтягиваний на перекладине, до начала подготовительного периода тренировки (X) и после его окончания (Y). Запишем результаты измерений:

Для этих результатов построим график, на оси абсцисс которого отложим результаты X, а на оси ординат — результаты Y. Таким образом, каждая пара результатов в прямоугольной системе координат будет отображаться точкой (рис. 10).

Такая графическая зависимость называется диаграммой рассеяния или корреляционным полем. Визуальный анализ графика позволяет выявить форму зависимости (по крайней мере, сделать предположение). В данном случае эта форма близка к обычной геометрической фигуре — эллипсу. Такую правильную форму мы будем называть линейной зависимостью или линейной формой взаимосвязи.

Однако на практике можно встретить и иную форму взаимосвязи. Эта зависимость, экспериментально полученная при подачах в теннисе, является характерной для нелинейной формы взаимосвязи, или нелинейной зависимости.

Таким образом, визуальный анализ корреляционного поля позволяет выявить форму статистической зависимости — линейную или нелинейную. Это имеет существенное значение для следующего шага в анализе — выбора и вычисления соответствующего коэффициента корреляции.

МЕТОДЫ ВЫЧИСЛЕНИЯ КОЭФФИЦИЕНТОВ ВЗАИМОСВЯЗИ

Вычисление значения коэффициента взаимосвязи — механическая процедура счета. Однако ей должны предшествовать некоторые вопросы, на которые необходимо ответить. Эти вопросы относятся к изучаемым показателям и формулируются следующим образом: в какой шкале измеряется изучаемый показатель? Как много измерений этого показателя выполнено? Можно ли считать ряд измерений показателя выборкой', имеющей нормальный закон распределения? и Др. Как будет показано далее, каждый случай связан с вычислением определенного коэффициента взаимосвязи.

Варьирование может быть не только альтернативным, т. е. варьированием по двум классам. Классов варьирования может быть несколько. В этом случае рассчитывают так называемый полихорический коэффициент сопряженности. В этом учебнике он не описывается.

СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ И ДОСТОВЕРНОСТЬ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК

В спорте часто при анализе какого-либо явления приходится по некоторым измерениям показателя делать обобщающий вывод. Например, после тренировочного занятия 17 конькобежцев у трех наблюдается неполное восстановление. Можно ли на этом основании судить о трудности тренировочного процесса или это случайность? Наверное, если такой неприятный факт случится со всеми 17 спортсменами, сомнений в неправильном построении занятия не будет. Следовательно, в данном случае можно говорить о представительности (репрезентативности) выборки, на основании которой можно сделать вывод. Этот же вопрос можно сформулировать иначе: сколько испытуемых необходимо обследовать, чтобы получить достоверные результаты измерений? Это очень важно для исследователя, так как является необходимостью научно решаемых задач. Эти вопросы и такие, как сравнение средних результатов различных групп, оценка точности результатов измерений, оценка достоверности коэффициентов взаимосвязи и другие, решаются с использованием некоторых приемов проверки статистических гипотез.

Проверка статистических гипотез

Статистической гипотезой называется проверяемое математическими методами предположение относительно статистических характеристик результатов измерений. Статистическую гипотезу обычно обозначают Н: (утверждение).

Предположим, что нам известна (на основании обследования) средняя длина тела студентов первого курса —Х1. В то же время известно значение этого показателя для изучаемой возрастной группы в более широком масштабе, например европейском — Х0 . Значит, X, — характеристика выборки, а Х0характеристика генеральной совокупности. Предположим, что длина тела наших студентов не отличается от среднеевропейской. Статистическая гипотеза тогда запишется как Н0 : (Х{ = Х0), т. е. предполагается, что средняя длина тела студентов" равна длине тела их сверстников в масштабе Европы. Гипотеза, в соответствии с которой отсутствуют различия между сравниваемыми совокупностями, называется нулевой 0). Альтернативной ^противоположной) гипотезой (//, ) будет предположение, что Х1 > Х0 или Xt < Х0.

При сравнении статистических характеристик почти никогда не встречается случая их абсолютного равенства. В силу каких-то случайных или закономерных причин значения их отличаются друг от друга. Задача при проверке гипотез состоит в том, чтобы отличить случайные влияния от закономерных. Например, пусть среднее значение длины тела студентов в генеральной совокупности равно 175 см, а в выборочной — 176 см. Можно ли говорить на основе этих данных, что наши студенты в среднем выше испытуемых генеральной совокупности, или это различие чисто случайное и можно принять нулевую гипотезу?

Ясно, что если отклонение маленькое, то оно может быть случайным с очень большой степенью вероятности; если отклонение большое, вероятность его случайного появления мала. Можно выбрать такое критическое отклонение, вероятность появления которого по случайным причинам настолько мала, что оно практически невозможно, и поэтому если оно в действительности имело место, то это говорит о том, что гипотеза не удовлетворяет фактам. Например, если бы различия в длине тела составляли, скажем, 20 см, то, очевидно, наши испытуемые действительно выше испытуемых генеральной совокупности. Вероятность появления таких различий в силу случайных причин настолько мала, что ее можно было бы не принимать во внимание.

При проверке статистической гипотезы решение экспериментатора никогда не принимается с уверенностью, т. е. всегда существует некоторый риск принять неправильное решение. Оценка степени этого риска и представляет собой суть проверки статистической гипотезы. Ясно, что исключить на 100% этот риск невозможно. Но экспериментатор может выбрать вероятность, или уровень значимости, который характеризует вероятность отклонения, признаваемого невозможным в силу лишь случайных причин. Самыми распространенными уровнями являются: 0,001; 0,01; 0,05. Уровень 0,05 означает, что выборочное значение может встретиться в среднем не чаще чем 5 раз в 100 наблюдениях.

Величину q = 1—а называют доверительной вероятностью (при уровне значимости 0,05 доверительная вероятность равна 0,95 и т. п.). Вероятность отклонения истинного предположения называют ошибкой первого рода. Тогда вероятность принять ложное предположение называют ошибкой второго рода.

Как принятие, так и отклонение гипотезы осуществляется на основе определенного критерия. Статистическим критерием называют правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с заранее заданной вероятностью.

Чтобы систематизировать все сказанное, запишем основные этапы проверки гипотезы.

1. Формулировка гипотезы (нуль - гипотезы), которую в дальнейшем необходимо принять или отклонить.

2. Выбор уровня значимости.

3. Определение выборочного значения статистических характеристик (на основе измерения или наблюдения выборочной совокупности)."

4. Выбор критерия для проверки статистической гипотезы.

5. Сравнение расчетного значения с критическим значением критерия для выбранного уровня значимости и принятие или отклонение гипотезы.

Сравнение двух выборочных средних арифметических (несвязанные выборки)

При сравнении двух выборочных средних арифметических обычно проверяется предположение, что и первая, и вторая выборки принадлежат к одной генеральной совокупности и, следовательно, не отличаются друг от друга значимо. В этом случае бывают известны следующие статистические характеристики: Х Х2, ст1; а2 и объемы выборок /7 j и п 2 . Вначале записывается нулевая гипотеза как Н0 : (Х1 2). Далее вычисляется значение критерия t (расчетное).

Сравнение двух выборочных средних связанных выборок

В спорте часто на одних и тех же спортсменах проводится измерение через некоторое время (до и после тренировочного занятия, до и после этапа тренировки и т. п'.). При этом стараются определить, изменилось ли состояние спортсменов. В таких случаях выборки всегда равночисленны, а все измерения могут быть объединены в пары (каждая пара — это результаты измерений на одном человеке в начале и конце эксперимента). Подобные выборки называют связанными (или коррелированными): между данными первого и второго измерения может быть корреляция.

В случаях связанных выборок надо поступать так:

1) для каждого испытуемого определить разности («сдвиги») между результатами первого и второго измерений — d/. Например, если при первом измерении спортсмен мог прыгнуть вверх с места на 65 см, а во втором на 70 см, то dt =65—70= - 5 см;

2) рассчитать среднюю арифметическую разностей, т. е. все их суммировать и разделить на число испытуемых:

3) найти среднее квадратическое отклонение разностей и среднее квадратическое отклонение средней разности.

Критерием для проверки существенности различий является отношение средней разности к ее среднему квадратическому отклонению:

Оценка достоверности коэффициентов взаимосвязи

При оценке достоверности коэффициентов взаимосвязи наиболее часто встают два вопроса:

1) отличается ли данный коэффициент статистически существенно от нуля (т. е. существует ли статистическая зависимость между двумя явлениями)?

2) в каких доверительных границах лежит истинный коэффициент корреляции в генеральной совокупности?

Например, если выборочный коэффициент корреляции равен 0,35 (число испытуемых 52), можно ли с убежденностью говорить о существовании взаимосвязи или же в действительности корреляции нет, а полученное значение коэффициента обусловлено случайностями выборки? Чему равнялся бы коэффициент корреляции, если бы можно было провести исследования не на 52, а на бесконечно большем числе испытуемых?