Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по спорт. метрологии.docx
Скачиваний:
238
Добавлен:
26.03.2015
Размер:
146.17 Кб
Скачать

Основы теории тестов

Измерение или испытание, проводимое с целью определения состояния или способностей спортсмена, называется тестом. Не всякие измерения могут быть использованы как тесты, а только те, которые отвечают специальным требованиям: стандартность, наличие системы оценок, надежность, информативность, объективность. Тесты, удовлетворяющие требованиям надежности, информативности и объективности, называют добротными.

Процесс испытания называется тестированием, а полученные в итоге измерения числовые значения – результатом тестирования.

Тесты, в основе которых лежат двигательные задачи, называют двигательными или моторными. В зависимости от задания, которое стоит перед исследуемым, различают три группы двигательных тестов.

Разновидности двигательных тестов

Название теста

Задание спортсмену

Результат теста

Пример

Контрольное упражнение

Показать максимальный результат

Двигательные достижения

Бег на 1500 м, время бега

Стандартные функциональные пробы

Одинаковое для всех, дозируется: 1)по величине выполненной работы; 2) по величине физиологических           сдвигов

Физиологические или биохимические показатели при стандартной работе Двигательные показатели при стандартной величине физиологических сдвигов

Регистрация ЧСС при стандартной работе 1000 кГм/мин Скорость бега при ЧСС 160 уд/мин

Максимальные функциональные пробы

  Показать максимальный результат

Физиологические или биохимические показатели

Определение максимального кислородного долга или максимального потребления кислорода

Иногда используется не один, а несколько тестов, имеющих единую конечную цель. Такая группа тестов называется батареей тестов.

Известно, что даже при самой строгой стандартизации и точной аппаратуре результаты тестирования всегда несколько варьируют. Поэтому, одним из важным условий подбора добротных тестов является их надежность.

Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях. Различают четыре основные причины вызывающие внутрииндивидуальной или внутригрупповой вариации результатов тестирования:

  • изменение состояния испытуемых (утомление, изменение мотивации и т.п.); неконтролируемые изменения внешних условий и аппаратуры;

  • изменение состояния человека, проводящего или оценивающего тест (самочувствие, замена экспериментатора и т.п.);

  • несовершенство теста (например, заведомо несовершенные и малонадежные тесты – штрафные броски в баскетбольную корзину до первого промаха и т.п.).

Критерием надежности теста может служить коэффициент надежности, рассчитанный как отношение истинной дисперсии к дисперсии, зарегистрированной в опыте: r = истинная s2/ зарегистрированная s2, где под истинным значением понимают дисперсию, полученную при бесконечно большом числе наблюдений в одинаковых условиях; регистрируемая дисперсия выводится из опытных исследований. Иными словами, коэффициент надежности есть просто доля истинной вариации в той вариации, которая зарегистрирована в опыте.

Кроме этого коэффициента используют еще индекс надежности, который рассматривают как теоретический коэффициент корреляции или связи между зарегистрированным и истинным значениями одного и того же теста. Этот способ наиболее распространен как критерий оценки качества (надежности) теста.

Одной из характеристик надежности теста является его эквивалентность, что отражает степень совпадения результатов тестирования одного и того же качества (например, физического) разными тестами. Отношение к эквивалентности тестов зависит от конкретной задачи. С одной стороны, если два или больше тестов эквивалентны, их совместное применение повышает надежность оценок; с другой – представляется возможным применить только один эквивалентный тест, что упростит тестирование.

Если все тесты, входящие в какую-либо батарею тестов, высокоэквивалентны, они называются гомогенными  (например, для оценки качества прыгучести гомогенными, надо полагать, будут прыжки с места в длину, вверх, тройным). Наоборот, если в комплексе нет эквивалентных тестов (как например, для оценки общей физической подготовленности), то все тесты входящие в него, измеряют разные свойства, т.е. по существу комплекс является гетерогенным.

Надежность тестов может быть повышена до определенной степени путем:

  • более строгой стандартизацией тестирования;

  • увеличения числа попыток;

  • увеличение числа оценщиков и повышения согласованности их мнений;

  • увеличения числа эквивалентных тестов;

  • лучшей мотивации испытуемых.

Объективность теста есть частный случай надежности, т.е. независимость результатов тестирования от лица, проводящего тест.

Информативность теста – это степень точности, с какой он измеряет свойство (качество спортсмена), для оценки которого используется. В разных случаях одни и те же тесты могут иметь разную информативность. Вопрос об информативности теста распадается на два частных вопроса:

Что изменяет данный тест?   Как точно он измеряет?

Например, можно ли по такому показателю, как МПК, судить о подготовленности бегунов-стайеров, и если можно, то с какой степенью точности? Можно ли использовать этот тест в процессе контроля?

Если тест используется для определения состояния спортсмена в момент обследования, то говорят о диагностической информативности теста. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена, говорят  о прогностической информативности. Тест может быть диагностически информативен, а прогностически нет и наоборот.

Степень информативности может характеризоваться количественно – на основе опытных данных (так называемая эмпирическая информативность) и качественно – на основе содержательного анализа ситуации (логическая информативность). Хотя в практической работе логический, или содержательный анализ всегда должен предшествовать математическому. Показателем информативности теста служит коэффициент корреляции, рассчитанный для зависимости - критерия от результата в тесте, и наоборот (в качестве критерия берется показатель, заведомо отражающий то свойство, которое собираются измерять с помощью теста).

В случаях недостаточности информативности какого-либо теста прибегают к использованию батареи тестов. Однако последнее, даже при наличие высоких раздельных критериев информативности (судя по коэффициентам корреляции), не позволяет получить единое число. Здесь на помощь может прийти более сложный метод математической статистики – факторный анализ. Который позволяет определить, сколько и какие тесты совместно действуют на отдельный фактор и какова степень их вклада в каждый фактор. А затем уже легко выбрать тесты (или их комбинации), которые наиболее точно оценивают отдельные факторы.

1 Что называется тестом?

Количественная оценка какого-либо качества или состояния спортсмена Измерение или испытание, проводимое с целью определения состояния или способностей спортсменаПроцесс испытания, во время которого количественно оценивается какое-либо качество или состояние спортсменаНужного определения нет

2 Что называется тестированием?

Количественная оценка какого-либо качества или состояния спортсмена Измерение или испытание, проводимое с целью определения состояния или способностей спортсменаПроцесс испытания, во время которого количественно оценивается какое-либо качество или состояние спортсменаНужного определения нет

3 Что называется результатом теста?

Количественная оценка какого-либо качества или состояния спортсмена Измерение или испытание, проводимое с целью определения состояния или способностей спортсменаПроцесс испытания, во время которого количественно оценивается какое-либо качество или состояние спортсменаНужного определения нет

4 К какой разновидности тестов относится бег на 100 м?

Контрольное упражнение Функциональная пробаМаксимальный функциональный тест

5 К какой разновидности тестов относится кистевая динамометрия?

Контрольное упражнение Функциональная пробаМаксимальный функциональный тест

6 К какой разновидности тестов относится проба МПК?

Контрольное упражнение Функциональная пробаМаксимальный функциональный тест

7 К какой разновидности тестов относится трехминутный бег под метроном?

Контрольное упражнение Функциональная пробаМаксимальный функциональный тест

8 К какой разновидности тестов относится максимальное количество подтягиваний на перекладине?

Контрольное упражнение Функциональная пробаМаксимальный функциональный тест

9 В каком случае считается тест информативным?

Способность теста к воспроизведению результатов при повторном испытании Способность теста измерять интересующее качество спортсменаНезависимость результатов тестирования от лица, проводящего тест

10 В каком случае считается тест надежным?

Способность теста к воспроизведению результатов при повторном испытании Способность теста измерять интересующее качество спортсменаНезависимость результатов тестирования от лица, проводящего тест

11 В каком случае считается тест объективным?

Способность теста к воспроизведению результатов при повторном испытании Способность теста измерять интересующее качество спортсменаНезависимость результатов тестирования от лица, проводящего тест

12 Какой критерий необходим при оценке теста на информативность?

Критерий Т-Стьюдента Критерий F-ФишераКоэффициент корреляцииКоэффициент детерминацииДисперсия

13 Какой критерий необходим при оценке теста на надежность?

Критерий Т-Стьюдента Критерий F-ФишераКоэффициент корреляцииКоэффициент детерминацииДисперсия

14 Какой критерий необходим при оценке теста на объективность?

Критерий Т-Стьюдента Критерий F-ФишераКоэффициент корреляцииКоэффициент детерминацииДисперсия

15 Как называют информативность теста, если при его помощи оценивают степень тренированности спортсмена?

Логической ПрогностическойЭмпирическойДиагностической

16 Какой информативностью контрольных упражнений руководствуется тренер, отбирая детей в свою спортивную секцию?

Логической ПрогностическойЭмпирическойДиагностической

17 Нужен ли корреляционный анализ для оценки информативности тестов?

Да Нет

18 Нужен ли факторный анализ для оценки информативности тестов?

Да Нет

19 Можно ли оценить с помощью корреляционного анализа надежность теста?

Да Нет

20 Можно ли оценить с помощью корреляционного анализа объективность теста?

Да Нет

21 Будут ли эквивалентны тесты, предназначенные для оценки общей физической подготовленности?

Да Нет

22 При измерении одного и того же качества разными тестами используют тесты …

Предназначенные для измерения одного и того же качества Имеющие высокую корреляционную связь между собойИмеющие низкую корреляционную связь между собой

ОСНОВЫ ТЕОРИИ ОЦЕНОК

Для оценивания спортивных результатов часто прибегают к специальным таблицам очков. Цель таких таблиц – преобразование показанного спортивного результата (выраженного в объективных мерах) в условные очки. Закон преобразования спортивных результатов в очки называется шкалой оценок. Шкала может быть задана в виде математического выражения, таблицы или графика. Различают 4 основных типа шкал, используемых в спорте и физическом воспитании.

Пропорциональные шкалы предполагают начисление одинакового числа очков за равный прирост результатов (например, за каждые 0,1 с улучшения результата в беге на 100 м начисляется 20 очков). Такие шкалы используются в современном пятиборье, конькобежном спорте, гонках на лыжах, лыжном двоеборье, биатлоне и других видах спорта.

Регрессирующие шкалы предполагают начисление, за один и тот же прирост результата по мере возрастания спортивных достижений, все меньшее число очков (например, за улучшение результата в беге на 100 м с 15, 0 до 14.9 с добавляют 20 очков, а за 0,1 с в диапазоне 10,0-9,9 с – только 15 очков).

Прогрессирующие шкалы. Здесь чем выше спортивный результат, тем большей прибавкой очков оценивается его улучшение (например, за улучшение времени в беге от 15,0 до 14,9 с добавляют 10 очков, а от 10,0 до 9,9 с – 100 очков). Прогрессирующие шкалы применяются в плавании, отдельных видах легкой атлетики, тяжелой атлетике.

Пропорциональные шкалы предполагают начисление одинакового числа очков за равный прирост результатов (например, за каждые 0,1 с улучшения результата в беге на 100 м начисляется 20 очков). Такие шкалы используются в современном пятиборье, конькобежном спорте, гонках на лыжах, лыжном двоеборье, биатлоне и других видах спорта.

Регрессирующие шкалы предполагают начисление, за один и тот же прирост результата по мере возрастания спортивных достижений, все меньшее число очков (например, за улучшение результата в беге на 100 м с 15, 0 до 14.9 с добавляют 20 очков, а за 0,1 с в диапазоне 10,0-9,9 с – только 15 очков).

Прогрессирующие шкалы. Здесь чем выше спортивный результат, тем большей прибавкой очков оценивается его улучшение (например, за улучшение времени в беге от 15,0 до 14,9 с добавляют 10 очков, а от 10,0 до 9,9 с – 100 очков). Прогрессирующие шкалы применяются в плавании, отдельных видах легкой атлетики, тяжелой атлетике.

Сигмовидные шкалы редко используются в спорте, но широко применяются при оценке физической подготовленности (например, так выглядит шкала стандартов физической подготовленности населения США). В этих шкалах улучшение результатов в зоне очень низких и очень высоких достижений поощряются скупо; больше всего очков приносит прирост результатов в средней зоне достижений.

Основными задачами оценивания являются:

  • сопоставить разные достижения в одном и том же задании;

  • сопоставить достижения в разных заданиях;

  • определить нормы.

Нормой в спортивной метрологии называется граничная величина результата, служащая основой для отнесения спортсмена к одной из классификационных групп. Существует три вида норм: сопоставительные, индивидуальные, должные.

Сопоставительные нормы имеют в своей основе сравнение людей, принадлежащих к одной и той же совокупности. Например, разбиение людей на подгруппы по степени устойчивости (высокой, средней, низкой) или реактивности (гиперреактивные, нормореактивные, гипореактивные) к гипоксии.

Разные градации оценок и норм

Оценка

Границы

Процент испытуемых

Нормы в шкалах

Словесная

в баллах

Z-шкала

Т-шкала

Перцентильная

Очень низкая

1

Ниже М - 2

2,27

 

 

 

Низкая

2

От М - 2 до М - 1

13,59

-2,0

30

2,5

Ниже средней

3

От М-1 до М–0,5

14,99

-1,0

40

16

Средняя

4

От М–0,5 до М+0,5

38,29

-0,5

45

31

Выше средней

5

От М+0,5 до М+1

14,99

+0,5

55

69

Высокая

6

От М+1 до М+2

13,59

+1,0

60

84

Очень высокая

7

Выше М+2

2,27

+2,0

70

97,5

Эти нормы характеризуют лишь сравнительные успехи испытуемых в данной совокупности, но ничего не говорят о совокупности в целом (или в среднем). Поэтому сопоставительные нормы должны сравниваться с данными, полученными на других совокупностях, и использоваться в сочетании с индивидуальными и должными нормами.

Индивидуальные нормы основаны на сравнении показателей одного и того же спортсмена в разных состояниях. Например, во многих видах спорта нет зависимости между собственным весом тела и спортивным результатом. У каждого спортсмена есть индивидуально оптимальный вес, соответствующий состоянию спортивной формы. Эту норму можно контролировать на разных этапах спортивной подготовки.

Должные нормы основаны на анализе того, что должен уметь человек, чтобы успешно справляться с задачами, которые перед ним ставит жизнь. Примером этому могут служить нормативы отдельных комплексов по физической подготовке, должные величины ЖЕЛ, основного обмена, массы и роста тела, и т.п.

1 Можно ли прямым методом измерить качество выносливости?

Да Нет

2 Можно ли прямым методом измерить качество быстроты?

Да Нет

3 Можно ли прямым методом измерить качество ловкости?

Да Нет

4 Можно ли прямым методом измерить качество гибкости?

Да Нет

5 Можно ли прямым методом измерить силу отдельных мышц?

Да Нет

6 Может ли оценка выражаться в качественной характеристике (хорошо, удовлетворительно, плохо, зачет и т.п.)?

Да Нет

7 Есть ли разница между шкалой измерений и шкалой оценок?

Да Нет

8 Что называется шкалой оценок?

Система измерения спортивного результата Закон преобразования спортивных результатов в очкиСистема оценивания норм

9 Шкала предполагает начисление одинакового числа очков за равный прирост результатов. Это …

Прогрессирующая шкала Регрессирующая шкалаПропорциональная шкалаСигмовидная шкала

10 За один и тот же прирост результата начисляют по мере возрастания спортивных достижений всё меньшее число очков. Это …

Прогрессирующая шкала Регрессирующая шкалаПропорциональная шкалаСигмовидная шкала

11 Чем выше спортивный результат, тем большей прибавкой очков оценивается его улучшение. Это …

Прогрессирующая шкала Регрессирующая шкалаПропорциональная шкалаСигмовидная шкала

12 Улучшение результатов в зонах очень низких и очень высоких достижений поощряется скупо; больше всего очков приносит прирост результатов в средней зоне достижений. Это …

Прогрессирующая шкала Регрессирующая шкалаПропорциональная шкалаСигмовидная шкала

13 Нормы, имеющие в своей основе сравнение людей, принадлежащих к одной и той же совокупности, называются …

Индивидуальными нормами Должными нормамиСопоставительными нормами

14 Нормы, основанные на сравнении показателей одного и того же спортсмена в разных состояниях, называются …

Индивидуальными нормами Должными нормамиСопоставительными нормами

15 Нормы, основанные на анализе того, что должен уметь делать человек, чтобы справляться с поставленными перед ним задачами, называются …

Индивидуальными нормами Должными нормамиСопоставительными нормами

ОСНОВНЫЕ ПОНЯТИЯ КВАЛИМЕТРИИ

Квалиметрия (лат. qualitas – качество, metron – мера) изучает и разрабатывает количественные методы оценки качественных признаков.

В основе квалиметрии лежит несколько исходных положений:

-любое качество можно измерить;

-качество зависит от ряда свойств, образующих “древо качества” (например, древо качества исполнения упражнений в фигурном катании состоит из трех уровней – высшего, среднего, низшего);

-каждое свойство определяется двумя числами: относительным показателем и весомостью; сумма весомостей свойств на каждом уровне равна единице (или 100%).

Методические приемы квалиметрии делятся на две группы:

- эвристические (интуитивные), основанные на экспертных оценках и анкетировании;

- инструментальные.

Экспертной называется оценка, получаемая путем выяснения мнений специалистов. Характерные примеры экспертизы: судейство в гимнастике и фигурном катании на коньках, конкурс на лучшую научную работу и т.п.

Проведение экспертизы включает следующие основные этапы: формирование ее цели, подбор экспертов, выбор методики, проведение опроса и обработку полученной информации, в том числе оценку согласованности индивидуальных экспертных оценок. При экспертизе большое значение имеет степень согласованности мнений экспертов, оцениваемая по величине рангового коэффициента корреляции (в случае нескольких экспертов). Следует заметить, что ранговая корреляция лежит в основе решения многих задач квалиметрии, поскольку позволяет осуществлять математические расчеты с качественными признаками.

На практике показателем квалификации эксперта часто служит отклонение его оценок от средних оценок группы экспертов.

Анкетированием называется метод сбора мнений посредством заполнения анкет. Анкетирование наряду с интервью и беседой относится к методам опроса. В отличие от интервью и беседы анкетирование предполагает письменные ответы лица, заполняющего анкету – респондента, - на систему стандартизированных вопросов. Оно позволяет изучать мотивы поведения, намерения, мнения и т.п.

С помощью анкетирования можно решать многие практические задачи в спорте: оценка психологического статуса спортсмена; его отношение к характеру и направленности тренировочных занятий; межличностные отношения в команде; собственная оценка технико-тактической подготовленности; оценка рациона питания и многие другие.

1 Что изучает квалиметрия?

Изучает качества тестов Изучает качественные свойства признакаИзучает и разрабатывает количественные методы оценки качества

2 Математические методы, применяемые в квалиметрии?

Парная корреляция Ранговая корреляцияДисперсионный анализ

3 С помощью каких методов оценивается уровень работоспособности?

Метод анкетирования Метод экспертных оценокМетод не указан

4 С помощью каких методов оценивается разнообразие технических элементов?

Метод анкетирования Метод экспертных оценокМетод не указан

5 С помощью каких методов оценивается сложность технических элементов?

Метод анкетирования Метод экспертных оценокМетод не указан

6 С помощью каких методов оценивается психологическое состояние спортсмена?

Метод анкетирования Метод экспертных оценокМетод не указан