В каком случае нужны математические и статистические методы обработки результатов? Только когда у вас есть данные для обработки, а значит вам нужно организовать диагностический эксперимент.
Диагностический эксперимент включает в себя:
1) планирование диагностики выделение диагностических критериев, показателей и методик, обоснование последовательности проведения диагностических методик;
2)описание диагностических процедур: время, место, обстоятельства, выборка и способы ее отбора, корректировка последовательности и процедуры диагностирования в зависимости от получаемых данных;
3)обработку данных:полученные «сырые» данные, их классификация, статистическая обработка, табличное и/или графическое представление, интерпретация, выводы.
Планирование диагностики (например, по компонентам). По каждому компоненту, вы выбираете критерии оценки. Каждый критерий характеризуется показателями. Для измерения каждого показателя подбирается методика.
Отбор диагностических методик
Одна методика может диагностировать несколько показателей и показатели могут перепроверяться разными методиками.
Диагностические методики берутся в готовом виде с указанием на источник (автора методики), корректируются или разрабатываются свои.
В случае корректировки или разработки собственной методики (теста) должно быть представлено обоснование вносимых корректив, а также доказательства сохранения ее валидности, надежности, репрезентативности и достоверности.
Валидность–это устойчивость результатов теста к систематическим искажениям со стороны посторонних свойств. Высокая валидность свидетельствует о соответствии методики измеряемому свойству. Для определения степени валидностим необходимо сравнить результаты теста с некоторым критерием, который является источником заведомо более валидной информации об измеряемом свойстве.
Надежность– это устойчивость показателей измерения относительно случайных, «шумовых» факторов или относительно объекта измерения.
Репрезентативность (представительность) данных – это устойчивость распределения при переходе от выборки стандартизации к выборке популяции. Признаком такой устойчивости является нормальное распределение данных.
Достоверность – это устойчивость результатов по отношению к фальсификации, т.е. сознательным или бессознательным мотивационным искажениям результатов со стороны испытуемого. К таким искажениям относится склонность давать социально одобряемые ответы.
Сбор материалов диагностического эксперимента
1. Создать перечень заимствованных диагностических методик с указанием их авторов и источников, где они описаны. В тексте диссертации достаточно указать цели и специфику применения таких методик.
2.Описать модифицированные и авторские методики. По модифицированным методикам указать источник, откуда получена взятая за основу методика.
3. По каждой проведенной методике должны быть:
собраны все материалы (например, опросник и заполненные анкеты, протоколы наблюдений или тестовые материалы или указание на место их хранения);
проведена их обработка (сводные таблицы, классификация данных, их статистическая обработка)
Обработка материалов диагностического эксперимента
Подготовка данных к первичному анализу
Математические расчеты
Содержательный анализ данных (интерпретация результатов расчетов) и получение выводов
Графическое представление обработанных результатов
Подготовка данных к обработке
все данные формулируются и записываются в необходимой краткой форме;
проводится группировка данных в соответствии с интересующими экспериментатора признаками и той моделью, которая разрабатывалась при составлении плана-программы (линейный, параллельный или перекрестный эксперимент);
устанавливаются характеристики (признаки, параметры каждой группы данных и производится подсчет абсолютного числа факторов, характеризующих группу (число учащихся, уроков, отметок, ответов и т.д.);
проектируется и заполняется электронная база данных (с помощью MS Excel, MS Access, IBM SPSS Statistics и др.)
Самый сложный этап - Математическая и статистическая обработка. Разобраться во всех тонкостях за семинар невозможно, поэтому мы разберем только самые элементарные вещи.
Не следует преувеличивать значение применения статистических методов. Статистика не раскрывает педагогической сущности явлений. Этими средствами можно лишь констатировать статистически достоверные различия между двумя исследуемыми явлениями, но объяснение сущности причинно-следственных отношений этих различий должно осуществляться методами теоретического анализа. Статистика не требуется при углубленном изучении отдельного, единичного явления, но статистика необходима при рассмотрении совокупности явлений, состоящих из множества отдельных элементов.
Имеются три главных раздела статистики: описательная статистика, индуктивная статистика, измерение корреляции.
Описательная статистиканаправлена на то, чтобы описывать, подытоживать и воспроизводить в виде таблиц или графиков данные того или иного распределения, вычислять среднее для данного распределения, его размах и дисперсию.
Индуктивная статистиканеобходима тогда, когда требуется проверить, можно ли распространить результаты, полученные на данной выборке, на всю популяцию, из которой взята эта выборка. То есть, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономерность, обнаруженную при изучении ограниченной группы в ходе какого-либо наблюдения или эксперимента. Следовательно, индуктивная статистика необходима после получения эмпирических данных, на этапе обобщения и конструирования выводов.
Тот раздел статистики, в котором даются правила измерения корреляции, необходимо применять с целью изучения степени связи между собой двух переменных с тем, чтобы можно было предсказывать возможные значения одной из них, если известна другая.
Степень корреляции значений двух переменных может быть вычислена двумя способами: с применением параметрических и с помощью непараметрических методов (тестов). Наиболее широкое применение находят параметрические методы. Название «параметрические» методы возникло от того, что при этом методе сравнивают параметры распределения средних показателей таких, как среднее значение или дисперсия данных. Непараметрические методы используются в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; их достоинство в простоте расчетов и применения.
Обоснованный выбор как параметрических методов, так и непараметрических в процессе педагогического исследования во многом определен полученными экспериментальными данными.
Данные в статистике– это основные элементы, подлежащие анализу. Данными могут быть количественные результаты, любая информация, которая может быть классифицирована или разбита на категории с целью обработки.
Существуют три вида статистических данных. Количественные данные, получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирования), их можно распределить по шкале с равными интервалами.Порядковые данные, которые получаются при упорядочивании количественных данных в возрастающей последовательности (1-й, ..., 7-й, ..., 100-й, ...; А, Б, В, ...).Качественные данные,представляющие собой свойства, признаки элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число учащихся башкир, татар, русской национальности и др.; учителя со средним специальным, высшим педагогическим образованием, без педагогического образования; учителя мужского и женского пола).
Только количественные данные подлежат анализу посредством параметрических методов, в основе которых лежат параметры (такие, например, как средняя арифметическая). Но и то лишь тогда, когда число этих данных достаточно, чтобы проявилось нормальное распределение. Для использования параметрических методов в принципе необходимы три условия: данные должны быть количественными, их число должно быть достаточным, а их распределение – нормальным. Во всех остальных случаях всегда рекомендуется использовать непараметрические методы.
Математическая и статистическая обработка в педагогических исследованиях
Математические методы: регистрация, ранжирование, шкалирование.
Статистические методы: среднее арифметическое; медиана; мода; степень рассеивания – дисперсия, стандартное отклонение или среднее квадратическое отклонение и др.
Основные статистические понятия
Совокупность всех объектов данного вида, над которыми проводятся наблюдения с целью получения значений определенной случайной величины, называется генеральной совокупностью
Выборочной совокупностью (выборкой) называется совокупность объектов, отобранных случайным образом из генеральной совокупности.
Выборка должна быть реперзентативной, если она не сплошная.
Во-первых, необходимо определить минимальное число объектов, необходимых для того, чтобы при измерении их характерных особенностей начал действовать закон больших чисел, что именуется условием массовости выборки. Соблюдение данного условия необходимо для получения надежных выводов.
Во-вторых, необходимо обдумать соблюдение качественной представительности выборки. Под качественной представительностью выборки понимается подбор такой группы объектов, в которой отражены все основные свойства генеральной совокупности.
Репрезентативная выборка имеет достаточно большой объем и отражает основные свойства генеральной совокупности. Требование репрезентативности соблюдается лишь при случайном отборе объектов в выборке.
1. Осуществление выборки случайным образом: любой объект выбирается случайно из генеральной совокупности, и все объекты имеют одинаковую вероятность попасть в выборку.
2. Стратифицированный отбор. В выборку попадают представители из всех выделенных групп (стратов) исследуемых, в зависимости от доли каждой из групп (страт) в генеральной совокупности. Например, требуется исследовать учащихся младших, средних и старших классов, а также учащихся с плохой, средней и хорошей успеваемостью, с учетом места жительства в городе или сельской местности. Во избежание увеличения объема выборки стратифицированный отбор предполагает обследование каждой из этих групп учащихся в отдельности с последующим объединением результатов обследования.
3. Серийным называется отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию.
Статистическая достоверность(статистическая значимость) результатов исследования. Это требование связано с определением адекватного объема выборки.
Общие рекомендации:
наибольший объем выборки необходим для разработки диагностической методики (200 – 1000/2500 человек);
при сравнении двух выборок их общая численность должна быть не менее 50 человек, примерно поровну в каждой.
Осторожнее с выводами! Нельзя распространить, выводы, полученные на основании исследования выборочной совокупности учеников средней школы, на студентов, и наоборот
Частота показывает сколько респондентов выбрали данный ответ или получили данный результат. Абсолютная выражается в числах, относительная – в процентах.
Распределение показывает группировку данных по группам относительно какого-либо признака
Шкалирование
Номинальная шкалаиспользуется для регистрации самого низшего уровня измерений, предполагающего наличие минимальных предпосылок для измерения. При измерениях на данном уровне практически не используются числа. Здесь важно установить подобие или различие объектов по некоторому признаку, т. е. при этом имеют дело с качественными данными. Рассмотрим примеры.
- Распределения учащихся по классам, по половому признаку, по месту жительства, по видам спорта, которыми они занимаются, по числу детей в семье являются примерами величин номинальной шкалы. При этом возможно распределение учащихся по двум или более признакам (двумерные или многомерные данные).
Шкала порядка(порядковая, ранговая, ординальная) предназначена для измерения (обозначения) степени различия какого-либо признака или свойства у разных объектов. Самым ярким примером порядковой шкалы является пятибалльная система оценки ЗУН учащихся. Интервалы между отдельными баллами не отражают разрыва между реальными результатами. Мы знаем только, что ученик, получивший оценку "5" по какому-то предмету, знает этот предмет лучше того, кто получил "4". Но нельзя утверждать, что различие в знаниях этих учащихся такое же, как и в знаниях тех, кто получил "4" и "3". Так как шкала оценок является порядковой шкалой, то некорректно выставлять итоговую оценку как среднюю арифметическую текущих оценок.
3начительно труднее применять порядковую шкалу для количественных оценок других качеств личности (в воспитательном процессе). Имеется несколько разновидностей порядкового шкалирования(измерения):
· ранжирование (в ряд),
· группировка (ранжирование по группам),
· парное сравнение,
· метод рейтинга,
· метод полярных профилей.
Ранжирование.Изучаемые объекты располагаются в ряд (упорядочиваются) по степени выраженности какого-либо качества. Первое место в этом ряду занимает объект с наиболее высоким уровнем данного качества, и ему присваивается наивысший балл (числовое значение выбирается произвольно). Затем каждому объекту ранжированного ряда присваиваются более низкие оценки, соответствующие занимаемым местам.
Группировкавсей совокупности объектов наблюдения в несколько рангов, достаточно ясно отличающихся друг от друга постепени измеряемого признака. Пример: учащиеся класса согласно пятибалльной системе оценки ЗУН делятся на отличников, хорошистов и т. д.
Парное сравнение.Учащиеся сопоставляются друг с. Другом (каждый с каждым) по какому-либо качеству. Если они одинаковы, то каждый получает по баллу. Если у одного этого качества больше, чем у другого, первый получает два балла, второй – 0 (как при спортивных играх по круговой системе). Суммируя полученные каждым баллы, получаем количественное выражение уровня развития данного качества у каждого учащегося (его ранг).
Рейтинг.В этом приеме оценка объекта производится путем усреднения оценочных суждений группой компетентных экспертов. Имея общие критерии оценки (в порядковой шкале, в баллах), эксперты независимо друг от друга (в устной или письменной форме) выносят свои суждения. Усредненный результат экспертной оценки является достаточно объективным и называется рейтингом.
Метод полярных профилей. Этот прием предполагает применение для оценки условной шкалы, крайними точными которой являются противоположные значения признака (например, добрый – злой, теплый – холодный и т. п.). Промежуток между полюсами делится на произвольное количество частей (баллов).
Пример 3. Согласие с высказыванием дается в полярной шкале:(Полностью согласен) 5 – 4 – 3 – 2 – 1 (Совсем не согласен)
3. Интервальная шкала (интервальное намерение, метрическая) – это такое присвоение чисел объектам, когда определено расстояние между объектами и предусмотрена общая для всех объектов постоянная единица измерения. Иначе говоря, в интервальной шкале вводится единица и масштаб измерения. Нулевая точка шкалы выбирается произвольно.Пример 4. Температурные шкалы; шкалы стандартизированного тестирования интеллекта.
Интервальная шкала – количественная. В ней возможны все арифметические действия над числами, кроме операции деления. Таким образом, в интервальной шкале нельзя определить во сколько раз один объект больше или меньше другого. Например, если ученик ответил правильно на 10 заданий, то это не означает, что он знает вдвое больше ученика, ответившего на 5 заданий теста.
4. Шкала отношений(метрическая) отличается от интервальной только тем, что ее нулевая точка не произвольна, а указывает на полное отсутствие измеряемого свойства. Сюда относятся и все количественные данные, получаемые пересчетом объектов какого-либо множества (число учащихся, уроков и т. п.).
Уровни измерения и математические вычисления, используемые на данных уровнях, показаны в таблице ниже. Из этой таблицы видно, что переход от одного уровня к другому сопровождается расширением класса допустимых математико-статистических операций.
Как следует из таблицы, наилучшей является шкала отношений, которую на сегодняшний день удалось реализовать только в рамках физических измерений.
Шкала отношений, илишкала пропорций, дает возможность устанавливать отношения значений измеряемого признака благодаря тому, что значению шкалы "0" соответствует величина, для которой измеряемый признак отсутствует. Другими словами, начало отсчета на этих шкалах выбирают непроизвольно. Примерами шкалы отношений являются меры длины (м, см и т. д.) и массы (кг, г и т. д.). Предмет длиной 100 см вдвое длиннее предмета длиной 50 см.

