Описательная статистика
Статистическая обработка цифровых данных начинается с группировки. Для этого, прежде всего, необходимо расположить данные каждой выборки в возрастающем порядке.
Многие данные принимают одни и те же значения, причем одни значения встречаются чаще, другие – реже. Графически распределение можно представить в столбиковые диаграммы. При этом распределение данных по их значениям дает уже больше информации, чем простое представление в виде рядов. Подобную группировку используют в основном лишь для качественных данных, четко разделяющихся на обособленные категории.
Средние показатели результатов
В результате исследований, связанных с массовыми явлениями, получают много числовых данных. Возникает проблема - найти такие характеристики, которые довольно полно характеризовали бы полученный числовой материал. Характеристики, которые базируются на данных массовых наблюдений, называют обобщающими показателями. Важнейшие среди обобщающих показателей - средние величины, т. е. такие значения признака, вокруг которых группируются отдельные наблюдаемые значения элементов. Отсюда и название - меры центральной тенденции.
Средние объема характеризуются тем, что их числовое значение изменяется при изменении значения любого члена совокупности. Обычно в качестве объемного среднего в педагогическом исследовании применяют арифметическое среднее, реже применяют гармоническое, квадратическое и хронологическое среднее.
Средняя арифметическая – наиболее часто используемый показатель центральной тенденции, вычисляется при делении суммы всех значений на число этих данных.
Среднее арифметическое дает возможность:
охарактеризовать исследуемую совокупность одним числом;
сравнить отдельные величины со средним арифметическим;
определить тенденцию развития какого-либо явления;
сравнить разные совокупности;
вычислить другие статистические показатели
Применяется, если распределение параметров расположено симметрично по отношению к середине
Совокупность характеризуется посредством среднего арифметического в том случае, если распределение параметров расположено симметрично по отношению к середине. При асимметричном распределении или многовершинном полигоне частот среднее арифметическое не подходит для описания совокупности. В таких случаях для характеристики совокупности лучше пользоваться модой.
Ею пользуются в тех случаях, когда хотят охарактеризовать явление на основе значения признака, встречающегося чаще всего. При изготовлении детской мебели, например, за основу берется мода (рост, вес ребенка, встречающиеся в данной возрастной группе чаще всего), а не средние арифметические данные детей. Идеально подходит для номинальных шкал.
В малых совокупностях чисел мода, как правило, нестабильна. Например, для совокупности 2, 2, 2, 3, 4, 4 мода равна 2, но если одну из оценок 2 заменить оценкой 4, то мода станет равной 4.
Принято считать, что в случае, когда все значения оценок встречаются одинаково часто, совокупность данных моды не имеет. Например, в совокупности 2, 2, 3, 3, 4, 4, 5, 5 моды нет.
Медиану применяют в том случае, когда хотят определить точную середину ряда. Некоторые интервалы особенно большой частоты могут в значительной мере повлиять на среднее арифметическое. Преимуществом медианы является то, что на нее такие чрезвычайные интервалы не влияют. Т.е. На нее не влияют «большие» и «малые» оценки.
Некоторые совокупности результатов педагогических измерений просто не имеют центральной тенденции. Это наблюдается для многомодальных совокупностей оценок (имеющих две и более моды). Например, для совокупностей оценок 2, 2, 2, 2, 2, 4, 4, 4, 4, 4 среднее и мода равна трем, несмотря на то, что даже не существует учащегося с такой оценкой. Ни среднее, ни медиана не в состоянии дать правильного представления об успеваемости этой группы. Более правильное представление об успеваемости этой группы дает словесное описание: «50% в группе имеют оценки «2», а остальные – хорошие». Последнее на языке статистики может быть выражено так: гистограмма бимодальна, т.е. имеет две моды, одна равна 2, другая – 4.
Разброс
полученных данных в положительную и
отрицательную сторону от средней
величины обозначается буквой d,
а вычисляется через отклонение каждого
значения от средней (
),
затем вычисляют среднюю арифметическую
всех этих отклонений. Чем она больше,
тем больше разброс данных и тем более
разнородна выборка. Если эта средняя
невелика, то это свидетельствует в
пользу того, что данные больше
сконцентрированы относительно их
среднего значения и выборка более
однородна.
Стандартное отклонение показывает, насколько далеко от средней разбросаны результаты в положительную и отрицательную стороны. Укладывается ли этот разброс результатов в стандартное отклонение, которое равно 68% популяции.
