Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Семинар статистические методы / Семинар по методам статистики.docx
Скачиваний:
47
Добавлен:
28.03.2015
Размер:
139.16 Кб
Скачать

Описательная статистика

Статистическая обработка цифровых данных начинается с группировки. Для этого, прежде всего, необходимо расположить данные каждой выборки в возрастающем порядке.

Многие данные принимают одни и те же значения, причем одни значения встречаются чаще, другие – реже. Графически распределение можно представить в столбиковые диаграммы. При этом распределение данных по их значениям дает уже больше информации, чем простое представление в виде рядов. Подобную группировку используют в основном лишь для качественных данных, четко разделяющихся на обособленные категории.

Средние показатели результатов

В результате исследований, связанных с массовыми явлениями, получают много числовых данных. Возникает проблема - найти такие характеристики, которые довольно полно характеризовали бы полученный числовой материал. Характеристики, которые базируются на данных массовых наблюдений, называют обобщающими показателями. Важнейшие среди обобщающих показателей - средние величины, т. е. такие значения признака, вокруг которых группируются отдельные наблюдаемые значения элементов. Отсюда и название - меры центральной тенденции.

Средние объема характеризуются тем, что их числовое значение изменяется при изменении значения любого члена совокупности. Обычно в качестве объемного среднего в педагогическом исследовании применяют арифметическое среднее, реже применяют гармоническое, квадратическое и хронологическое среднее.

Средняя арифметическая – наиболее часто используемый показатель центральной тенденции, вычисляется при делении суммы всех значений на число этих данных.

Среднее арифметическое дает возможность:

  • охарактеризовать исследуемую совокупность одним числом;

  • сравнить отдельные величины со средним арифметическим;

  • определить тенденцию развития какого-либо явления;

  • сравнить разные совокупности;

  • вычислить другие статистические показатели

Применяется, если распределение параметров расположено симметрично по отношению к середине

Совокупность характеризуется посредством среднего арифметического в том случае, если распределение параметров расположено симметрично по отношению к середине. При асимметричном распределении или многовершинном полигоне частот среднее арифметическое не подходит для описания совокупности. В таких случаях для характеристики совокупности лучше пользоваться модой.

Ею пользуются в тех случаях, когда хотят охарактеризовать явление на основе значения признака, встречающегося чаще всего. При изготовлении детской мебели, например, за основу берется мода (рост, вес ребенка, встречающиеся в данной возрастной группе чаще всего), а не средние арифметические данные детей. Идеально подходит для номинальных шкал.

В малых совокупностях чисел мода, как правило, нестабильна. Например, для совокупности 2, 2, 2, 3, 4, 4 мода равна 2, но если одну из оценок 2 заменить оценкой 4, то мода станет равной 4.

Принято считать, что в случае, когда все значения оценок встречаются одинаково часто, совокупность данных моды не имеет. Например, в совокупности 2, 2, 3, 3, 4, 4, 5, 5 моды нет.

Медиану применяют в том случае, когда хотят определить точную середину ряда. Некоторые интервалы особенно большой частоты могут в значительной мере повлиять на среднее арифметическое. Преимуществом медианы является то, что на нее такие чрезвычайные интервалы не влияют. Т.е. На нее не влияют «большие» и «малые» оценки.

Некоторые совокупности результатов педагогических измерений просто не имеют центральной тенденции. Это наблюдается для многомодальных совокупностей оценок (имеющих две и более моды). Например, для совокупностей оценок 2, 2, 2, 2, 2, 4, 4, 4, 4, 4 среднее и мода равна трем, несмотря на то, что даже не существует учащегося с такой оценкой. Ни среднее, ни медиана не в состоянии дать правильного представления об успеваемости этой группы. Более правильное представление об успеваемости этой группы дает словесное описание: «50% в группе имеют оценки «2», а остальные – хорошие». Последнее на языке статистики может быть выражено так: гистограмма бимодальна, т.е. имеет две моды, одна равна 2, другая – 4.

Разброс полученных данных в положительную и отрицательную сторону от средней величины обозначается буквой d, а вычисляется через отклонение каждого значения от средней (), затем вычисляют среднюю арифметическую всех этих отклонений. Чем она больше, тем больше разброс данных и тем более разнородна выборка. Если эта средняя невелика, то это свидетельствует в пользу того, что данные больше сконцентрированы относительно их среднего значения и выборка более однородна.

Стандартное отклонение показывает, насколько далеко от средней разбросаны результаты в положительную и отрицательную стороны. Укладывается ли этот разброс результатов в стандартное отклонение, которое равно 68% популяции.