Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
KPOSI1 / ЛР3. Анализ формы распределения данных и расчет показателей центральной тенденции рядов распределения в MS Excel.docx
Скачиваний:
90
Добавлен:
20.04.2015
Размер:
1.33 Mб
Скачать

Лабораторная работа 3. Анализ формы распределения данных и расчет показателей центральной тенденции рядов распределения в ms Excel

В MS Excel есть возможность анализа формы рядов распределения и расчета показателей их центральной тенденции (среднего значения, моды, медианы, экстремумов (максимального и минимального значений)). Для их вычисления применяются статистические функции и инструмент Анализ данных.

Ряды распределения строятся с целью изучения состава исследуемой совокупности, ее однородности, колеблемости значений признаков и границ их изменения. На основе рядов распределения рассчитываются относительные величины структуры и средние показатели.

Ряд распределения в статистике  это ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, значения которого расположены в определенной последовательности.

Ряд распределения включает два элемента:

1. варианты (х) отдельные возможные значения признака;

2. частоты или веса (f) – это численность отдельных групп, т.е. числа, которые показывают, сколько раз данное значение признака встречается в исследуемой совокупности.

Правила построения ряда распределения аналогичны правилам построения группировки. Но иногда при наличии достаточно большого количества вариантов значений признака ряд распределения является трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов в возрастающем (или убывающем) порядке.

При проведении эмпирического исследования ряда распределения рассчитываются и анализируются следующие группы показателей:

• показатели формы распределения;

• показатели положения центра распределения;

• показатели степени его однородности.

Для анализа формы рядов распределения чаще всего используют их графическое изображение. Для изображения рядов применяются линейные графики и плоскостные диаграммы, построенные в прямоугольной системе координат.

В статистике выделяют две формы распределения данных: нормальную и несимметричную.

Нормальное распределение (термин был впервые введен Гальтоном в 1889 г.), иногда называемое гауссовским, можно представить в виде симметричной кривой в форме колокола (рис. 3.1). Такая кривая представляет идеальный набор данных, что редко встречается на практике.

Рис. 3.1. Кривая нормального распределения

Тем не менее, нормальное распределение играет большую роль в статистике. С помощью графического изображения статистических данных важно определить, являются ли данные нормально распределенными, т.к. только в случае распределения близкого к нормальному можно использовать стандартные статистические процедуры, в противном случае полученные результаты анализа данных могут быть неточными или неверными.

На практике же чаще всего встречаются несимметричные формы распределения. Для решения этой проблемы в статистике используют специальное преобразование, которое переводит несимметричное распределение в более симметричное. Наиболее распространенным типом преобразования данных в экономике является логарифмирование, которое заключается в замене каждого значения ряда данных его десятичным или натуральным логарифмом.

В статистике могут встречаться одновершинные и многовершинные кривые распределения.

Однородные совокупности описываются одновершинными распределениями, а многовершинность распределения свидетельствует о неоднородности изучаемой совокупности или о некачественном выполнении группировки.

Одновершинные кривые распределения делятся на симметричные, умеренно асимметричные и крайне асимметричные.

К показателям положения центра распределения относятся степенная средняя (средняя арифметическая) и структурные средние – мода и медиана.

Мода и медиана являются дополнительными к средней величине характеристиками совокупности, по ним также можно судить о форме рядов распределения.

Если значение средней величины совпадает с модой и медианой, то ряд является симметричным. На практике строго симметричные ряды встречаются довольно редко, чаще исследователю приходится иметь дело с асимметричными рядами.

Для характеристики асимметрии используют коэффициенты асимметрии.

Простейшим показателем асимметрии может служить разность между средней арифметической величиной и модой.

Если AS = <0, то в ряду имеет место правосторонняя асимметрия, если AS = >0, то – левосторонняя.

Для симметричных распределений может быть рассчитан показатель эксцесса, который показывает, насколько резкий скачок имеет изучаемое явление.

Если показатель эксцесса больше нуля, то распределение островершинное и скачок считается значительным, если коэффициент эксцесса меньше нуля, то распределение считается плосковершинным и скачок считается незначительным.

Однородность статистических совокупностей характеризуется величиной вариации (рассеяния) признака, т.е. несовпадением его значений у разных статистических единиц. Для измерения вариации в статистике используются абсолютные и относительные показатели.