Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Казакова.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.8 Mб
Скачать

2.5.2. Эксцесс

Д ля симметричных распределений может быть рассчитан показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. Для островершинных кривых показатель эксцесса будет положителен, а для плосковершинных – отрицательным (рис. 2.4).

Для определения эксцесса можно пользоваться упрощенной формулой, предложенной Линдбергом:

Е = П – 38,9, (2.46)

где П – доля количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту и другую сторону от , %.

Но наиболее точным является показатель, вычисляемый по формуле

, (2.47)

где – центральный момент четвертого порядка, определяемый следующим образом:

, (2.48)

здесь xii-й вариант изучаемого признака; ni – частота, соответствующая варианту xi; – средняя величина признака.

Средняя квадратическая ошибка эксцесса рассчитывается по формуле

, (2.49)

где n – число наблюдений.

Показатели асимметрии и эксцесса характеризуют лишь форму распределения признака в пределах изучаемой совокупности, однако их определение имеет не только описательное значение. Часто асимметрия и эксцесс определяют направление дальнейшего исследования явления. Например, появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности. Кроме того, эти показатели позволяют сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения, для которых оба показателя равны нулю.

2.6. Расчет числовых характеристик

Расчет числовых характеристик для вариационного ряда и аналитической группировки, полученным по исходным данным, указанным в п. 1.4, проведем, используя данные, представленные в приложении.

2.6.1. Числовые характеристики вариационного ряда

Расчет числовых характеристик проведем, используя несгруппированые и сгруппированные данные.

Среднюю арифметическую величину вычислим:

– по несгруппированным данным, применив формулу средней арифметической простой (2.8):

см,

где (см. итоговую строку табл. 1.17); n = 45 – объем выборки;

– сгруппированным данным для вариационного ряда, представленного в табл. 1.15, предварительно вычислив середину каждого интервала. Применим формулу средней арифметической взвешенной (2.9):

Средние, полученные по сгруппированным и несгруппированым данных, несколько различаются. Для выборок большого объема данные различия будут несущественными, но целесообразнее проводить расчеты по исходным несгруппированным данным.

Расчеты следует проводить либо по сгруппированным, либо по несгруппированным данным, в противном случае можно получить некорректные результаты.

Дисперсию и среднее квадратическое отклонение определим:

– по несгруппированным данным по формуле 2.24:

,

см.

Для вычисления была использована программа "Microsoft Office Excel", так как "вручную" такие расчеты выполнять очень сложно;

– сгруппированным данным по формуле 2.25а:

,

см.

Коэффициент вариации рассчитаем по формуле 2.38:

– по несгруппированным данным:

;

– сгруппированным данным:

.

Показатели асимметрии определим по сгруппированным данным по формуле 2.43:

;

Оценим существенность асимметрии распределения, используя формулу 2.45:

;

.

Таким образом, асимметрия существенна и распределение признака в генеральной совокупности несимметрично, что согласуется с выводами, сделанными в процессе анализа структуры вариационного ряда и вида гистограммы.

Так как распределение является несимметричным, эксцесс для него не рассчитывают.

Медиану рассчитаем:

– по несгруппированным данным. В исходной выборке нечетное число членов (n = 45), поэтому медианой является вариант, расположенный в середине ранжированного ряда, имеющий № 23. Следовательно, Me = 2,6 см;

– сгруппированным данным по формуле 2.20. Медианным будет являться второй интервал (2,3–2,6), так как накопленная частота (табл. 1.15) данного интервала (30) превышает половину объема выборки (45:2 = 22,5). Следовательно, xMe = 2,3, hMe = 0,3, , , nMe = 19, тогда

Моду рассчитаем по формуле 2.19. Модальным является интервал с наибольшей частотой, т. е. второй интервал 2,3–2,5 (табл. 1.15). Следовательно, xMo = 2,3, hMo = 0,3, nMo = 19, nMo – 1 = 11, nMo + 1 = 9, тогда