
- •Часть I
- •Введение
- •Глава 1. Первичная обработка эксперимента
- •1.1. Статистическое наблюдение
- •1.2. Группировка статических данных
- •1.2.1. Виды группировок
- •1.2.2. Методика проведения группировок
- •1.2.3. Статистические ряды распределения
- •1.3. Формы представления статистических данных
- •1.3.1. Статистические таблицы
- •1.3.2. Статистические графики
- •1.4. Первичная обработка выборки
- •1.4.1. Построение вариационного ряда на основе группировочного признака
- •1.4.2. Графические представления вариационного ряда
- •1.4.3. Построение аналитической группировки
- •1.5. Задания для самостоятельной работы
- •2. Статистические показатели
- •2.1. Классификация статистических показателей
- •2.2. Абсолютные и относительные величины
- •2.2.1. Абсолютные величины (показатели)
- •2.2.2. Относительные величины (показатели)
- •2.3. Средние показатели
- •2.3.1. Сущность и значение средней величины
- •2.3.2. Виды средних величин
- •Распределение цветков лютиков по числу чашелистиков
- •Распределение студентов по росту
- •Рассмотрим основные свойства средней арифметической:
- •2.3.3. Структурные средние величины
- •Распределение проданной обуви по размерам
- •2.4. Показатели вариации
- •2.4.1. Абсолютные показатели вариации
- •2.4.2. Относительные показатели вариации
- •2.5. Показатели формы распределения
- •2.5.1. Асимметрия
- •2.5.2. Эксцесс
- •2.6. Расчет числовых характеристик
- •2.6.1. Числовые характеристики вариационного ряда
- •2.6.2. Анализ взаимосвязи
- •2.7. Задачи для самостоятельной работы
- •Рекомендуемая Литература
- •Приложение
2.5.2. Эксцесс
Д
ля
симметричных распределений может быть
рассчитан показатель эксцесса
(островершинности). Эксцесс представляет
собой выпад вершины эмпирического
распределения вверх или вниз от вершины
кривой нормального распределения. Для
островершинных кривых показатель
эксцесса будет положителен, а для
плосковершинных – отрицательным (рис.
2.4).
Для определения эксцесса можно пользоваться упрощенной формулой, предложенной Линдбергом:
Е = П – 38,9, (2.46)
где П – доля количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту и другую сторону от , %.
Но наиболее точным является показатель, вычисляемый по формуле
,
(2.47)
где
– центральный момент четвертого порядка,
определяемый следующим образом:
,
(2.48)
здесь xi – i-й вариант изучаемого признака; ni – частота, соответствующая варианту xi; – средняя величина признака.
Средняя квадратическая ошибка эксцесса рассчитывается по формуле
,
(2.49)
где n – число наблюдений.
Показатели асимметрии и эксцесса характеризуют лишь форму распределения признака в пределах изучаемой совокупности, однако их определение имеет не только описательное значение. Часто асимметрия и эксцесс определяют направление дальнейшего исследования явления. Например, появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности. Кроме того, эти показатели позволяют сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения, для которых оба показателя равны нулю.
2.6. Расчет числовых характеристик
Расчет числовых характеристик для вариационного ряда и аналитической группировки, полученным по исходным данным, указанным в п. 1.4, проведем, используя данные, представленные в приложении.
2.6.1. Числовые характеристики вариационного ряда
Расчет числовых характеристик проведем, используя несгруппированые и сгруппированные данные.
Среднюю арифметическую величину вычислим:
– по несгруппированным данным, применив формулу средней арифметической простой (2.8):
см,
где
(см. итоговую строку табл. 1.17); n
= 45 – объем выборки;
– сгруппированным данным для вариационного ряда, представленного в табл. 1.15, предварительно вычислив середину каждого интервала. Применим формулу средней арифметической взвешенной (2.9):
Средние, полученные по сгруппированным и несгруппированым данных, несколько различаются. Для выборок большого объема данные различия будут несущественными, но целесообразнее проводить расчеты по исходным несгруппированным данным.
Расчеты следует проводить либо по сгруппированным, либо по несгруппированным данным, в противном случае можно получить некорректные результаты.
Дисперсию и среднее квадратическое отклонение определим:
– по несгруппированным данным по формуле 2.24:
,
см.
Для
вычисления
была использована программа "Microsoft
Office
Excel",
так как "вручную" такие расчеты
выполнять очень сложно;
– сгруппированным данным по формуле 2.25а:
,
см.
Коэффициент вариации рассчитаем по формуле 2.38:
– по несгруппированным данным:
;
– сгруппированным данным:
.
Показатели асимметрии определим по сгруппированным данным по формуле 2.43:
;
Оценим существенность асимметрии распределения, используя формулу 2.45:
;
.
Таким образом, асимметрия существенна и распределение признака в генеральной совокупности несимметрично, что согласуется с выводами, сделанными в процессе анализа структуры вариационного ряда и вида гистограммы.
Так как распределение является несимметричным, эксцесс для него не рассчитывают.
Медиану рассчитаем:
– по несгруппированным данным. В исходной выборке нечетное число членов (n = 45), поэтому медианой является вариант, расположенный в середине ранжированного ряда, имеющий № 23. Следовательно, Me = 2,6 см;
– сгруппированным
данным по формуле 2.20.
Медианным будет являться второй интервал
(2,3–2,6), так как накопленная частота
(табл. 1.15) данного интервала (30) превышает
половину объема выборки (45:2 = 22,5).
Следовательно, xMe
= 2,3, hMe
= 0,3,
,
,
nMe
= 19, тогда
Моду рассчитаем по формуле 2.19. Модальным является интервал с наибольшей частотой, т. е. второй интервал 2,3–2,5 (табл. 1.15). Следовательно, xMo = 2,3, hMo = 0,3, nMo = 19, nMo – 1 = 11, nMo + 1 = 9, тогда