- •Г.В. Беспалова, а.А. Федоров статистика
- •Часть I
- •1. Статистика как наука
- •1.1. Понятие статистики
- •1.2. Статистическое наблюдение
- •2. Статистическая сводка и группировка. Таблицы и графическое представление статистических данных
- •2.1. Статистическая сводка и группировка
- •2.2. Статистические таблицы
- •2.3. Графическое представление статистических данных
- •3. Статистические показатели
- •3.1. Абсолютные и относительные статистические показатели
- •3.2. Сущность и значение средних показателей
- •3.3. Средняя арифметическая и ее свойства
- •Рассмотрим расчет средней способом моментов:
- •3.4. Другие виды средних
- •1. Средняя гармоническая Средняя гармоническая взвешенная
- •2. Средняя гармоническая простая
- •4. Показатели вариации и анализ частотных распределений
- •4.1. Показатели вариации
- •I. Абсолютные показатели вариации.
- •II. Относительные показатели вариации:
- •4.2. Понятие о закономерностях распределения
- •4.3. Структурные характеристики вариационного ряда распределения
- •Сравнение средних
- •5. Выборочное наблюдение
- •5.1. Выборочное наблюдение как важнейший источник статистической информации
- •5.2. Средняя и предельная ошибки выборки
- •5.3. Способы отбора единиц в выборку
- •5.4. Определение необходимого объема выборки
- •5.5. Оценка результатов выборочного наблюдения и распространение их на генеральную совокупность
- •5.6. Малая выборка
- •Литература
- •Содержание
4.3. Структурные характеристики вариационного ряда распределения
Кроме рассмотренных средних величин в качестве статистических характеристик вариационных рядов распределения рассчитываются так называемые структурные средние – мода и медиана.
Мода (Мо) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой. Медианой (Ме) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Пример 1. Имеются данные о заработной плате рабочих бригады (у.е.):
500, 450, 300, 440, 440, 560, 440, 470, 460
Найдем моду и медиану:
1) т.к. наиболее часто встречается заработная плата, равная 440 у.е., то Мо = 440 у.е.;
2) для определения медианы необходимо упорядочить данные:
300, 440, 440, 440, 450, 460, 470, 500, 560
450 у.е. – середина ранжированного ряда, то есть Ме = 450 у.е.
Если ранжированный ряд включает четное число единиц, то медиана определяется как средняя из двух центральных значений.
Пример 2 . Имеются данные о распределении рабочих предприятия по тарифному разряду:
Тарифный разряд
|
Численность рабочих, человек
|
2 3 4 5 6 |
12 48 56 60 14 |
Всего
|
190
|
Определение моды по дискретному вариационному ряду не составляет большого труда – наибольшую частоту (60 человек) имеет 5-й тарифный разряд, следовательно, он и является модальным.
Для определения медианного значения признака по следующей формуле находят номер медианной единицы ряда (Nмe):
, (28)
где п – объем совокупности.
Полученное дробное значение, всегда имеющее место при четном числе единиц в совокупности, указывает, что точная середина находится между 95-м и 96-м рабочими. Необходимо определить, к какой группе относятся рабочие с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты. Очевидно, что рабочих с этими номерами нет в первой группе, где всего лишь 12 человек, нет их и во второй группе (12+48=60). 95-й и 96-й рабочие находятся в третьей группе (12+48+56=116), следовательно, медианным является 4-й тарифный разряд.
В отличие от дискретных вариационных рядов определение моды и медианы по интервальным рядам требует проведения определенных расчетов на основе соответствующих формул.
Сравнение средних
Три метода получения средней равнозначны. В зависимости от цели исследования распределения должна выбираться одна из упомянутых характеристик, либо же для сравнения – все три.
Средняя арифметическая широко распространена (очевидна для большинства людей). Для нее характерно то, что все отклонения от нее (положительные и отрицательные) в сумме равняются нулю. Основной недостаток: среднее может быть искажено экстремальными значениями.
Мода отражает типичный, наиболее распространенный (часто встречающийся) вариант значения признака. Недостаток: не подходит для нестандартного распределения, т.е. включающего 2 и более максимума.
Медиана практически выполняет функции средней для неоднородной, не подчиняющейся нормальному закону распределения совокупности.
Проиллюстрируем ее познавательное значение следующим примером.
Допустим, нам необходимо дать характеристику среднего дохода группы людей, насчитывающей 100 человек, из которых 99 имеют доходы в интервале от 100 до 1000 долл. в месяц, а месячные доходы последнего составляют 50 000 долл.:
№ п/п
|
1
|
2
|
3
|
4
|
|
50
|
51
|
|
99
|
100
|
Доход, долл.
|
100
|
104
|
104
|
107
|
|
162
|
164
|
|
200
|
50000
|
Если мы воспользуемся средней арифметической, то получим средний доход, равный примерно 600–700 долл., который не только в несколько раз меньше дохода 100-го человека, но и имеет мало общего с доходами остальной части группы. Медиана же, равная в данном случае 163 долл., позволит дать объективную характеристику уровня доходов 99 % данной группы людей.
Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.
В симметричных распределениях все три характеристики совпадают. Чем больше расхождение между модой и средней арифметической, тем больше асимметричен ряд.
Рассмотрим диаграмму распределения заработной платы рабочих (рис.10).
Рис.10. Распределение доходов
Данная диаграмма иллюстрирует типичное распределение доходов всех работников крупной организации. Это положительно асимметричное распределение, с областью больших отклонений в правой части диаграммы. Доходы основной массы работников представлены в левой части диаграммы. Только несколько работников имеют доходы, представленные у верхней границы диаграммы. Вот эти-то несколько работников и искажают значение средней, и «усредненное» значение, полученное путем расчета арифметической средней, превышает приемлемо репрезентативное значение. Значение моды соответствует максимальному значению частот, представленных в распределении. При такой форме распределения это значение находится в области нижних значений заработной платы и поэтому также не является полностью репрезентативным. Значение медианы, как центральное значение, выступает в роли компромиссного решения и часто считается наилучшим показателем.
Рис. 11. Сравнение распределений
На рис.11 представлены три типа распределения с соответствующими показателями трех «средних»: значения средней, моды и медианы. Эти три показателя будут находиться в соответствии друг с другом, только если распределение данных симметрично. Если распределение отрицательно асимметрично, тогда последовательность значений меняется на обратную (ii). Так, средняя будет наименьшим значением, а мода – наибольшим.