
- •Введение
- •1Глава.Понятие статистических рядов распределения и их виды
- •1.1 Вариационные ряды распределения
- •Атрибутивные ряды распределения
- •1.3. Медиана и мода - структурные (распределительные) средние величины
- •1.4.Моменты распределения
- •2Глава. Расчетная часть
- •3Глава. Аналитическая часть
- •Заключение
- •Используемой литературы
1.3. Медиана и мода - структурные (распределительные) средние величины
Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.
Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда.
Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.
Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин. Для нашего случая медиана равна (7+10) : 2= 8,5.
То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле
где n - число единиц в совокупности.
Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений.
Численное значение медианы обычно определяют по формуле:
где xМе - нижняя граница медианного интервала;
i - величина интервала;
S-1 - накопленная частота интервала, которая предшествует медианному;
f - частота медианного интервала.
Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.
Чтобы найти конкретное значение моды, необходимо использовать формулу
где,
где xМо - нижняя граница модального интервала;
iМо - величина модального интервала;
fМо - частота модального интервала;
fМо-1 - частота интервала, предшествующего модальному;
fМо+1 - частота интервала, следующего за модальным.
Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.
1.4.Моменты распределения
Центральные моменты распределения.
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели получили название центральных моментов распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 1), или просто моментов (нецентральные моменты используются редко и здесь не будут рассматриваться). Величина третьего момента ц-, зависит, как и его знак, от преобладания положительных кубов отклонений над отрицательными кубами либо наоборот. При нормальном и любом другом строго симметричном распределении сумма положительных кубов строго равна сумме отрицательных кубов.
Показатели асимметрии.
На основе момента третьего порядка можно построить показатель, характеризующий степень асимметричности распределения:
формула 1.
γ1 называют коэффициентом асимметрии. Он может быть рассчитан как по сгруппированным, так и по несгруппированным данным.
Английский статистик К. Пирсон на основе разности между средней величиной и модой предложил другой показатель асимметрии:
формула
2.
Таблица 1.
Центральные моменты
По данным табл. 1.показатель Пирсона составил:
Показатель Пирсона зависит от степени асимметричности в средней части ряда распределения, а показатель асимметрии, основанный на моменте третьего порядка, - от крайних значений признака. Таким образом, в нашем примере в средней части распределения асимметрия более значительна. Распределения с сильной правосторонней и левосторонней (положительной и отрицательной) асимметрией показаны на рис. 1.
Характеристика эксцесса распределения.
С помощью момента четвертого порядка характеризуется еще более сложное свойство рядов распределения, чем асимметрия, называемое эксцессом.
Рис. 1. Асимметрия, распределения
Показатель эксцесса рассчитывается по формуле:
формула
3
Часто эксцесс интерпретируется как «крутизна» распределения, но это неточно и неполно. График распределения может выглядеть сколь угодно крутым в зависимости от силы вариации признака: чем слабее вариация, тем круче кривая распределения при данном масштабе. Не говоря уже о том, что, изменяя масштабы по оси абсцисс и по оси ординат, любое распределение можно искусствен но сделать «крутым» и «пологим». Чтобы показать, в чем состоит эксцесс распределения, и правильно его интерпретировать, нужно сравнить ряды с одинаковой силой вариации (одной и той же величиной σ) и разными показателями эксцесса. Чтобы не смешать эксцесс с асимметрией, все сравниваемые ряды должны быть симметричными. Такое сравнение изображено на рис. 2.
Рис.2. Эксцесс распределений
Для вариационного ряда с нормальным распределением значе- i ний признака показатель эксцесса, рассчитанный по формуле (3), j равен трем.
Однако такой показатель не следует называть термином «эксцесс», что в переводе означает «излишество». Термин «эксцесс» следует применять не к самому отношению по формуле (3), а к сравнению такого отношения для изучаемого распределения с величиной данного отношения нормального распределения, т.е. с величиной 3. Отсюда окончательные формулы показателя эксцесса, т.е. излишества в сравнении с нормальным распределением при той же силе вариации, имеют вид:
для ранжированного ряда:
формула
4.
для интервального и дискретного вариационного ряда:
формула
5.
Наличие положительного эксцесса, как и ранее отмеченного значительного различия между малым квартальным расстоянием и большим средним квадратическим отклонением, означает, что в изучаемой массе явлений существует слабо варьирующее по данному признаку «ядро», окруженное рассеянным «гало». При существенном отрицательном эксцессе такого «ядра» нет совсем.
По значениям показателей асимметрии и эксцесса распределения можно судить о близости распределения к нормальному, что бывает существенно важно для оценки результатов корреляционного и регрессионного анализа, возможностей вероятностной оценки прогнозов (см. главы 7,8,9). Распределение можно считать нормальным, а точнее говоря - не отвергать гипотезу о сходстве фактического распределения с нормальным, если показатели асимметрии и эксцесса не превышают своих двукратных средних квадратических отклонений Стц, и <т^. Эти средние квадратические отклонения вычисляются по формулам:
формула
6 и 7.