
- •Задача 1 Группировка статистических данных и анализ групп Теоритические сведения
- •Пример группировки
- •Задача 2 Использование статистических показателей в аналитических иследованиях Теоритические сведения
- •Вариант 1,2.
- •Вариант 3.
- •Вариант 4, 5.
- •Вариант 6
- •Вариант 7.
- •Вариант 8
- •Вариант9
- •Вариант 10
- •Задача 3 Статистический анализ вариационных (интервальных) данных
- •Решение
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант9
- •Вариант 10
- •Задача 4
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •Задача 5
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •Задача 6 Экономические индексы
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант8
- •Вариант 9
- •Вариант 10
- •Рекомендации по выполнению контрольных работ
Решение
Средний возраст оборудования определяется xср=∑(xi*fi)/∑fi = 1370/100=13,7 года.
Мода (Мо) — значение признака, наиболее часто встречающееся в исследуемой совокупности, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту (частость).
В дискретном ряду мода определяется визуально по максимальной частоте или частости.
В интервальном ряду по наибольшей частоте определяется модальные интервал (например, по данным таблицы наибольшая частота fmax= 30 %, а модальный интервал Мо=10-15 лет), а конкретное значение моды в модальном интервале определяется:
,
где xo и h –соответственно нижняя граница и величина модального интервала (например, по данным таблицы xo =10 лет, а h=(20-15)=5 лет);
Рис. 1. Гистограмма и полигон
fM0 – частота (частность) модального интервала (по данным таблицы fM0 =30%, fMo-1=19% fMo+1=24% соответственно значение моды: Mo=10+5(30-19)/[(30-19)+(30-24)]=13.24 года).
Медиана (Ме) — значение признака (варианта), приходящееся на середину ранжированной (упорядоченной) совокупности, т.е. это вариант, который делит ряд распределения на две равные по объему части.
Медиана, как и мода, не зависит от крайних значений вариантов, поэтому применяется для характеристики центра в ряду распределения с неопределенными границами.
Для определения медианы в ранжированном ряду необходимо вначале найти номер медианы: N=(n+1)/2 (в нашем случае N=(100+1)/2=50.5%, см. рис. 2). Затем по накопленным (кумулятивным) частотам Si дискретного ряда определяется медиальный интервал (в нашем случае интервал совпадает с модальным интервалом (такое совпадение не всегда обязательно, но встречается часто) это 10 – 15 лет поскольку ближайшая большая 50% накопленная частота Si = 59%).
В дискретном ряду распределения медианы находится непосредственно по накопленной частоте, соответствующей номеру медианы.
В случае интервального (вариационного) ряда распределения конкретного значение медианы вычисляется по формуле:
где xo и h –соответственно нижняя граница и величина медианного интервала (по данным таблицы xo =10 лет, а h=(15-10)=5 лет);
fMe – частота (частность) медианного интервала (по данным таблицы fMe=30%);
SMe-1 – накопленная частота предмедиального интервала (SMe-1= 29%).
Значение медианы для примера из таблицы Ме=10+5(50-29)/30=13,5 года. Откуда можно заключить, что половина всего оборудование имеет возраст не более 13,5 года или половина всего оборудования имеет возраст больше 13,5 лет.
В
симетричных рядах распределение значения
моды и медианы совпадают со вредней
величиной
,
а в умеренно асиметричных рядах они
соотносятся:
.
Кроме медианы в анализе закономерностей распределения используются также квартели и децели, при расчете которых в формуле расчета медиального значения Ме множитель ½ заменяется на 0,25 и 0,1 соответственно.
Рис. 2. Кумулята
Показатели степени вариации и способы их расчета. Для измерения и оценки вариации используют абсолютные и относительные характеристики.
Наиболее поверхностная оценка рассеяния (вариации) совокупности распределения определяется с помощью вариационного размаха R, который показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака: R=xmax-xmin.
Среднее
линейное отклонение
является
обобщающей мерой вариации индивидуальных
значений признака от средней арифметической
величины. Она дает абсолютную меру
вариации.
Для интервальных (вариационных) рядов взвешенная средняя определяется:
Для приведенного выше примера - =531,6/100=5,32 лет.
Дисперсия ()2 — это средний квадрат отклонений индивидуальных значений признака от средней величины. Дисперсию используют не только для оценки вариации, но и при измерении взаимосвязей, а также для проверки статистических гипотез.
Для приведенного выше примера -
=4256/100=42,56.
Среднее квадратическое отклонение - представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней, т.е. оно исчисляется путем извлечения квадратного корня из дисперсии и измеряется в тех же единицах, что и варьирующий признак.
Для приведенного выше примера -
=6
лет.
Коэффициент осцилляции:
Для приведенного выше примера -
=182,48%.
Линейный коэффициент вариации:
Для приведенного выше примера -
= 36,5%.
Коэффициент вариации:
Для приведенного выше примера
=
43,8 %.
Показатели асимметрии и эксцесса.
Симметричным называется
распределение у которого частоты
равноотстоящие от моды равны между
собой, следовательно выполняется
соотношение
=Мо=Ме.
Соответственно наиболее простой мерой
асимметрии является (xср-Мо).
Коэффициент асимметрии Пирсона:
При Ка>0 скошенность ряда правосторонняя (т.е. >Mo), при Ка<0 скошенность ряда левосторонняя (т.е. <Mo). В нашем примере Ка=0,08 и следовательно ряд характеризуется правосторонней незначительной асимметрией.
Нормальный коэффициент асимметрии третьего порядка. Часто используется в прикладных расчетах. Коэффициент не зависит от масштаба, выбранного при измерении варианта, так как является отвлеченной величиной и определяется по формуле:
,
где
- центральный момент третьего порядка
и определяется:
Для случая из таблицы 4 нормальный коэффициент асимметрии третьего порядка будет равен А3=412,64/216 =1,91.
Нормальный коэффициент асимметрии четвертого порядка. Используется для определения «крутизны» («заостренности») графика распределения частот. Определяется по формуле:
,
где
- центральный момент третьего порядка
и определяется:
При нормальном распределении А4=3. Для измерении асимметрии эталоном служит симметричное (нормальное) распределение, для которого А3=0.
Для случая из таблицы 4 нормальный коэффициент асимметрии четвертого порядка будет равен А4=3,42.
Показатель эксцесса распределения:
.
При Еk>0 распределение островершинное, при Еk <0 – плосковершинное.
В нашем примере Еk=(3,42-3)=0,42 и следовательно ряд островершинный.
Задание
1. Рассчитать:
показатели центра распределения (среднюю, моду и медиану);
показатели степени вариации (вариационный размах, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент осцилляции, линейный коэффициент вариации, коэффициент вариации);
Показатели асимметрии и эксцесса (коэффициент асимметрии Пирсона, нормальный коэффициент асимметрии третьего порядка, нормальный коэффициент асимметрии четвертого порядка, показатель эксцесса распределения).
2. Представьте интервальные вариационные ряды в виде:
гистограммы;
полигона;
кумуляты.
3. Сделайте выводы:
об однородности совокупности;
типичности средней арифметической.
о асимметрии распределения.