Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Саратовский Государственный Технический Университет им. Ю.А. Гагарина

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Практикум по статистике.doc

Скачиваний:

137

Добавлен:

12.02.2015

Размер:

6.89 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3613 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

6.3. Рекомендации преподавателям

1. Практические занятия. При решении задач на относительные показатели основное внимание необходимо уделить обоснованному выбору базы сравнения, определению размерности получаемых величин и их экономической интерпретации.

Решение каждой задачи на расчет средней величины целесообразно начинать с определения исходного соотношения, а затем переходить к его реализации с учетом имеющихся данных. Важно показать студентам недопустимость замены взвешенных формул невзвешенными, даже если последние арифметически приводят к близким результатам.

2. Задание для самостоятельной работы студентов может заключаться в подборе из экономической периодики и других печатных изданий фактического материала для расчета средних показателей и в обосновании выбора конкретной формы средней для каждого примера.

3. Контрольная аудиторная работа может включать по одной задаче на каждую форму средней или две задачи повышенной сложности типа 6.32 и 6.35.

Раздел III аналитическая статистика

Глава 7. Показатели вариации и анализ частотных распределений

7.1. Методические указания и решение типовых задач

Исследование вариации в статистике и социально-экономических исследованиях имеет важное значение, так как величина вариации признака в статистической совокупности характеризует ее однородность.

В статистической практике для изучения и измерения вариации используются различные показатели (меры) вариации в зависимости от поставленных перед исследователем задач. К ним относятся размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсия), среднее квадратическое отклонение и коэффициент вариации.

При изучении вопроса о вариации нужно четко представлять себе условия, порождающие вариацию признаков, а также сущность и значение измерения вариации признаков. Следует также усвоить, что изучение вариации признаков общественных явлений находится в прямой связи с группировками, в частности с рядами распределения. Очень важно научиться свободно исчислять все показатели вариации.

Способы вычисления показателей вариации. Размах вариации (R) является наиболее простым измерителем вариации признака.

R = x_max – x_min,

где х_max – наибольшее значение варьирующего признака;

х_min – наименьшее значение признака.

Среднее линейное отклонение () представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:

–невзвешенное среднее линейное отклонение;

–взвешенное среднее линейное отклонение.

Символы х_i, ,f_i и n имеют то же значение, что и в предыдущей главе. Рассмотренные выше показатели имеют ту же размерность, что и признак, для которого они вычисляются.

Пример. На основе данных табл. 7.1 рассчитаем среднее линейное отклонение для дискретного ряда распределения.

Решение. Размах вариации стажа равен:

R = 12 – 8 = 4 года.

Результаты вспомогательных расчетов даны в графах 3-5 табл. 7.1.

Средний стаж работы определяем по формуле средней арифметической взвешенной:

Отклонения индивидуальных значений стажа от средней с учетом и без учета знака содержатся в графах 4 и 5, а произведения отклонений по модулю на соответствующие частоты – в гр. 6.

Таблица 7.1

Распределение учителей средних школ района по стажу работы

Стаж работы, лет x_i (признак)	Число учителей в % к итогу f_i (вес (частота))	x_if_i
1	2	3	4	5	6
8	14	112	-2	2	28
9	20	180	-1	1	20
10	30	300	0	0	0
11	24	264	1	1	24
12	12	144	2	2	24
Итого	100	1000	0	-	96

Среднее линейное отклонение стажа работы учителей средних школ района

Показатели дисперсии и среднего квадратического отклонения являются общепринятыми мерами вариации и широко используются в статистических исследованиях.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины (обозначается греческой буквой σ² – «сигма квадрат»). Дисперсия вычисляется по формулам простой невзвешенной и взвешенной:

–невзвешенная;

–взвешенная.

Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней:

–невзвешенное;

–взвешенное.

Среднее квадратическое отклонение – величина именованная, имеет размерность осредняемого признака.

Пример. Рассчитаем дисперсию и среднее квадратическое отклонение для следующего ряда распределения (табл. 7.2).

Таблица 7.2

Распределение магазинов города по товарообороту во II квартале 1998 г.

Группы магазинов по величине товарооборота, тыс. руб.	Число магазинов f_i	Середина интервала, тыс. руб. х_i,	x_if_i
А	1	2	3	4	5	6
40-50	2	45	90	-49,2	2420,64	4841,28
50-60	4	55	220	-39,2	1536,64	6146,56
60-70	7	65	455	-29,2	852,64	5968,48
70-80	10	75	750	-19,2	368,64	3686,40
80-90	15	85	1275	-9,2	84,64	1269,60
90-100	20	95	1900	0,8	0,64	12,80
100-110	22	105	2310	10,8	116,64	2566,08
110-120	11	115	1265	20,64	432,64	4759,04
120-130	6	125	750	30,8	948,64	5691,84
130-140	3	135	405	40,8	1664,64	4993,92
Итого	100	0	9420	-	-	39936,00

Решение. В приведенных ранее примерах мы имели дело с дискретными рядами. При расчете показателей вариации по интервальным рядам распределения (табл. 7.2) необходимо сначала определить середины интервалов, а затем вести дальнейшие расчеты, рассматривая ряд середин интервалов как дискретный ряд распределения.

Результаты вспомогательных расчетов для определения дисперсии и среднего квадратического отклонения содержатся в графах 2-6 табл. 7.2.

Средний размер товарооборота определяется по средней арифметической взвешенной и составляет:

Дисперсия товарооборота

Среднее квадратическое отклонение товарооборота определяется как корень квадратный из дисперсии:

Расчет дисперсии прямым способом в ряде случаев трудоемок, поэтому логично, используя свойства дисперсии, упростить ее вычисления, например используя расчет дисперсии по способу отчета от условного нуля или способу моментов по следующей формуле:

С использованием начальных моментов формула расчета дисперсии по способу моментов имеет следующий вид:

σ² = k² (m₂ – m₁²),

где k – величина интервала;

А – условный нуль, в качестве которого удобно использовать середину интервала с наибольшей частотой;

–начальный момент первого порядка;

–начальный момент второго порядка.

В случае когда А приравнивается к нулю и, следовательно, не вычисляются отклонения, формула принимает вид:

или

Воспользуемся данными предыдущего примера и рассчитаем дисперсию по способу отсчета от условного нуля и способу моментов. Расчет произведем в табличной форме (табл. 7.3).

Таблица 7.3

Расчет дисперсии способом отчета от условного нуля

Группы магазинов по товарообороту, тыс. руб.	Число магазинов f_i	Середина интервала, тыс. руб. x_i	x_i – A (А = 95)	(k = 10)
40-50	2	45	-50	-5	-10	50	2025	4050
50-60	4	55	-40	-4	-16	64	3025	12100
60-70	7	65	-30	-3	-21	63	4225	29575
70-80	10	75	-20	-2	-20	40	5625	56250
80-90	15	85	-10	-1	-15	15	7225	108375
90-100	20	95	1	0	0	0	9025	180500
100-110	22	105	10	1	22	22	11025	242550
110-120	11	115	20	2	22	44	13225	145475
120-130	6	125	30	3	18	54	15625	93750
130-140	3	135	40	4	12	48	18225	54675
Итого	100	-	-	-	-8	400	-	927300

По способу отсчета от условного нуля:

По способу моментов получаем:

По способу разности между средней квадратов вариантов признака и квадратом их средней величины

Результаты расчетов дисперсии по всем трем способам дают одну и ту же величину.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха, или среднего линейного отклонения, или среднего квадратического отклонения к средней арифметической. Чаще всего, они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации (V):

Коэффициент осцилляции: .

Линейный коэффициент вариации: .

Коэффициент вариации: .

Рассмотрим примеры определения этих показателей.

По данным табл. 7.1, коэффициент осцилляции , а линейный коэффициент вариации .

Коэффициент вариации вычислим на основе ряда распределения, представленного в табл. 7.2: .

Наиболее часто в практических расчетах из этих трех показателей применяется коэффициент вариации.

Статистическое изучение вариации многих социально-экономических явлений проводится и при помощи дисперсии альтернативного признака. Обозначим наличие данного признака 1, отсутствие 0, долю вариантов, обладающих данным признаком, р, а не обладающих им q. Так как ряд р + q = 1, то средняя = р, а дисперсия альтернативного признака σ² = pq, где ,n – число наблюдений, m – число единиц совокупности, обладающее данным признаком, q = 1 – р.

Определим дисперсию альтернативного признака по следующим данным: налоговой инспекцией одного из районов города проверено 172 коммерческих киоска и в 146 обнаружены финансовые нарушения. Тогда

n = 172, m = 146; ; q = 1 – 0,85 = 0,15; σ² = 0,85 · 0,15 = 0,1275.

Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

Правило сложения дисперсий. Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую.

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловливающих эту вариацию:

Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:

где х_i и n_i – соответственно средние и численности по отдельным группам

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

Средняя из внутригрупповых дисперсий

Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:

Данное соотношение называют правилом сложения дисперсий. Согласно этому правилу общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или проверить правильность расчета третьего вида.

Пример. Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию по данным табл. 7.4.

Таблица 7.4

Производительность труда двух бригад рабочих-токарей

1-я бригада				2-я бригада
№ п/п	Изготовлено деталей за час, шт. х_i			№ п/п	Изготовлено деталей за час, шт. х_i
1	13	-2	4	7	18	-3	9
2	14	-1	1	8	19	-2	4
3	15	0	0	9	22	1	1
4	17	2	4	10	20	-1	1
5	16	1	1	11	24	3	9
6	15	0	0	12	23	2	4
90			10	126			28

Решение. Для расчета групповых дисперсий вычислим средние по каждой группе:

Промежуточные расчеты дисперсий по группам представлены в табл. 7.4. Подставив полученные значения в формулу, получим:

;

Средняя из групповых дисперсий

Затем рассчитаем межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешенную из групповых средних:

Теперь определим межгрупповую дисперсию:

Таким образом, общая дисперсия по правилу сложения дисперсий

Проверим полученный результат, исчислив общую дисперсию обычным способом:

На основании правила сложения дисперсий можно определить показатель тесноты связи между группировочным (факторным) и результативным признаками. Он называется эмпирическим корреляционным отношением, обозначается η («эта») и рассчитывается по формуле . Для нашего примера эмпирическое корреляционное отношение.

Величина 0,86 характеризует существенную связь между группировочным и результативным признаками.

Наряду с вариацией индивидуальных значений признака вокруг средней может наблюдаться и вариация индивидуальных долей признака вокруг средней доли. Такое изучение вариации достигается посредством вычисления и анализа следующих видов дисперсий.

Внутригрупповая дисперсия доли определяется по формуле

Средняя из внутригрупповых дисперсий

Формула межгрупповой дисперсии имеет вид:

где n_i – численность единиц в отдельных группах;

р – доля изучаемого признака во всей совокупности, которая определяется по формуле

Общая дисперсия имеет вид:

Три вида дисперсии связаны между собой следующим образом:

Данное соотношение дисперсий называется теоремой сложения дисперсии доли признака. Эта теорема широко используется в изучении колеблемости качественных признаков.

Пример. Определим групповые дисперсии, среднюю из групповых, межгрупповую и общую дисперсии по данным табл. 7.5.

Таблица 7.5

Численность и удельный вес одной из категорий крупного рогатого скота фермерских хозяйств района

Хозяйство	Удельный вес дойных коров, % p_i	Всего коров n_i
1	90	50
2	95	20
3	80	30
Итого	265	100

Решение. Определим долю дойных коров в целом по трем хозяйствам:

Общая дисперсия доли дойных коров:

Внутригрупповые дисперсии:

Средняя из внутригрупповых дисперсий:

Межгрупповая дисперсия:

Используя правило сложения дисперсий, получаем: 0,1025 + 0,0031 = 0,1056. Пример решен правильно.

Выяснение общего характера распределения предполагает не только оценку степени его однородности, но и оценку его симметричности, остро- или плосковершинности. Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. В статистике для характеристики асимметрии пользуются несколькими показателями.

Показатели асимметрии и эксцесса. Степень асимметрии может быть определена с помощью коэффициента асимметрии:

где – средняя арифметическая ряда распределения,

Мо – мода;

σ – среднее квадратическое отклонение

При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. ЕслиA_s > 0, то больше моды, следовательно, имеется правосторонняя асимметрия.

Если A_s < 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

В практических расчетах часто в качестве показателя асимметрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, т.е. .

Это дает возможность определить не только величину асимметрии, но и проверить наличие асимметрии в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Асимметрия меньше 0,25 – незначительная.

Пример. Рассчитаем коэффициент асимметрии по данным о распределении фирм по стоимости основных фондов (табл. 7.6).

Таблица 7.6

Расчет коэффициента асимметрии

Группы фирм по стоимости основных фондов, млн. руб. х	Количество фирм f_i	Середина интервала x_i	k = 0,5	x’f_i	(x’)²f_i	(x’)³f_i	(x’)⁴f_i
0,5-1,0	20	0,75	-2	-40	80	-160	320
1,0-1,5	40	1,25	-1	-40	40	-40	40
1,5-2,0	25	1,75	0	0	0	0	0
2,0-2,5	20	2,25	1	20	20	20	20
Итого	105	-	-	-60	140	-180	380

Решение. Определяем условные моменты m₁, m₂ и m₃, а также центральные моменты μ₂ и μ₃, необходимые для вычисления коэффициента асимметрии:

Коэффициент асимметрии для данного ряда

Полученный результат свидетельствует о наличии незначительной правосторонней асимметрии.

Для симметричных распределений может быть также рассчитан показатель эксцесса:

При симметричном распределении E_k = 0. Если E_k > 0, распределение является островершинным; если E_k < 0  плосковершинным.

Вычислим E_k по данным табл. 7.6, определив вначале величину четвертого центрального момента: . Тогда . Таким образом, исследуемое распределение является островершинным.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу нормального распределения.

Построение нормального распределения по эмпирическим данным. Имея дело с эмпирическим распределением, можно предположить, что данному распределению соответствует определенная, характерная для него теоретическая кривая. Выдвинув гипотезу о той или иной форме распределения, стремятся описать эмпирический ряд с помощью математической модели, выражающей некоторый теоретический закон распределения. Среди различных кривых распределения особое место занимает нормальное распределение.

Нормальное распределение чаще всего выражается следующей стандартизованной кривой нормального распределения:

где у_t – ордината кривой нормального распределения;

–стандартизованная (нормированная) величина;

е и π – математические постоянные:

х_i – значения изучаемого признака,

–средняя арифметическая ряда,

σ – среднее квадратическое отклонение изучаемого признака.

Как видно из уравнения, два параметра – средняя арифметическая () и среднее квадратическое отклонение (σ) определяют черты симметричной кривой нормального распределения. В зависимости от их значения она может иметь разный центр группирования, быть более удлиненной или сжатой.

Пример. Рассчитаем значения частот теоретического ряда распределения на основании эмпирических данных об урожайности зерна в 500 фермерских хозяйствах, представленных в табл. 7.7.

Таблица 7.7

Расчет теоретических частот нормального распределения

Урожайность, ц/га	Середина интер- вала x_i	Кол-во хоз-в f_i	x_if_i						Теоретические частоты
А	1	2	3	4	5	6	7	8	9
До 38,25	38,0	2	76,0	1444	2888	-3	-3	0,004	1
38,25-38,75	38,5	3	115,0	1482	4446	-2,5	-2,5	0,017	4
38,75-39,25	39,0	10	390,0	1521	15210	-2,0	-2,0	0,054	13

Продолжение таблицы 7.7

А	1	2	3	4	5	6	7	8	9
39,25-39,75	39,5	31	1224,5	1560	48360	-1,5	- 1,5	0,130	32
39,75-40,25	40,0	72	2880,0	1600	115200	-1,0	-1,0	0,242	61
40,25-40,75	40,5	85	3442,5	1640	139400	-0,5	-0,5	0,352	89
40,75-41,25,	41,0	94	3854,0	1681	158014	0	0	0,399	98
41,25-41,75	41,5	88	3652,0	1722	151536	0,5	0,5	0,352	89
41,75-42,25	42,0	62	2604,0	1764	109368	1,0	1,0	0,242	61
42,25-42,75	42,5	37	1572,5	1806	66822	1,5	1,5	0,130	32
42,75-43,25	43,0	12	516,0	1849	22188	2,0	2,0	0,054	13
43,25-43,75	43,5	3	130,5	1892	5676	2,5	2,5	0,017	4
Свыше 43,75	44,0	1	44,0	1936	1936	3,0	3,0	0,004	1
Итого	-	500	20501,5	-	841044	0	0	-	498

Для данного эмпирического распределения находим сначала значения = 41 ц/га и σ = 1,0 (они рассчитаны обычным способом и не воспроизведены в табл. 7.7).

Затем находим отклонения х_i– (табл. 7.7 гр. 6) и стандартизованные отклонения (табл. 7.7 гр. 7) для данного варианта. Значения же теоретической частоты для нее исчисляются по известной уже формуле: .

Так как величина остается одной и той же для всего распределения с равными интервалами, в частности в нашем примере , то достаточно ее найти один раз и умножить на величинуφ(t) при данном t, тогда получим искомую теоретическую частоту (табл. 7.7 гр. 9).

Критерии согласия. Количественная характеристика соответствия может быть получена с помощью особых статистических показателей-критериев согласия. Известны критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, Б.С. Ястремского и А.Н. Колмогорова.

Критерий согласия Пирсона (χ²) вычисляется по формуле

где f_Э и f_T – эмпирические и теоретические частоты соответственно.

С помощью величины χ² по специальным таблицам приложения определяется вероятность Р (χ²). Входами в таблицу являются значения χ² и число степеней свободы γ = n – 1. На основе Р выносится суждение о существенности расхождения между эмпирическим и теоретическим распределениями. При Р > 0,5 считается, что эмпирическое и теоретическое распределения близки. При Р(0,2; 0,5) совпадение между ними удовлетворительное, в остальных случаях недостаточное.

Критерий Романовского (С), также используемый для проверки близости эмпирического и теоретического распределений, определяется следующим образом:

где χ²– критерий Пирсона:

γ – число степеней свободы.

При С < 3 различие несущественно, что позволяет считать эмпирическое распределение близким к нормальному.

Критерий Ястремского (L) может быть найден на основе следующего соотношения:

где N – объем совокупности:

pq – дисперсия альтернативного признака;

k – число вариантов или групп;

Q – принимает значение 0,6, при числе вариантов или групп от 8 до 20.

Если L < 3, то эмпирическое распределение соответствует теоретическому.

Критерий Колмогорова (λ) вычисляется по формуле

где D – максимальное значение разности между накопленными эмпирическими и теоретическими частотами;

Σf – сумма эмпирических частот.

Необходимым условием использования этого критерия является достаточно большее число наблюдений (не меньше ста).

Пример. Рассчитаем критерии Колмогорова и Пирсона по данным табл. 7.8.

Таблица 7.8

Расчет критерия Колмогорова по данным об урожайности зерновых

в 500 фермерских хозяйствах

Урожайность, ц/га x_i	Частоты ряда распределения		Накопленные частоты		\|f_Э – f_T\|
Урожайность, ц/га x_i	эмпирические f_Э	теоретические f_T	эмпирические f_Э	теоретические f_T	\|f_Э – f_T\|
До 38,25	2	1	2	1	1
38,25-38,75	3	4	5	5	0
38,75-39,25	10	13	15	18	3
39,25-39,75	31	32	46	50	4
39,75-40,25	72	61	118	111	7
40,25-40,75	85	89	203	200	3
40,75-41,25	94	98	297	298	1
41,25-41,75	88	89	385	387	2
41,75-42,25	62	61	447	448	1
42,25-42,75	37	32	484	480	4
42,75-43,25	12	13	496	493	3
43,25-43,75	3	4	499	497	2
Свыше 43,75	1	1	500	498	2
Итого	500	498	-	-	–

Как видно из табл. 7.8, максимальное значение разности между эмпирическими и теоретическими частотами составляет 7, т.е. D=7.

Следовательно, в нашем примере величина критерия Колмогорова

По таблицам вероятностей Р (λ) определяем, что λ = 0,31 соответствует Р(х), близкая к 1,00. Это означает, что с вероятностью, близкой к 1, можно утверждать, что отклонения фактических частот от теоретических в нашем примере являются случайными. Следовательно, можно считать, что в основе фактического распределения фермерских хозяйств по урожайности лежит нормальное распределение.

Этот же вывод подтверждается расчетом χ²-критерия Пирсона (табл. 7.9).

Таблица 7.9

Расчет критерия Пирсона по данным об урожайности зерновых

в 500 фермерских хозяйствах

Урожайность, ц/ га х_i	Частоты распределения ряда		f_Э– f_Т
Урожайность, ц/ га х_i	эмпирические f_Э	теоретические f_Т	f_Э– f_Т
До 38,25	2	1	0	0
	5	5
38,25-38,75	3	4
38,75-39,25	10	13	3	1,70
39,25-39,75	31	32	1	0,03
39,75-40,25	72	61	11	2,00
40,25-40,75	85	89	4	0,05
40,75-41,25	94	98	4	0,16
41,25-41,75	88	89	1	0,01
41,75-42,25	62	61	1	0,02
42,25-42,75	37	32	5	0,78
42,75-43,25	12	13	1	0,10
43,25-43,75	3	4	1	0,20
	4	5
Свыше 43,75	1	1
Итого	500	499	-	5,05

Из данных табл. 7.9 видно, что χ² ⁼ 5,05. По таблицам вероятностей Р(χ²) = 0,9834. Таким образом, эмпирическое и теоретическое распределения близки.

Критерий Романовского . Следовательно, теоретическое распределение эмпирического ряда удовлетворительное.

Для характеристики структуры вариационных рядов применяются показатели особого рода, которые можно назвать структурными средними.

Характеристики вариационного ряда.

Мода – значение признака, наиболее часто встречающееся в исследуемой совокупности.

Медиана – значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.

Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.

Пример. Рассчитаем моду и медиану по данным табл. 7.10.

Таблица 7.10

Распределение обуви, проданной коммерческой фирмой в январе 1998 г.

Размер

44 и

более

Итого

Количество проданных

пар, % к итогу

100

Накопленные частоты

В этом ряду распределения мода равна 42. Именно этот размер обуви в январе 1998 г. пользовался наибольшим спросом.

Для определения медианы надо подсчитать сумму накопленных частот ряда. Наращивание продолжается до получения накопленной суммы частот, впервые превышающей половину. В нашем примере сумма частот составила 100, ее половина – 50.

Накопленная сумма частот ряда равна 62. Ей соответствует значение признака, равное 40. Таким образом, 40-й размер обуви является медианным.

Для интервальных вариационных рядов мода определяется по формуле

где х_Мо– нижняя граница значения интервала, содержащего моду;

i_Мо– величина модального интервала;

f_Mo– частота модального интервала;

f_Mo_-1 – частота интервала, предшествующего модальному;

f_Mo₊_l– частота интервала, следующего за модальным.

Медиана интервального ряда распределения определяется по формуле

где х_Ме – нижняя граница значения интервала, содержащего медиану;

i_M_е – величина медианного интервала;

Σf – сумма частот;

S_Me_-1 – сумма накопленных частот, предшествующих медианному интервалу;

f_Me – частота медианного интервала

Пример. Рассчитаем моду и медиану по данным табл. 7.11.

Следовательно, наибольшее число семей имеют среднедушевой доход 772 руб.

Таким образом, половина семей города имеет среднедушевой доход менее 780 руб., остальные семьи – более 780 руб.

Таблица 7.1

Распределение семей города по размеру среднедушевого дохода

в январе 1998 г.

Группы семей по размеру дохода, руб.	Число семей	Накопленные частоты	Накопленные частоты, % к итогу
До 500	600	600	6
500-600	700	1300	13
600-700	1700	3000	30
700-800	2500	5500	55
800-900	2200	7700	77
900-1000	1500	9200	92
Свыше 1000	800	10000	100
Итого	10000	-	-

Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Например, можно найти значение признака у единиц, делящих ряд на четыре равные части, десять или сто частей. Эти величины называются «квартили», «децили» и «перцентили».

Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Различают квартиль нижний (Q,), отделяющий 1/4 часть совокупности с наименьшими значениями признака, и квартиль верхний (Q₃), отсекающий 1/4 часть с наибольшими значениями признака. Это означает, что 25% единиц совокупности будут меньше по величине Q₁; 25% единиц будут заключены между Q₁ и Q₂; 25% - между Q₂ и Q₃ и остальные 25% превосходят Q₃. Средним квартилем Q₂ является медиана.

Для расчета квартилей по интервальному вариационному ряду используют формулы:

;

где – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%);

–нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);

–накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

–то же для верхнего квартиля;

–частота интервала, содержащего нижний квартиль;

–то же для верхнего квартиля.

Рассмотрим расчет нижнего и верхнего квартилей по данным табл. 7.11. Нижний квартиль находится в интервале 600-700, накопленная частота которого равна 30%. Верхний квартиль лежит в интервале 800-900 с накопленной частотой 77%. Поэтому получим:

Итак, 25% семей имеют среднедушевой доход менее 671 руб., 25% семей – свыше 891 руб., а остальные имеют доход в пределах 671-891 руб.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3613 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.02.201571.79 Кб8праздники.docx
#
18.08.2019680.45 Кб0практика антон.doc
#
12.02.201536.6 Кб6Практика защитное отключение Чепляев Н. В..docx
#
25.11.2018101.89 Кб0ПРАКТИКУМ 2 ПРАВООТНОШЕНИЯ 2011.doc
#
12.02.2015128 Кб20ПРАКТИКУМ 7 ТРУДОВОЕ ПРАВО.doc
#
12.02.20156.89 Mб137Практикум по статистике.doc
#
20.11.20192.91 Mб4Практическая работа2.docx
#
12.02.201563.92 Кб11Практическая часть.docx
#
12.02.2015166.08 Кб43практическая, ИЭ.docx
#
12.02.2015620.03 Кб226Практические занятия ПМ01 часть 1.doc
#
12.02.2015731.8 Кб18Практические работы №2-8.docx