Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по статистике.doc
Скачиваний:
137
Добавлен:
12.02.2015
Размер:
6.89 Mб
Скачать

6.3. Рекомендации преподавателям

1. Практические занятия. При решении задач на относи­тельные показатели основное внимание необходимо уделить обоснованному выбору базы сравнения, определению размер­ности получаемых величин и их экономической интерпрета­ции.

Решение каждой задачи на расчет средней величины целесо­образно начинать с определения исходного соотношения, а затем переходить к его реализации с учетом имеющихся данных. Важ­но показать студентам недопустимость замены взвешенных фор­мул невзвешенными, даже если последние арифметически при­водят к близким результатам.

2. Задание для самостоятельной работы студентов может заключаться в подборе из экономической периодики и других печатных изданий фактического материала для расчета средних показателей и в обосновании выбора конкретной формы средней для каждого примера.

3. Контрольная аудиторная работа может включать по од­ной задаче на каждую форму средней или две задачи повышен­ной сложности типа 6.32 и 6.35.

Раздел III аналитическая статистика

Глава 7. Показатели вариации и анализ частотных распределений

7.1. Методические указания и решение типовых задач

Исследование вариации в статистике и социально-экономи­ческих исследованиях имеет важное значение, так как величина вариации признака в статистической совокупности характеризу­ет ее однородность.

В статистической практике для изучения и измерения вари­ации используются различные показатели (меры) вариации в зависимости от поставленных перед исследователем задач. К ним относятся размах вариации, среднее линейное отклонение, сред­ний квадрат отклонений (дисперсия), среднее квадратическое отклонение и коэффициент вариации.

При изучении вопроса о вариации нужно четко представлять себе условия, порождающие вариацию признаков, а также сущ­ность и значение измерения вариации признаков. Следует также усвоить, что изучение вариации признаков общественных явле­ний находится в прямой связи с группировками, в частности с рядами распределения. Очень важно научиться свободно исчис­лять все показатели вариации.

Способы вычисления показателей вариации. Размах ва­риации (R) является наиболее простым измерителем вариации признака.

R = xmax – xmin,

где хmax – наибольшее значение варьирующего признака;

хmin – наименьшее значение признака.

Среднее линейное отклонение () представляет собой сред­нюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:

–невзвешенное среднее линейное отклонение;

–взвешенное среднее линейное отклонение.

Символы хi, ,fi и n имеют то же значение, что и в преды­дущей главе. Рассмотренные выше показатели имеют ту же раз­мерность, что и признак, для которого они вычисляются.

Пример. На основе данных табл. 7.1 рассчитаем среднее линейное отклонение для дискретного ряда распределения.

Решение. Размах вариации стажа равен:

R = 12 – 8 = 4 года.

Результаты вспомогательных расчетов даны в графах 3-5 табл. 7.1.

Средний стаж работы определяем по формуле средней ариф­метической взвешенной:

Отклонения индивидуальных значений стажа от средней с уче­том и без учета знака содержатся в графах 4 и 5, а произведения отклонений по модулю на соответствующие частоты – в гр. 6.

Таблица 7.1

Распределение учителей средних школ района по стажу работы

Стаж работы, лет xi (признак)

Число учителей

в % к итогу fi

(вес (частота))

xifi

1

2

3

4

5

6

8

14

112

-2

2

28

9

20

180

-1

1

20

10

30

300

0

0

0

11

24

264

1

1

24

12

12

144

2

2

24

Итого

100

1000

0

-

96

Среднее линейное отклонение стажа работы учителей сред­них школ района

Показатели дисперсии и среднего квадратического отклоне­ния являются общепринятыми мерами вариации и широко ис­пользуются в статистических исследованиях.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины (обо­значается греческой буквой σ2 – «сигма квадрат»). Дисперсия вычисляется по формулам простой невзвешенной и взвешенной:

–невзвешенная;

–взвешенная.

Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдель­ных значений признака от их средней:

–невзвешенное;

–взвешенное.

Среднее квадратическое отклонение – величина именованная, имеет размерность осредняемого признака.

Пример. Рассчитаем дисперсию и среднее квадратическое отклонение для следующего ряда распределения (табл. 7.2).

Таблица 7.2

Распределение магазинов города по товарообороту во II квартале 1998 г.

Группы магазинов по величине

товарооборота,

тыс. руб.

Число

магазинов

fi

Середина интервала,

тыс. руб.

хi,

xifi

А

1

2

3

4

5

6

40-50

2

45

90

-49,2

2420,64

4841,28

50-60

4

55

220

-39,2

1536,64

6146,56

60-70

7

65

455

-29,2

852,64

5968,48

70-80

10

75

750

-19,2

368,64

3686,40

80-90

15

85

1275

-9,2

84,64

1269,60

90-100

20

95

1900

0,8

0,64

12,80

100-110

22

105

2310

10,8

116,64

2566,08

110-120

11

115

1265

20,64

432,64

4759,04

120-130

6

125

750

30,8

948,64

5691,84

130-140

3

135

405

40,8

1664,64

4993,92

Итого

100

0

9420

-

-

39936,00

Решение. В приведенных ранее примерах мы имели дело с дискретными рядами. При расчете показателей вариации по интервальным рядам распределения (табл. 7.2) необходимо сначала определить середины интервалов, а затем вести дальней­шие расчеты, рассматривая ряд середин интервалов как дискрет­ный ряд распределения.

Результаты вспомогательных расчетов для определения дис­персии и среднего квадратического отклонения содержатся в графах 2-6 табл. 7.2.

Средний размер товарооборота определяется по средней арифметической взвешенной и составляет:

Дисперсия товарооборота

Среднее квадратическое отклонение товарооборота опреде­ляется как корень квадратный из дисперсии:

Расчет дисперсии прямым способом в ряде случаев трудо­емок, поэтому логично, используя свойства дисперсии, упростить ее вычисления, например используя расчет дисперсии по спосо­бу отчета от условного нуля или способу моментов по следую­щей формуле:

С использованием начальных моментов формула расчета дис­персии по способу моментов имеет следующий вид:

σ2 = k2 (m2 – m12),

где k – величина интервала;

А – условный нуль, в качестве которого удобно использовать середину интервала с наибольшей частотой;

–начальный момент первого порядка;

–начальный момент второго порядка.

В случае когда А приравнивается к нулю и, следовательно, не вычисляются отклонения, формула принимает вид:

или

Воспользуемся данными предыдущего примера и рассчита­ем дисперсию по способу отсчета от условного нуля и способу моментов. Расчет произведем в табличной форме (табл. 7.3).

Таблица 7.3

Расчет дисперсии способом отчета от условного нуля

Группы магазинов по

товаро­обороту,

тыс. руб.

Число

магазинов

fi

Середина

интерва­ла, тыс. руб.

xi

xi – A

(А = 95)

(k = 10)

40-50

2

45

-50

-5

-10

50

2025

4050

50-60

4

55

-40

-4

-16

64

3025

12100

60-70

7

65

-30

-3

-21

63

4225

29575

70-80

10

75

-20

-2

-20

40

5625

56250

80-90

15

85

-10

-1

-15

15

7225

108375

90-100

20

95

1

0

0

0

9025

180500

100-110

22

105

10

1

22

22

11025

242550

110-120

11

115

20

2

22

44

13225

145475

120-130

6

125

30

3

18

54

15625

93750

130-140

3

135

40

4

12

48

18225

54675

Итого

100

-

-

-

-8

400

-

927300

По способу отсчета от условного нуля:

По способу моментов получаем:

По способу разности между средней квадратов вариантов признака и квадратом их средней величины

Результаты расчетов дисперсии по всем трем способам дают одну и ту же величину.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемо­сти одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вы­числяются как отношение размаха, или среднего линейного от­клонения, или среднего квадратического отклонения к средней арифметической. Чаще всего, они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превыша­ет 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации (V):

Коэффициент осцилляции: .

Линейный коэффициент вариации: .

Коэффициент вариации: .

Рассмотрим примеры определения этих показателей.

По данным табл. 7.1, коэффициент осцилляции , а линейный коэффициент вариации .

Коэффициент вариации вычислим на основе ряда распределения, представленного в табл. 7.2: .

Наиболее часто в практических расчетах из этих трех пока­зателей применяется коэффициент вариации.

Статистическое изучение вариации многих социально-эконо­мических явлений проводится и при помощи дисперсии альтер­нативного признака. Обозначим наличие данного признака 1, от­сутствие 0, долю вариантов, обладающих данным признаком, р, а не обладающих им q. Так как ряд р + q = 1, то средняя = р, а дисперсия альтернативного признака σ2 = pq, где ,n – число наблюдений, m – число единиц совокупности, облада­ющее данным признаком, q = 1 – р.

Определим дисперсию альтернативного признака по следую­щим данным: налоговой инспекцией одного из районов города проверено 172 коммерческих киоска и в 146 обнаружены финан­совые нарушения. Тогда

n = 172, m = 146; ; q = 1 – 0,85 = 0,15; σ2 = 0,85 · 0,15 = 0,1275.

Наряду с изучением вариации признака по всей совокупнос­ти в целом часто бывает необходимо проследить количествен­ные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вари­ации достигается посредством вычисления и анализа различных видов дисперсии.

Правило сложения дисперсий. Если данные представлены в виде аналитической группировки, то можно вычислить дис­персию общую, межгрупповую и внутригрупповую.

Общая дисперсия измеряет вариацию признака во всей со­вокупности под влиянием всех факторов, обусловливающих эту вариацию:

Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возни­кающие под влиянием признака-фактора, положенного в основа­ние группировки. Она рассчитывается по формуле:

,

где хi и ni – соответственно средние и численности по отдельным группам

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

Средняя из внутригрупповых дисперсий

.

Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгруп­повых дисперсий:

.

Данное соотношение называют правилом сложения диспер­сий. Согласно этому правилу общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или про­верить правильность расчета третьего вида.

Пример. Определим групповые дисперсии, среднюю из груп­повых дисперсий, межгрупповую дисперсию, общую дисперсию по данным табл. 7.4.

Таблица 7.4

Производительность труда двух бригад рабочих-токарей

1-я бригада

2-я бригада

п/п

Изготовлено

деталей за час, шт. хi

п/п

Изготовлено деталей за час, шт. хi

1

13

-2

4

7

18

-3

9

2

14

-1

1

8

19

-2

4

3

15

0

0

9

22

1

1

4

17

2

4

10

20

-1

1

5

16

1

1

11

24

3

9

6

15

0

0

12

23

2

4

90

10

126

28

Решение. Для расчета групповых дисперсий вычислим сред­ние по каждой группе:

Промежуточные расчеты дисперсий по группам представле­ны в табл. 7.4. Подставив полученные значения в формулу, по­лучим:

;

.

Средняя из групповых дисперсий

Затем рассчитаем межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешен­ную из групповых средних:

Теперь определим межгрупповую дисперсию:

Таким образом, общая дисперсия по правилу сложения дис­персий

.

Проверим полученный результат, исчислив общую дисперсию обычным способом:

На основании правила сложения дисперсий можно опреде­лить показатель тесноты связи между группировочным (фактор­ным) и результативным признаками. Он называется эмпиричес­ким корреляционным отношением, обозначается η («эта») и рассчитывается по формуле . Для нашего примера эмпирическое корреляционное отношение.

Величина 0,86 характеризует существенную связь между группировочным и результативным признаками.

Наряду с вариацией индивидуальных значений признака вок­руг средней может наблюдаться и вариация индивидуальных долей признака вокруг средней доли. Такое изучение вариа­ции достигается посредством вычисления и анализа следующих видов дисперсий.

Внутригрупповая дисперсия доли определяется по формуле

.

Средняя из внутригрупповых дисперсий

Формула межгрупповой дисперсии имеет вид:

где ni – численность единиц в отдельных группах;

р – доля изучаемого признака во всей совокупности, которая определяет­ся по формуле

Общая дисперсия имеет вид:

Три вида дисперсии связаны между собой следующим образом:

Данное соотношение дисперсий называется теоремой сложе­ния дисперсии доли признака. Эта теорема широко используется в изучении колеблемости качественных признаков.

Пример. Определим групповые дисперсии, среднюю из груп­повых, межгрупповую и общую дисперсии по данным табл. 7.5.

Таблица 7.5

Численность и удельный вес одной из категорий крупного рогатого скота фермерских хозяйств района

Хозяйство

Удельный вес дойных коров, %

pi

Всего коров

ni

1

90

50

2

95

20

3

80

30

Итого

265

100

Решение. Определим долю дойных коров в целом по трем хозяйствам:

Общая дисперсия доли дойных коров:

Внутригрупповые дисперсии:

Средняя из внутригрупповых дисперсий:

Межгрупповая дисперсия:

Используя правило сложения дисперсий, получаем: 0,1025 + 0,0031 = 0,1056. Пример решен правильно.

Выяснение общего характера распределения предполагает не только оценку степени его однородности, но и оценку его симметричности, остро- или плосковершинности. Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. В статистике для характеристики асиммет­рии пользуются несколькими показателями.

Показатели асимметрии и эксцесса. Степень асимметрии может быть определена с помощью коэффициента асимметрии:

,

где – средняя арифметическая ряда распределения,

Мо – мода;

σ – среднее квадратическое отклонение

При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. ЕслиAs > 0, то больше моды, следовательно, имеется правосторонняя асиммет­рия.

Если As < 0, то меньше моды, следовательно, имеется ле­восторонняя асимметрия. Коэффициент асимметрии может из­меняться от -3 до +3.

В практических расчетах часто в качестве показателя асим­метрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, т.е. .

Это дает возможность определить не только величину асим­метрии, но и проверить наличие асимметрии в генеральной сово­купности. Принято считать, что асимметрия выше 0,5 (независи­мо от знака) считается значительной. Асимметрия меньше 0,25 – незначительная.

Пример. Рассчитаем коэффициент асимметрии по дан­ным о распределении фирм по стоимости основных фондов (табл. 7.6).

Таблица 7.6

Расчет коэффициента асимметрии

Группы фирм по стоимости

основных фондов,

млн. руб.

х

Количество фирм fi

Середина интервала

xi

k = 0,5

x’fi

(x’)2fi

(x’)3fi

(x’)4fi

0,5-1,0

20

0,75

-2

-40

80

-160

320

1,0-1,5

40

1,25

-1

-40

40

-40

40

1,5-2,0

25

1,75

0

0

0

0

0

2,0-2,5

20

2,25

1

20

20

20

20

Итого

105

-

-

-60

140

-180

380

Решение. Определяем условные моменты m1, m2 и m3, а так­же центральные моменты μ2 и μ3, необходимые для вычисления коэффициента асимметрии:

Коэффициент асимметрии для данного ряда

Полученный результат свидетельствует о наличии незначи­тельной правосторонней асимметрии.

Для симметричных распределений может быть также рассчи­тан показатель эксцесса:

.

При симметричном распределении Ek = 0. Если Ek > 0, рас­пределение является островершинным; если Ek < 0  плосковер­шинным.

Вычислим Ek по данным табл. 7.6, определив вначале вели­чину четвертого центрального момента: . Тогда . Таким образом, исследуемое распределе­ние является островершинным.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпи­рическое распределение к типу нормального распределения.

Построение нормального распределения по эмпирическим данным. Имея дело с эмпирическим распределением, можно предположить, что данному распределению соответствует опре­деленная, характерная для него теоретическая кривая. Выдвинув гипотезу о той или иной форме распределения, стремятся опи­сать эмпирический ряд с помощью математической модели, выражающей некоторый теоретический закон распределения. Среди различных кривых распределения особое место занимает нормальное распределение.

Нормальное распределение чаще всего выражается следую­щей стандартизованной кривой нормального распределения:

,

где уt – ордината кривой нормального распределения;

–стандартизованная (нормированная) величина;

е и π – математические постоянные:

хi – значения изучаемого признака,

–средняя арифметическая ряда,

σ – среднее квадратическое отклонение изучаемого признака.

Как видно из уравнения, два параметра – средняя арифмети­ческая () и среднее квадратическое отклонение (σ) определя­ют черты симметричной кривой нормального распределения. В зависимости от их значения она может иметь разный центр груп­пирования, быть более удлиненной или сжатой.

Пример. Рассчитаем значения частот теоретического ряда распределения на основании эмпирических данных об урожай­ности зерна в 500 фермерских хозяйствах, представленных в табл. 7.7.

Таблица 7.7

Расчет теоретических частот нормального распределения

Урожай­ность,

ц/га

Сере­дина интер-

вала

xi

Кол-во хоз-в

fi

xifi

Теоретические

частоты

А

1

2

3

4

5

6

7

8

9

До 38,25

38,0

2

76,0

1444

2888

-3

-3

0,004

1

38,25-38,75

38,5

3

115,0

1482

4446

-2,5

-2,5

0,017

4

38,75-39,25

39,0

10

390,0

1521

15210

-2,0

-2,0

0,054

13

Продолжение таблицы 7.7

А

1

2

3

4

5

6

7

8

9

39,25-39,75

39,5

31

1224,5

1560

48360

-1,5

- 1,5

0,130

32

39,75-40,25

40,0

72

2880,0

1600

115200

-1,0

-1,0

0,242

61

40,25-40,75

40,5

85

3442,5

1640

139400

-0,5

-0,5

0,352

89

40,75-41,25,

41,0

94

3854,0

1681

158014

0

0

0,399

98

41,25-41,75

41,5

88

3652,0

1722

151536

0,5

0,5

0,352

89

41,75-42,25

42,0

62

2604,0

1764

109368

1,0

1,0

0,242

61

42,25-42,75

42,5

37

1572,5

1806

66822

1,5

1,5

0,130

32

42,75-43,25

43,0

12

516,0

1849

22188

2,0

2,0

0,054

13

43,25-43,75

43,5

3

130,5

1892

5676

2,5

2,5

0,017

4

Свыше 43,75

44,0

1

44,0

1936

1936

3,0

3,0

0,004

1

Итого

-

500

20501,5

-

841044

0

0

-

498

Для данного эмпирического распределения находим сначала значения = 41 ц/га и σ = 1,0 (они рассчитаны обычным спосо­бом и не воспроизведены в табл. 7.7).

Затем находим отклонения хi (табл. 7.7 гр. 6) и стандар­тизованные отклонения (табл. 7.7 гр. 7) для данного варианта. Значения же теоретической частоты для нее исчисляются по известной уже формуле: .

Так как величина остается одной и той же для всего распределения с равными интервалами, в частности в нашем примере , то достаточно ее найти один раз и умножить на величинуφ(t) при данном t, тогда получим искомую теоретическую частоту (табл. 7.7 гр. 9).

Критерии согласия. Количественная характеристика соответ­ствия может быть получена с помощью особых статистических показателей-критериев согласия. Известны критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, Б.С. Ястремского и А.Н. Колмогорова.

Критерий согласия Пирсона 2) вычисляется по формуле

,

где fЭ и fT – эмпирические и теоретические частоты соответственно.

С помощью величины χ2 по специальным таблицам прило­жения определяется вероятность Р (χ2). Входами в таблицу явля­ются значения χ2 и число степеней свободы γ = n – 1. На основе Р выносится суждение о существенности расхождения между эм­пирическим и теоретическим распределениями. При Р > 0,5 счи­тается, что эмпирическое и теоретическое распределения близ­ки. При Р(0,2; 0,5) совпадение между ними удовлетворитель­ное, в остальных случаях недостаточное.

Критерий Романовского (С), также используемый для про­верки близости эмпирического и теоретического распределений, определяется следующим образом:

,

где χ2 – критерий Пирсона:

γ – число степеней свободы.

При С < 3 различие несущественно, что позволяет считать эмпирическое распределение близким к нормальному.

Критерий Ястремского (L) может быть найден на основе следующего соотношения:

,

где N – объем совокупности:

pq – дисперсия альтернативного признака;

k – число вариантов или групп;

Q – принимает значение 0,6, при числе вариантов или групп от 8 до 20.

Если L < 3, то эмпирическое распределение соответствует теоретическому.

Критерий Колмогорова (λ) вычисляется по формуле

,

где D – максимальное значение разности между накопленными эмпиричес­кими и теоретическими частотами;

Σf – сумма эмпирических частот.

Необходимым условием использования этого критерия явля­ется достаточно большее число наблюдений (не меньше ста).

Пример. Рассчитаем критерии Колмогорова и Пирсона по данным табл. 7.8.

Таблица 7.8

Расчет критерия Колмогорова по данным об урожайности зерновых

в 500 фермерских хозяйствах

Урожайность, ц/га

xi

Частоты ряда распределения

Накопленные частоты

|fЭ – fT|

эмпирические

fЭ

теоретические

fT

эмпирические

fЭ

теоретические

fT

До 38,25

2

1

2

1

1

38,25-38,75

3

4

5

5

0

38,75-39,25

10

13

15

18

3

39,25-39,75

31

32

46

50

4

39,75-40,25

72

61

118

111

7

40,25-40,75

85

89

203

200

3

40,75-41,25

94

98

297

298

1

41,25-41,75

88

89

385

387

2

41,75-42,25

62

61

447

448

1

42,25-42,75

37

32

484

480

4

42,75-43,25

12

13

496

493

3

43,25-43,75

3

4

499

497

2

Свыше 43,75

1

1

500

498

2

Итого

500

498

-

-

Как видно из табл. 7.8, максимальное значение разности между эмпирическими и теоретическими частотами составляет 7, т.е. D=7.

Следовательно, в нашем примере величина критерия Колмо­горова

.

По таблицам вероятностей Р (λ) определяем, что λ = 0,31 соответствует Р(х), близкая к 1,00. Это означает, что с вероятно­стью, близкой к 1, можно утверждать, что отклонения фактичес­ких частот от теоретических в нашем примере являются случай­ными. Следовательно, можно считать, что в основе фактического распределения фермерских хозяйств по урожайности лежит нормальное распределение.

Этот же вывод подтверждается расчетом χ2-критерия Пирсо­на (табл. 7.9).

Таблица 7.9

Расчет критерия Пирсона по данным об урожайности зерновых

в 500 фермерских хозяйствах

Урожайность, ц/ га

хi

Частоты распределения ряда

fЭ – fТ

эмпирические

fЭ

теоретические

fТ

До 38,25

2

1

0

0

5

5

38,25-38,75

3

4

38,75-39,25

10

13

3

1,70

39,25-39,75

31

32

1

0,03

39,75-40,25

72

61

11

2,00

40,25-40,75

85

89

4

0,05

40,75-41,25

94

98

4

0,16

41,25-41,75

88

89

1

0,01

41,75-42,25

62

61

1

0,02

42,25-42,75

37

32

5

0,78

42,75-43,25

12

13

1

0,10

43,25-43,75

3

4

1

0,20

4

5

Свыше 43,75

1

1

Итого

500

499

-

5,05

Из данных табл. 7.9 видно, что χ2 = 5,05. По таблицам веро­ятностей Р(χ2) = 0,9834. Таким образом, эмпирическое и теоре­тическое распределения близки.

Критерий Романовского . Следовательно, теоретическое распределение эмпирического ряда удов­летворительное.

Для характеристики структуры вариационных рядов приме­няются показатели особого рода, которые можно назвать струк­турными средними.

Характеристики вариационного ряда.

Мода – значение признака, наиболее часто встречающееся в исследуемой совокупности.

Медиана – значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.

Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой. Вычисление медианы в диск­ретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух зна­чений признака, расположенных в середине ряда.

Пример. Рассчитаем моду и медиану по данным табл. 7.10.

Таблица 7.10

Распределение обуви, проданной коммерческой фирмой в январе 1998 г.

Размер

34

35

36

37

38

39

40

41

42

43

44 и

более

Итого

Количество про­данных

пар, % к итогу

3

5

7

9

10

13

15

14

20

3

1

100

Накоп­ленные частоты

3

8

15

24

34

47

62

-

В этом ряду распределения мода равна 42. Именно этот раз­мер обуви в январе 1998 г. пользовался наибольшим спросом.

Для определения медианы надо подсчитать сумму накоплен­ных частот ряда. Наращивание продолжается до получения на­копленной суммы частот, впервые превышающей половину. В нашем примере сумма частот составила 100, ее половина – 50.

Накопленная сумма частот ряда равна 62. Ей соответствует зна­чение признака, равное 40. Таким образом, 40-й размер обуви является медианным.

Для интервальных вариационных рядов мода определяется по формуле

,

где хМо – нижняя граница значения интервала, содержащего моду;

iМо – величина модального интервала;

fMo – частота модального интервала;

fMo-1 – частота интервала, предшествующего модальному;

fMo+l – частота интервала, следующего за модальным.

Медиана интервального ряда распределения определяется по формуле

,

где хМе – нижняя граница значения интервала, содержащего медиану;

iMе – величина медианного интервала;

Σfсумма частот;

SMe-1 – сумма накопленных частот, предшествующих медианному интер­валу;

fMe – частота медианного интервала

Пример. Рассчитаем моду и медиану по данным табл. 7.11.

Следовательно, наибольшее число семей имеют среднедушевой доход 772 руб.

Таким образом, половина семей города имеет среднедушевой доход менее 780 руб., остальные семьи – более 780 руб.

Таблица 7.1

Распределение семей города по размеру среднедушевого дохода

в январе 1998 г.

Группы семей по размеру дохода, руб.

Число семей

Накопленные частоты

Накопленные частоты, % к итогу

До 500

600

600

6

500-600

700

1300

13

600-700

1700

3000

30

700-800

2500

5500

55

800-900

2200

7700

77

900-1000

1500

9200

92

Свыше 1000

800

10000

100

Итого

10000

-

-

Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку едини­цы ранжированного ряда. Например, можно найти значение при­знака у единиц, делящих ряд на четыре равные части, десять или сто частей. Эти величины называются «квартили», «децили» и «перцентили».

Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Различают квартиль нижний (Q,), отделяющий 1/4 часть сово­купности с наименьшими значениями признака, и квартиль вер­хний (Q3), отсекающий 1/4 часть с наибольшими значениями при­знака. Это означает, что 25% единиц совокупности будут мень­ше по величине Q1; 25% единиц будут заключены между Q1 и Q2; 25% - между Q2 и Q3 и остальные 25% превосходят Q3. Средним квартилем Q2 является медиана.

Для расчета квартилей по интервальному вариационному ряду используют формулы:

;

,

где – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%);

–нижняя граница интервала, содержащего верхний квартиль (интер­вал определяется по накопленной частоте, первой превышающей 75%);

–накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

–то же для верхнего квартиля;

–частота интервала, содержащего нижний квартиль;

–то же для верхнего квартиля.

Рассмотрим расчет нижнего и верхнего квартилей по данным табл. 7.11. Нижний квартиль находится в интервале 600-700, накопленная частота которого равна 30%. Верхний квартиль ле­жит в интервале 800-900 с накопленной частотой 77%. Поэто­му получим:

Итак, 25% семей имеют среднедушевой доход менее 671 руб., 25% семей – свыше 891 руб., а остальные имеют доход в преде­лах 671-891 руб.