Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 4. Средние величины и показатели вариации.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.84 Mб
Скачать

Средняя геометрическая

Средняя геометрическая применяется в тех случаях, когда индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики, т.е. характеризует средний коэффициент роста.

Средняя геометрическая простая исчисляется извлечением корня степени и из произведений отдельных значений — вариантов признака х:

где n — число вариантов; П — знак произведения.

Средняя геометрическая взвешенная исчисляется:

Наиболее широкое применение средняя геометрическая получила для определения средних темпов изменения в рядах динамики, а также в рядах распределения.

Средняя квадратическая и средняя кубическая

В ряде случаев в экономической практике возникает потребность расчета среднего размера признака, выраженного в квадратных или кубических единицах измерения. Тогда применяется средняя квадратическая (например, для вычисления средней величины стороны и квадратных участков, средних диаметров труб, стволов и т.п.) и средняя кубическая (например, при определении средней длины стороны и кубов).

Средняя квадратическая простая является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

где , ,… - значения признака, n- их число.

Средняя квадратическая взвешенная:

,

где - веса.

Средняя кубическая простая является кубическим корнем из частного от деления суммы кубов отдельных значений признака на их число:

,

где , ,… - значения признака, n- их число.

Средняя кубическая взвешенная:

,

где - веса.

Средняя квадратическая и средняя кубическая необходимы для расчета средних значений, когда исходные данные представлены в квадратных или кубических единицах измерения.

Структурные средние

Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где - нижняя граница интервала, который содержит медиану;

– величина медианного интервала;

– частота медианного интервала;

- сумма накопленных частот интервалов, предшествующих медианному;

– сумма частот интервалов, предшествующих медианному.

Пример. Предположим, что в одной комнате оказалось 19 бедняков и один миллиардер. Каждый кладет на стол деньги из своего кармана. По пять долларов кладет каждый бедняк, а миллиардер — $1 млрд. В сумме получается $1 000 000 095. Если мы разделим деньги равными долями на 20 человек, то получим $50 000 004,75. Это будет среднее арифметическое значение суммы наличных, которая была у всех 20 человек в этой комнате.

Медиана в этом случае будет равна $5 (полусумма десятого и одиннадцатого, срединных значений ранжированного ряда). Можно интерпретировать это следующим образом. Разделив нашу компанию на две равные группы по 10 человек, мы можем утверждать, что в первой группе каждый положил на стол не больше $5, во второй же не меньше $5. В общем случае можно сказать, что медиана это то, сколько принес с собой средний человек. Наоборот, среднее арифметическое же совершенно неподходящая характеристика в нашем случае, поскольку выходит, что каждый, будь то бедняк или миллиардер, имел приблизительно $50 000 004,75.

Кумулята предназначена для графического изображения накопленных частот (частостей) количественных данных. При построении кумуляты по оси абсцисс откладываются варианты ряда (верхняя граница интервала, в данном примере – возраст в годах), а по оси ординат накопленные частоты (частости). Из точки на шкале накопленных частот (частостей), соответствующей 50% (или порядковому номеру медианы), параллельно оси абсцисс, до пересечения с кумулятой, проводится прямая. Затем из точки пересечения данной прямой с кумулятой на ось абсцисс опускается перпендикуляр. Точка пересечения прямой с осью абсцисс и является медианой.

Рассмотрим определение медианы по данным о распределении населения Российской Федерации по полу и возрастным группам на начало 2007 года (Таблица 1. 2.5).

Пример. Все население России на начало 2007 года составляло 142 221 млн. человек, из них мужчины – 65 849 млн. человек, женщины - 76372 млн. человек.

В Таблице 1.2.5 население разбито на 15 возрастных групп. Ширина каждого интервала равна четырем годам. Следует отметить, что у последней группы открытый интервал, а у остальных групп –закрытый.

Таблица 1.2.5

Распределение населения Российской Федерации по полу и возрастным группам на начало 2007 года (тыс. чел.)

Возраст, лет

Все население

Все население

мужчины и женщины

мужчины

женщины

142221

65849

76372

в том числе в возрасте, лет:

0-4

7223

3708

3515

5-9

6376

3262

3114

10-14

7283

3721

3562

15-19

11088

5651

5437

20-24

12671

6409

6262

25-29

11165

5576

5589

30-34

10442

5175

5267

35-39

9459

4658

4801

40-44

10368

4994

5374

45-49

12067

5688

6379

50-54

10804

4901

5903

55-59

8985

3925

5060

60-64

4336

1771

2565

65-69

7458

2766

4692

70 и более

12496

3644

8852

Построим кумулятивную кривую. Левая ось (ось ординат) показывает накопленные частости, нижняя ось (ось абсцисс) – количество лет. От оси ординат, из точки соответствующей 50%, параллельно оси абсцисс проводится прямая до пересечения ее с кумулятой. Из точки пересечения прямой и кумуляты, на ось абсцисс опускается перпендикуляр (рис. 1.2.1).

Рис. 1.2.1 - Расчет медианы по интервальному ряду распределения графическим способом (по частостям).

Пример. Определить медиану заработной платы рабочих.

Месячная з/п , руб.

Число рабочих

Сумма накопительных частот

110

2

2

130

6

8 (2+6)

160

16

24 (8+16)

190

12

220

4

40

Для определения медианы надо подсчитать сумму накопленных частот ряда. Наращивание итога продолжается до получения накопленной суммы частот, превышающей половину. В нашем примере сумма частот составила ее половина - 20.

Накопленная сумма частот ряда получилась равной Варианта, соответствующая этой сумме, т.е. 160 руб., и есть медиана ряда.

Если же сумма накопленных частот против одной из вариант равна точно половине сумме частот, то медиана определяется как средняя арифметическая этой варианты и последующей.

Пример. Определить медиану заработной платы:

Месячная з/п, руб.

Число рабочих

Сумма накопительных частот

110

2

2

130

6

8 (2+6)

160

12

20 (8+12)

190

16

220

4

40

Медиана будет равна:

Ме = (150 + 170) / 2 = 160 руб.

Рассмотрим расчет медианы в интервальном вариационном ряду.

Пример. Определить медиану числа рабочих:

Группы предприятий по числу рабочих

Число предприятий

Сумма накопительных частот

100 — 200

1

1

200 — 300

3

4 (1+3)

300 — 400

7

11 (4+7)

400 — 500

30

41 (11+30)

500 — 600

19

600 — 700

15

700 — 800

5

ИТОГО

80

Определим прежде всего медианный интервал. В данной задаче сумма накопленных частот, превышающая половину всех значений, соответствует интервалу 400 - 500. Это и есть медианный интервал, в котором находится медиана. Определим ее значение по приведенной выше формуле.

Известно, что:

Следовательно,

.

Мода – варианта, чаще всего встречающаяся в ряду распределения, т.е. варианта, которой соответствует наибольшая частота.

Для дискретного ряда распределения мода определяется наиболее просто: варианта, против которой расположена наибольшая частота, и будет модой.

В интервальном ряду наибольшая частота указывает не на модальную варианту, а на содержащий моду интервал. Вычисление моды производится по следующей формуле:

, где

– начло (нижняя граница) модального интервала;

– величина интервала;

– частота модального интервала;

– частота интервала, предшествующего модальному;

– частота интервала, следующего за модальным.

Мода применяется, например, при определении размера одежда, обуви, пользующихся наибольшим спросом у покупателей, наиболее распространенной цены на тот или иной товар на рынке и т. д.

Пример. В таблице приведены итоговые оценки учащихся некоторого класса по математике. Найти моду данного распределения.

Количество баллов

1

2

3

4

5

6

7

8

9

Число учащихся

1

1

2

3

4

4

6

5

3

Из всех оценок чаще всего встречается 7 баллов: шесть раз. Поэтому Мо = 7. Этот результат имеет вполне определенный смысл - больше всего учащихся класса имеют по математике 7 баллов.

Пример. Распределение проданной обуви по размерам характеризуется следующими показателями:

размер обуви

36

37

38

39

40

41

42

43

44

45

и выше

число пар, в % к итогу

1

6

8

22

30

20

11

1

1

В этом ряду распределения мода равна 41. Именно этот размер обуви пользовался наибольшим спросом покупателей.

Пример. Распределение предприятий по численности промышленно – производственного персонала характеризуется следующими данными:

Группы предприятий по числу работающих, чел.

Число предприятий

100-200

1

200-300

3

300-400

7

400-500

30

500-600

19

600-700

15

700-800

5

В этой задаче наибольшее число предприятий (30) имеет численность работающих от 400 до 500 человек. Следовательно, этот интервал является модальным интервалом ряда распределения.

Введем следующие обозначения:

=400, =100, =30, =7, =19

Подставим эти значения в формулу моды и произведем вычисления:

Квартили – это значения признака, делящие ранжированную совокупность на четыре равновеликие части.

Различают:

  • нижнюю квартиль , отделяющую ¼ часть совокупности с наименьшими значениями признака;

  • среднюю квартиль – медиану;

  • верхнюю квартиль , отделяющую ¼ часть совокупности с наибольшими значениями признака.

Для расчета квартилей по интервальному вариационному ряду используются формулы:

где

- нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой, превышающей 25%);

- нижняя граница интервал, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой, превышающей 75%);

- накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

- накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль;

h – длина интервала;

, - частота интервала, содержащего нижний и верхний квартиль соответственно.

Квартильный размах – разница между верхней и нижней квартилями:

Квартильный размах охватывает 50 % значений выборки.

Пример. Для данных таблицы:

интервала

Интервалы

Середина интервала

Частота

Накопленная частота

Нижняя граница

Верхняя граница

1

4,25

5,95

5,1

4

4

2

5,95

7,65

6,8

7

11

3

7,65

9,35

8,5

16

27

4

9,35

11,05

10,2

9

36

5

11,05

12,75

11,9

6

42

6

12,75

14,45

13,6

5

47

7

14,45

16,15

15,3

3

50

Всего:

50

-

Интервал, содержащий нижнюю квартиль – 3-ий, т. к. накопленная частота (27) первая превышает ¼ общей суммы частот (12,5).

Интервал, содержащий верхнюю квартиль – 5-ий, т. к. накопленная частота (42) первая превышает ¾ общей суммы частот (37,5).

,

Квартильный размах – полоса, шириной 11,48-7,81=3,67 содержит 50% значений выборки.