Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СТАТИСТИКА (пособие 2012)

.pdf
Скачиваний:
67
Добавлен:
13.04.2015
Размер:
2.98 Mб
Скачать

Например, рассчитать структурные средние представленного ряда, сделать выводы о структуре численности работников по объему произведенной продукции:

Объем произведенной

число работников

Si

продукции, тыс.руб.

 

 

до 45

14

14

45-56

20

34

56-78

30

64

78-94

24

88

свыше 94

12

100

Итого

100

 

На основе выполненных в таблице расчетов модальный и медианный интервал совпадают, это интервал 56;78 , а тогда мода и медиана:

M o

56

 

30

20

 

(78 56) 69,750 тыс.руб., чаще всего

 

 

 

 

 

 

20)

(30

 

 

 

(30

24)

 

работники предприятия производят продукции на 69750 руб.,

M

 

56

50 34

(78 56) 67,733 тыс.руб., т.е. 50% работников производят

e

 

 

30

 

 

 

 

 

 

 

 

 

 

продукции менее, чем на 67733 руб., а 50% более, чем на 67733 руб. Рассмотренные в этой главе обобщающие показатели: абсолютные,

относительные, средние и структурные средние позволяют сделать выводы об общих изменениях изучаемых статистических показателях: структуре совокупности, сравнении отдельных частей совокупности и единиц совокупности, интенсивности и динамики развития явления или процесса, а также общие закономерности в совокупности на основе средних величин.

3.5. Меры вариации, их сущность и роль.

Одной из важнейших задач статистики является измерение вариации статистического показателя. Одной из простейших мер вариации является размах

или колеблемость варьирующего признака: R xmax xmin - разность между

самым и самым маленьким значением признака, но она не описывает вариацию признака внутри интервала [xmax; xmin].

Характеристикой, которая дает обобщенную характеристику ряда и гасит случайные отклонения значений признака, является средняя. Вокруг значения средней величины происходят колебания признака, для обобщения этих колебаний применяется средняя величина этих отклонений.

41

Среднее линейное отклонение и среднее квадратическое отклонение

Среднее линейное отклонение d

 

 

xi

x

 

, используется при

 

 

 

 

n

 

 

 

 

 

 

 

 

исчислении средней величины по формуле простой средней арифметической простой для несгруппированных данных, xi – индивидуальное значение признака, x - среднее значение признака, n – объем совокупности. Для сгруппированных

данных применяется d xi x fi , т.е. при исчислении средней величины

fi

признака по формуле средней арифметической взвешенной, где xi – отдельное значение признака в группе (для дискретных рядов) и середина соответствующего интервала (для интервальных рядов), x - среднее значение признака, fi – частота или частость группы.

При достаточно большом размахе величина линейного отклонения достигает или превышает среднее значение признака. При различии максимального и минимального значения признака на порядок или более, эта характеристика не описывает характер вариации. Для такого описания применяют средний квадрат отклонений от средней величины или дисперсию и среднее квадратическое отклонение, которое является корнем второй степени из дисперсии.

Среднее квадратическое отклонение для несгруппированных данных.

2

 

(x

i

x)2

средний квадрат отклонений от средней или дисперсия,

 

 

-

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

которая

описывает

структуру совокупности (дисперсия),

 

(x

 

x)2

 

i

-

 

 

 

 

 

 

 

 

 

 

 

n

среднее квадратическое отклонение от средней величины признака, где xi индивидуальные значения признака, x - среднее значение, n – объем совокупности.

Среднее квадратическое отклонение для сгруппированных данных.

2

(x

x)2 f

i - средний

i

fi

 

 

 

 

 

 

 

 

дисперсия.

(x

x)2 f

i ,

i

fi

 

 

 

 

квадрат отклонений от средней или

среднее квадратическое отклонение от

средней, где xi конкретное значение признака в группе для дискретных рядов и середина интервала для интервальных рядов, x - среднее значение признака, fi – численность или частота в группе.

42

Свойства дисперсии:

1.Если каждое значение признака изменить в к раз, то дисперсия изменится в к2 раз;

2.Если каждое значение признака изменить на одно и то же число, то дисперсия не изменится

Такие характеристики вариации признака, как средняя величина и среднее квадратическое отклонение для интервальных рядов с равными интервалами, могут быть рассчитаны по способу моментов:

Среднее значение признака по способу моментов

x

xi

' fi

h A ,

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия по способу моментов

 

 

(xi ' )2

fi

 

 

 

 

 

 

 

 

 

2

 

h

2

(x

A)

2

 

 

fi

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где А- условный нуль, равный варианте с максимальной частотой (середина

 

 

A

 

 

 

интервала с максимальной частотой), h- шаг интервала, x '

xi

( x

 

-

 

 

i

i

h

 

 

 

 

 

 

 

середина интервала).

 

 

 

 

По характеру вариации признаки в статистике подразделяются на альтернативные, дискретные и непрерывные. К двум последним разновидностям относят количественные (числовые) признаки, для которых меры вариации представлены. Оценка вариации альтернативного признака (обладание или не обладание определенным свойством) – требует дополнительных построений. Пусть 1 – значение признака для единиц совокупности, обладающих изучаемым свойством, 0 – значение признака для единиц совокупности, необладающих изучаемым свойством, р – доля единиц, обладающих изучаемым свойством, q – доля единиц, необладающих изучаемым свойством, в результате получается

зависимость

p q 1 q 1 p , тогда

среднее значение

признака

x xi

fi

 

1 p 0 q

p ,

а среднее

 

квадратическое

отклонение

 

 

 

 

fi

 

 

p q

 

 

 

 

 

 

2

(x x)

2 f

i

 

(1 p)2

p (0 p)2 q

p q .

 

 

i

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

p q

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим пример: Пусть имеются следующие данные о результатах проверки качества деталей, известно, что 4% из них бракованные. Определить среднее квадратическое отклонение доли брака. Тогда:

p 0,04; q 0,96 2 0,04 0,96 0,0384; 0,196 , это означает, что среднее квадратическое отклонение доли брака составит 19,6%.

Величина коэффициента вариации v x 100% говорит об однородности

изучаемой совокупности, так, если вариация меньше либо равняется 33%, то

43

совокупность считается однородной, в противном случае, следует осуществить перегруппировку. Формулы, используемые, для расчета среднего линейного отклонения – средняя арифметическая простая и взвешенная, для расчета среднего квадратического отклонения и коэффициента вариации применяется формула средней квадратической.

Для выполнения оценки влияния вариации фактора, положенного в основании группировки, на вариацию результативного признака (результата) используется правило сложения дисперсий, в котором отражена общая вариация

под влиянием всех фактором на базе общей дисперсии: 2 (xi x)2 fi ,

fi

систематическая вариация результата под влиянием признака-фактора, положенного в основание группировки оценивается на базе межгрупповой

дисперсии: 2 ( xi x ) fi , вариация под влиянием неучтенных факторов

fi

оценивается на базе средней из внутригрупповых дисперсий: средняя из

 

 

2

 

2

f

 

 

2

 

 

 

 

 

 

внутригрупповых:

i

 

i

, где

- внутригрупповая

дисперсия

 

 

 

 

 

i

 

fi

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

показывает вариацию внутри группы и рассчитывается: 2

 

( x

x

)2 f

i .

i

i

 

 

 

 

 

 

 

 

 

 

i

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая дисперсия, межгрупповая и средняя из внутригрупповых связаны

равенством, представляющим собой правило

сложения дисперсий:

2

2

2 .

 

 

 

i

 

 

 

Эмпирическое корреляционное отношение

2

 

 

показывает по шкале

 

 

 

2

Чеддока силу связи между фактором и результатом, знак перед корнем показывает направление связи. Шкала Чеддока для определения силы связи между фактором и результатом

 

 

 

 

 

До 0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сила

 

слабая

 

умеренная

заметная

сильная

очень

 

 

связи

 

 

 

 

 

 

 

 

сильная

 

Из таблицы видно, что

 

 

 

1 1 1. Тесноту связи между признаками

 

 

показывает

эмпирический коэффициент детерминации 2 ,

выраженный в

процентах (часть изменений результата под влиянием фактора).

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же

44

признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней К0 Rx 100% .

Относительное линейное отключение характеризует долю усредненного

 

 

 

 

 

 

 

 

 

 

значения признака абсолютных отклонений от средней величины K

 

 

d

100% .

 

 

 

 

d

 

x

 

 

 

 

 

 

 

 

 

 

Рассмотрим пример:

 

 

 

 

 

 

 

 

Стоимость 1 кв.м, $

Общая площадь квартир, кв.м

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1033

1035

401

 

 

 

 

 

 

 

1035

1037

502

 

 

 

 

 

 

 

1037

1041

652

 

 

 

 

 

 

 

1041

1047

1501

 

 

 

 

 

 

 

1047

1051

1352

 

 

 

 

 

 

 

1051

1073

1052

 

 

 

 

 

 

 

1073

1095

982

 

 

 

 

 

 

Определить: среднюю стоимость квадратного метра жилья, дисперсию и однородность совокупности, оценить отклонение крайних значений от средней.

Так как данные сгруппированы, а стоимость жилья – группировочный признак, используется формула средневзвешенной для расчета средней стоимости квадратного метра жилья, общая площадь квартир – частоты. Тогда:

Стоимость 1 кв.м,

Общая площадь

 

 

 

 

 

x

f

 

 

(xi x)

2

fi

 

$

 

 

 

 

 

квартир, кв.м

 

 

Si

 

xi

i

 

i

 

 

1033

 

1035

 

 

 

401

 

 

401

 

1034

414634

134795,7721

1035

 

1037

 

 

 

502

 

 

903

 

1036

520072

133939,4156

1037

 

1041

 

 

 

652

 

 

1555

 

1039

677428

115929,1048

1041

 

1047

 

 

 

1501

 

 

3056

 

1044

1567044

104262,0018

1047

 

1051

 

 

 

1352

 

 

4408

 

1049

1418248

15031,55135

1051

 

1073

 

 

 

1052

 

 

5460

 

1062

1117224

98282,5087

1073

 

1095

 

 

 

982

 

 

6442

 

1084

1064488

984663,4165

Итого

 

 

 

 

 

 

 

6442

 

 

 

 

 

6779138

1586903,771

 

Средняя

стоимость квадратного

 

метра

жилья

x

6779138

=1052,334$,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6442

 

 

 

 

дисперсия

2

 

1586903,771

=246,34,

а

среднее квадратическое

 

отклонение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6442

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1586903,771

=15,69$,

 

расчет

 

 

коэффициента

 

 

вариации

 

 

 

 

 

 

 

6442

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

45

 

 

 

 

 

 

 

 

 

 

 

v

 

100%

 

15,69

=15% показывает однородность совокупности.

x

1052,45

 

Отклонение крайних значений признака от средней: К0 Rx 100% 5,9% .

Представленные меры вариации, средние и другие показатели описывают общие закономерности изменений в вариационных рядах как для несгруппированных, так и для сгруппированных данных.

3.6. Показатели асимметрии и эксцесса, центральные моменты распределения

Вариационный ряд называется симметричным если частота вариантов, равноотстоящих от некоторого значения, равны между собой, если частоты по обе стороны изменяются неодинаково, то ряд называют асимметричным или скошенным. Для расчета асимметрии используются центральные моменты ( m),

которые рассчитываются по формуле:

 

 

 

(x

i

x)m f

i .

m

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Название

Формула для расчета

 

 

описание

 

1. Момент первого

1

 

(xi

x) fi

 

 

 

 

Среднее линейное отклонение

 

порядка

 

fi

 

 

 

 

 

 

 

для сгруппированных данных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Момент второго

2

 

(x

x)

2 f

i

 

Дисперсия для

 

i

 

 

 

 

 

 

 

порядка

 

fi

 

 

 

 

 

 

 

сгруппированных данных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Момент третьего

3

 

(x

x)

3 f

i

 

 

 

 

i

 

 

 

 

 

 

Показатель асимметрии

 

порядка

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Момент

4

 

(xi

x)

4

fi

 

 

 

 

четвертого

 

 

Показатель эксцесса

 

 

fi

 

 

 

 

 

 

 

 

порядка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Формулы центральных моментов первых четырех порядков представлены в таблице 3, центральный момент третьего порядка ( 3) используется для характеристики асимметричности распределения (для симметричных распределений (xi x)3 0 ), а степень асимметрии определяется с помощью

коэффициента асимметрии 3): A3 3 .

3

46

Если А3=0, то говорят, что распределение симметрично, если А3>0, то асимметрия является правосторонней, если А3<0, то асимметрия является левосторонней.

Центральный момент четвертого порядка используется для оценки эксцесса (остроты вершины распределения) на основе коэффициента эксцесса:

 

 

E

 

 

4

3 . Если

E 0 , то распределение является нормальным,

если

 

 

 

 

 

4

 

 

 

 

 

E

 

0 ,

то ряд распределения является островершинным, а если E

 

0 ,

то –

 

 

 

 

 

 

 

 

 

плосковершинным.

Контрольные вопросы

1.Что называют абсолютными показателями в статистике? Приведите пример

2.Какими бывают абсолютные величины в статистике в зависимости от единиц измерения?

3.Назовите виды относительных показателей. Приведите пример.

4.Охарактеризуйте каждый относительный показатель

5.Назовите логическую формулу для вычисления каждого относительного показателя. Приведите примеры.

6.Какие относительные показатели используются для сравнения одного и того же показателя в разное время?

7.Какой относительный показатель описывает отдельные части целого? Приведите пример.

16.Назовите виды средних величин в статистике, формулы для вычисления средних величин и приемы для выбора формулы для вычислений.

17.Приведите примеры расчета простой средней арифметической простой и взвешенной.

18.Приведите примеры расчета средней величины с помощью средней гармонической.

19.Что называют модой в статистике? Что называют медианой в статистике?

20.Чему равна мода и медиана рядов с несгруппированными данными?

21.Чему равны мода и медиана представленного ряда?

Группы по выручке от реализации

Число предприятий

продукции, тыс. у.е.

 

22

2

23

3

24

8

25

7

26

6

22. Что называется кумулятивной частотой?

47

23.Чему равна мода и медиана дискретного ряда?

24.Дайте понятие модального и медианного интервалов. Чему равна мода и медиана интервального ряда?

25.Какие ряды называют вариационными?

26.В каких случаях для расчета средней величины признака и дисперсии используется способ моментов?

27.Для чего существует шкала Чеддока?

28.Какие показатели мер вариации имеют такую же единицу измерения, что и оцениваемый признак?

29.Какой из центральных моментов показывает симметрию?

30.Потребление топлива тепловыми электростанциями составило:

 

Ед.

Годы

 

Коэффициент

Топливо

 

 

 

перевода в

измерения

2007

 

2008

 

 

условное топливо

 

 

 

 

 

Уголь

млн т

18,7

 

24,8

0,90

Мазут

млн т

54,8

 

38,9

1,37

Газ природный

млн м3

63,5

 

149,6

1,20

Определить: 1) объем потребленного топлива за каждый год; 2) структуру потребленного топлива за каждый год; 3) динамику изменения потребления по каждому виду топлива.

Тесты по теме:

1.Определить моду и медиану ряда (с точностью до 0,1):

 

 

Стаж работы, лет

Число работников,

 

 

чел.

 

 

 

 

 

До 3 лет

5

 

 

3-5

10

 

 

5-7

34

 

 

7-10

29

 

 

Свыше 10 лет

21

а)

мода- 6,5, медиана – 6,6;

 

б)

мода и медиана совпадают;

 

в)

мода- 6,6, медиана – 7,0;

 

г)

мода- 6,7, медиана – 7,1.

 

2.

Виды абсолютных величин:

 

а)

индивидуальные и общие;

 

б)

координации, сравнения, динамики и структуры;

в)

выполнения плана, планового задания и динамики;

г)

натуральные, стоимостные, трудовые.

48

3.В регионе на 100 мужчин приходится 126 женщин, удельный вес мужчин в регионе составляет (%):

а)

26;

б)

44,2;

в)

79,4;

г)

55,7.

4.Торговое предприятие перевыполнило собственный годовой план по товарообороту на 5%, пи этом объем товарооборота снизился на 2%. Определите относительный показатель планового задания:

а)

107,1%;

б)

93,3%;

в)

102,9%;

г)

103%.

5.Какую относительную величину можно рассчитать на основе следующих данных: число проживающих в Ленинском районе города 265000 человек, их обслуживают 608 врачей:

а) относительный показатель структуры; б) относительный показатель сравнения;

в) относительный показатель интенсивности; г) относительный показатель координации.

6.Выберите среди предложенных показателей относительные показатели структуры:

а) обеспеченность общежитием студентов – 67%; б) число заболевших гриппом в текущем году в 1,2 раза превысило

численность заболевших в прошлом; в) прибыль коммерческого банка от валютных операций в январе по

сравнению с декабрем уменьшилась на 24%; г) число студентов, сдавших зимнюю сессию на «4» и «5» - 78%.

7.Если значения частот увеличить в средней арифметической в 5 раз, то среднее значение признака:

а) не изменится; б) увеличится в 5 раз;

в) уменьшится в 5 раз.

8. Если значения признака увеличить в 5 раз, то дисперсия: а) не изменится; б) увеличится в 5 раз;

в) уменьшится в 5 раз.

49

9.Изделие А производится на двух предприятиях отрасли. На первом предприятии себестоимость производства единицы продукции составляет 500 руб., на втором – на 50 руб. больше. Какова среднеотраслевая

 

себестоимость производства изделия А, если на долю первого предприятия

 

приходится 60% выпускаемых изделий?

 

 

а)

525 руб.;

б)

520 руб;

в)

530 руб.

10.В страховой компании медианное значение страховой суммы одного застрахованного автомобиля – 7 тыс.у.е. Это означает, что:

а) большая часть автомобилей застрахована на эту сумму; б) половина автомобилей застрахована на сумму менее 7 тыс.у.е., а

половина на сумму более 7 тыс.у.е.; в) половина автомобилей застрахована на сумму 7 тыс.у.е.;

г) каждый второй автомобиль застрахован на сумму 7 тыс.у.е.

11.Какая формула средней используется для расчета средней производительности труда:

 

Производительность

Число работников,

В % к итогу численность

 

труда, тыс. руб./чел.

чел.

группы

 

7-9

12

25,5%

 

9-11

13

27,7%

 

11-13

5

10,6%

 

13-15

6

12,8%

 

Свыше 15

11

23,4%

а)

средняя из групповых средних;

 

б)

средняя арифметическая простая;

 

в)

средняя арифметическая взвешенная;

 

г)

средняя гармоническая.

 

12.Могут ли в качестве весов средней (fi) использоваться относительные величины?

а) да, могут всегда; б) могут иногда; в) нет, не могут;

г) только в интервальных рядах с равными интервалами.

13.Какая формула средней используется для расчета средней заработной платы в торговом объединении?

№ магазина

Средняя зарплата в магазине,

Фонд зарплаты в магазине,

 

руб.

тыс. руб.

1

1564

18,768

2

1980

27,720

3

2001

20,01

4

1918

5,754

5

1804

10,824

50