Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

LEKTsII_OTS_STAROE

.pdf
Скачиваний:
12
Добавлен:
16.03.2015
Размер:
1.49 Mб
Скачать

11

дианных значений.

Расположение ма-

 

Отклонение от

Отклонение от ме-

 

 

газина от базы,

 

среднего значения,

дианного значения,

 

 

км (х)

 

х х

х Ме

 

 

 

 

 

 

 

 

 

1

2

 

 

3

2

 

2

3

 

 

2

1

 

3

4

 

 

1

0

 

4

6

 

 

1

2

 

5

10

 

 

5

6

 

Итого

25

 

 

13

11

 

Среднее значение

 

25 : 5

5 км. Медианой нечетного ряда является центральный вариант, находящийся на 3-

x

ем месте, равный Ме = 4 км.

 

 

 

 

Пример 6. Рассчитать среднюю заработную плату в целом по трем предприятиям в зависимости от имеющихся данных

Предприятие

Численность

Месячный ФЗП,

Средняя

 

персонала,

тыс. руб., w i

заработная

 

чел. fi

 

плата,

x

i

А

1

2

3

 

 

1

540

564,84

1046

 

 

2

275

332,75

1210

 

 

3

458

517,54

1130

 

 

Итого

1273

1415,13

 

 

 

Среднюю заработную плату рассчитаем разными способами в зависимости от того, какие данные нам будут известны.

1. Если имеются данные групп 1 и 2, формула средней агрегатной

 

 

wi

1415130

1112

руб.,

x

 

 

 

 

 

fi

1273

 

 

 

 

где: wi xi fi ; xi – вариант определяемого признака; fi – вес i-го варианта.

2. Если есть данные групп 1 и 3, то общая средняя может быть рассчитана по формуле средней арифметической взвешенной

 

 

 

 

 

 

 

 

 

x

 

 

 

xi

fi

 

1046 540

1210 275

1130

 

458

1112 руб.

 

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

540

275

458

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Если

имеются данные 3 группы, а частоты fi

равны между собой или отсутствуют, то используются формула

средней арифметической простой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

1046

 

1210

1130

 

3386

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

1128,6

руб.

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

3

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Если имеются данные групп 2 и 3, то расчет ведется по средней гармонической взвешенной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

wi

 

 

564840

332750

 

 

517540

 

 

1112

руб.

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

wi

 

 

 

564840

 

332750

 

 

 

517540

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

1046

 

1210

 

 

 

1130

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 1. Имеются следующие данные о заработной плате рабочих участка. Определить среднюю зара-

ботную плату рабочих участка.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Профессия

 

Количество

 

 

Заработная плата каждого рабочего

 

 

 

 

 

 

 

 

 

 

 

рабочих

 

 

 

 

 

 

 

 

 

 

 

 

 

участка за месяц, руб.

 

 

 

 

 

 

 

Токари

 

 

 

 

5

 

 

 

 

 

 

 

 

1700, 1208, 917, 1620, 1400

 

 

 

 

 

 

 

 

Фрезеровщики

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1810, 1550

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Слесари

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1210, 1380, 870

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Воспользуемся формулой простой средней арифметической

 

x

 

x

1700

1208

917

1620

 

1400

1810

1550

1210

1380

 

870

 

13665

1366,5 руб.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2. Распределение рабочих по стажу работы следующее. Определить средний стаж работы рабочих

участка.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стаж рабочих, лет

 

до 5 лет

 

5 - 10

 

10 - 15

 

15 и более

 

 

 

Количество рабочих, f

2

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

15

 

 

 

 

 

7

 

 

 

 

 

 

 

 

Серединное значение

2,5

 

 

 

 

 

 

 

 

 

 

 

7,5

 

 

12,5

 

 

 

 

 

17,5

 

 

 

 

 

 

 

интервала, x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

Решение. Воспользуемся формулой расчета средней арифметической взвешенной для интервального ряда. Предварительно вычислим серединное значение интервального признака х, дополнив открытые интервалы значениями недостающих границ:

 

 

0

5

5

10

 

 

 

 

10

15

 

 

15

20

 

 

 

 

x1

 

 

 

2,5 ; x2

 

 

 

7,5 ; x3

 

 

 

12,5 ; x4

 

 

 

 

17,5

 

 

2

 

 

2

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средний стаж рабочих участка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

x f 2,5

2 7,5

6

12,5

15

17,5 7

 

12,0

лет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

2

6

15

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 3. Имеются следующие данные об экспорте продукции металлургического комбината. Опреде-

лить средний удельный вес продукции на экспорт.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вид продукции

Удельный вес Продукции на

 

 

 

Стоимость продукции на экспорт,

 

 

 

экспорт, % х

 

 

 

 

 

 

 

 

тыс. руб. w

 

 

Сталь арматурная

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

32100

 

 

 

 

Прокат листовой

 

 

 

32

 

 

 

 

 

 

 

 

 

 

 

 

42500

 

 

 

 

Решение. Уд. вес прод. наэкспорт

Стоимость продукции на экспорт

100

,

 

Стоимость всей продукции

 

 

 

или

 

w

100

– стоимость всей продукции. Воспользуемся формулой средней гармонической взвешенной. Сред-

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ний удельный вес продукции на экспорт

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

w

 

32100

42500

 

 

 

 

100

32100

42500

100

74600

100

35,0 %

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

100

 

 

32100

100

 

42500

 

100

80250

132812 ,5

213062 ,5

 

 

 

 

 

 

 

 

x

 

 

40

 

 

 

32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 4. Проведена малая выборка из партии электролампочек для определения продолжительности их

службы. Определить значения моды и медианы.

 

 

 

 

 

 

 

 

 

 

 

№ лампоч-

 

 

 

 

Срок горения, час.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

1450

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

1400

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

1370

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

1430

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

1400

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

1380

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

1270

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

1420

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

1400

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Произведем ранжирование данных по возрастанию 1270; 1370; 1380;

1400; 1400;

1400; 1420; 1430;

1450. Мода Мо = 1400, так как это значение признака встречается три раза.

 

 

 

 

 

Место медианы NMe

 

n 1

9

1

5

. Me = 1400 – значение признака на 5-ом месте в ранжированном

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ряду.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 5. Перевозка грузов по

 

автотранспортному предприятию такова. Определить среднемесячный

темп роста объема грузовых перевозок.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Месяц

 

 

 

 

 

 

 

 

Январь

 

 

 

Февраль

Март

 

 

 

 

 

 

 

Перевезено грузов, тыс. т

 

37,0

 

 

 

 

 

 

40,5

 

 

42,0

 

 

 

 

 

 

Решение. Определим цепные коэффициенты роста объема грузовых перевозок

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ТР

 

 

 

 

40,5

 

 

1,095 ; ТР

 

42,0

 

1,037 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

37,0

 

 

40,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднемесячный темп роста определим по формуле средней геометрической

 

 

 

 

 

ТР

ТР

 

 

 

 

 

 

 

ТР

2

1,095 1,037 1,066 или106,6%

 

 

 

 

1

 

 

 

 

Задача 6. Имеются следующие данные о товарообороте магазина. Определить среднюю цену мужского

костюма.

 

 

 

 

 

 

 

 

 

 

Товары

Товарооборот,

 

Цена за единицу,

 

 

тыс. руб. w

 

 

руб. х

 

Костюм мужской, х/б

50

 

 

 

50

 

 

Костюм мужской, п/ш

120

 

 

 

75

 

 

Костюм мужской, ч/ш

108

 

 

 

120

 

 

13

Решение. Применим формулу расчета средней гармонической взвешенной

 

 

 

wi

 

50

120 108

1000

 

278000

 

278000

 

x

 

79,43 руб.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

wi

 

50000

120000

108000

1000 1600 900

3500

 

 

 

 

 

 

 

 

 

xi

 

50

 

75

 

 

120

 

 

 

 

 

 

14

4. ПОКАЗАТЕЛИ ВАРИАЦИИ

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов. Степень близости данных отдельных единиц Xi к средней измеряется рядом абсолютных, средних и относительных показателей.

Средняя величина отражает тенденцию развития, то есть действие главных причин (факторов), показатели вариации измеряют силу воздействия прочих факторов.

4.1. Абсолютные и средние показатели вариации и способы их расчета

Размах вариации

R = Xmax – Xmin

 

устанавливает только крайние отклонения, то есть преде-

лы выборки.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

x

 

 

 

 

 

 

 

 

x

x

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее абсолютное линейное отклонение

d

 

 

или d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

учитывает различия всех единиц изучаемой совокупности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средний квадрат отклонений (дисперсия)

2

 

 

 

x

 

x 2

и л и 2

 

x

 

 

x 2 f

. Расчет дисперсии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

f

 

можно производить по формуле:

2

x2 f

 

 

 

xf 2

x2 f

x 2

 

f

 

 

 

f

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее квадратичное отклонение

 

2

.

Чем меньше среднее квадратичное отклоне-

 

 

 

 

ние, тем лучше средняя величина отражает собой всю представленную совокупность. Между средним абсолют-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ным и средним квадратичным отклонением существует соотношение

 

1,25d .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Свойства дисперсии.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. Уменьшение всех значений признака на одну и ту же величину не меняет ве-

 

 

2

 

xi A

2

 

 

 

 

 

 

 

 

 

личины дисперсии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Уменьшение всех значений признака в k раз уменьшает дисперсию в k2

 

 

 

 

2

 

 

xi

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

k2

 

 

 

 

 

 

 

 

 

 

3. Дисперсия от средней меньше дисперсии, исчисленной от любой величины

 

 

2

 

 

 

 

 

x A 2 f

 

 

 

 

 

А

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Альтернативный признак. Обозначим 1 – наличие признака; 0 – отсутствие; p – долю единиц, обла-

дающих данным признаком; q – долю единиц, не обладающих данным признаком (p+q=1).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее значение альтернативного признака x

 

xi fi

 

1 p

0 q

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

p

q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия альтернативного признака

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

x x 2 f (1 p)2 p (0 p)2 q q2 p p2q

pq

 

p(1

 

 

p)

 

 

 

 

 

 

 

 

 

 

p

f

 

 

 

 

p

q

 

 

 

 

p q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее квадратичное отклонение альтернативного признака

 

p

 

 

 

 

pq

 

 

p(1

 

 

 

p) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Доля брака 2 % (p=0.002, q= 0.98). Дисперсия доли брака

2p =0.02

 

0.98=0.0196. Среднее квад-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ратичное отклонение доли брака

p

0.0196

 

0.14 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.2. Виды дисперсий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Меры вариации для сгруппированных данных определяют следующие показатели.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая дисперсия характеризует вариацию признака, который зависит от всех

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

0

 

2 fi

 

 

 

2

 

 

 

 

 

x

 

условий в данной совокупности ( x 0

общая средняя для всей совокупности).

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Внутригрупповая дисперсия отражает вариацию изучаемого признака внутри

 

 

2

 

 

 

x

 

i

 

2 fi

 

 

 

 

 

 

x

 

 

группы ( xi – групповая средняя, вычисляется по правилу (х0+х1)/2).

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

Средняя внутригрупповых дисперсий характеризует случайную вариацию в

 

2

 

 

 

 

 

 

i

2 fi

 

 

 

 

 

каждой отдельной группе. Возникает от не учитываемых факторов и не зависит от

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

условий группировки.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Межгрупповая дисперсия измеряет вариацию групповых средних xi вокруг об-

 

 

 

 

 

 

 

 

 

 

 

 

 

2 f

 

 

 

2

 

 

x

i

x

0

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

щей средней. Она измеряет вариацию, обусловленную признаком, положенным в

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

основу группировки.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая дисперсия равна сумме средней из внутригрупповых и межгрупповых

 

2

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсий

 

0

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В сгруппированных данных истинные значения признака заменяются центральными значениями интер-

валов (х0+х1)/2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.3. Показатели относительного рассеивания

Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях.

Относительное линейное отклонение характеризует долю усредненного значения

K d

 

 

 

d

 

100

абсолютных отклонений от средней величины.

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент вариации используется для оценки типичности средних величин. Со-

v

 

 

 

 

 

100

вокупность считается количественно однородной, если v<33%.

 

 

 

 

 

x

 

 

 

 

 

 

 

 

Эмпирическое корреляционное отношение показывает тесноту связи группировоч-

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

ного признака и результативного.

1 группировочный признак целиком определяет

 

 

 

 

 

 

 

 

 

 

 

2

 

 

вариацию результативного;

0

влияние группировочного признака на результа-

 

 

 

 

0

 

 

 

 

тивный равно 0. Соотношения Чеддока дают качественную оценку тесноты связи.

 

 

 

 

 

 

 

 

 

 

Пример 1. Результаты опроса членов бригады приведены в таблице. Провести группировку бригады по факторному признаку «тех. обучение». Рассчитать значения средних показателей выработки дисперсий по группам и в целом по совокупности.

Табельный

Обучение

Выработка,

 

шт.

1

Да

9

2

Нет

8

3

Нет

6

4

да

7

5

нет

7

6

да

8

7

Да

8

8

Нет

7

Решение.

Сгруппируем данные по признаку «тех. обучение»

Группы рабочих

 

Число

 

 

Выработка

 

Групповая

 

 

 

 

 

 

 

рабочих

 

 

изделий,

Средняя

 

 

i

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

шт.

 

 

 

 

 

 

 

 

 

 

 

1. Прошли тех. обучение

 

4

 

 

9,8,8,7

 

 

 

 

 

 

 

8

 

 

 

 

2. Не прошли тех. обучение

 

4

 

 

8,7,7,6

 

 

 

 

 

 

 

7

 

 

 

 

Общая средняя

 

 

 

7,5 шт.

Расчет общей дисперсии

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

Выработка

 

 

 

Частота

 

х х

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

х х

х х

f

 

 

 

изделий, шт. х

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

1

 

1,5

 

 

2,25

 

 

 

 

 

2,25

 

 

 

 

 

 

8

 

 

 

3

 

0,5

 

 

0,25

 

 

 

 

 

0,75

 

 

 

 

 

 

7

 

 

 

3

 

-0,5

 

 

0,25

 

 

 

 

 

0,75

 

 

 

 

 

 

6

 

 

 

1

 

-1,5

 

 

2,25

 

 

 

 

 

2,25

 

 

 

 

 

 

Итого

 

 

 

8

 

 

 

 

 

 

 

 

 

6,0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

2 f

 

 

6,0

 

 

 

 

 

 

 

 

Общая дисперсия выработки

2

х

 

0,75 . Рассчитаем дисперсию каждой группы. Рас-

0

 

 

 

 

 

f

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чет дисперсии выработки у группы рабочих, прошедших тех. обучение.

Выработка

Частота

х х

 

 

 

2

 

 

2

 

х

 

х

х х

f

изделий, шт. х

f

 

 

 

 

 

 

 

 

 

 

 

 

 

9

1

1

 

1

 

1

 

 

 

 

 

 

16

 

 

 

 

 

8

2

0

0

0

7

1

-1

1

1

Итого

4

2

Расчет дисперсии выработки у группы рабочих, не прошедших тех. обучение.

Выработка

Частота

х х

 

 

 

2

 

 

2

 

х

 

х

х х

f

изделий, шт. х

f

 

 

 

 

 

 

 

 

 

 

 

 

 

8

1

1

 

1

 

1

 

 

7

2

0

 

0

 

0

 

 

6

1

-1

 

1

 

1

 

 

Итого

4

 

 

2

 

 

Рассчитаем среднюю из внутригрупповых дисперсий по формуле средней арифметической взвешенной

2

2

0,5

,

2

2

0,5

,

 

2

i

2f

 

0,5 4 0,5 4

0,5 .

 

1

4

2

4

 

i

f

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Этот показатель характеризует влияние на результативный признак (выработки) всех прочих факторных признаков за исключением признака, положенного в основу группировки (тех. обучение).

Найдем межгрупповую дисперсию

2

x i x 0

2 f

 

8,0 7,5 2 4 7 7,5

2 4

0,25 .

 

f

 

8

 

 

 

 

 

Различие в выработке двух групп вызывается тем, что рабочие 1-ой группы прошли обучение, а 2-ой группы не прошли.

Общая дисперсия

2

 

i

2

2

0,75 0,5 0,25

. Общая дисперсия, возникающая под воздейст-

 

 

 

 

 

вием всех факторов, должна быть равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки.

Влияние группировочного признака на результативный оценим корреляционным отношением

2

 

 

 

 

 

;

 

0,25

0,58 .

 

 

 

 

 

2

0,75

0

 

 

 

 

 

Следовательно, фактор, положенный в основу группировки, существенно влияет на производительность труда, но существуют и другие факторы, влияние которых тоже значительно.

Задача 1. Имеются данные о возрастном составе рабочих цеха (лет): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30,

22, 23, 35, 33, 27, 24, 30, 32, 28, 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29. Построить интервальный ряд распределе-

ния для 7 групп и графическое изображение ряда. Вычислить показатель центра распределения, т.е среднее значение возраста ( х ) и показатели вариации.

Решение. 1) Определим величину интервала группировки

i

R

38 18

20

3

 

 

 

 

 

n

7

7

 

 

Построим интервальный ряд распределения рабочих по возрасту.

Группы

Число

 

х

x f

x

 

2

x

 

2 f

 

x

x

рабочих по

Рабочих,

 

 

 

 

 

 

 

 

 

возрасту, (х)

F

 

 

 

 

 

 

 

 

 

18-21

1

1

19,5

19,5

84,64

84,64

21-24

3

4

22,5

67,5

38,44

115,32

24-27

6

10

25,5

153,0

10,24

61,44

27-30

10

20

28,5

285,0

0,04

 

0,4

30-33

5

25

31,5

157,5

7,84

 

39,2

33-36

3

28

34,5

103,5

33,64

100,92

36-39

2

30

37,5

75,5

77,44

154,88

Итого

30

861,0

556,8

2)

Расчет показателя среднего возраста рабочих

 

 

 

 

x f

28,4

года

 

 

 

x

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3)

Расчет структурных средних:

 

 

 

 

 

 

 

 

 

 

 

 

 

а) Модальный интервал 27-30 лет, так как fmax = 10. Значение моды

 

 

 

 

 

Mo xMo

i

 

fMo

fMo 1

 

 

27 3

 

10

6

28,33

 

fMo

fMo 1

fMo

fMo 1

10 6

10 5

 

 

 

 

 

 

 

 

 

17

б) Место медианы

NMe

n

1

15,5 .

 

 

 

2

 

 

 

 

Медианный интервал приходится на группу 27-30 лет находящуюся в середине нечетного ряда

 

 

 

n 1

s Me 1

 

 

30 1

10

 

Me x Me

i

 

2

 

27 3

 

2

 

28,65 .

 

 

 

 

 

 

 

f Me

 

10

 

 

 

 

 

 

 

 

3) Показатели вариации

Среднее абсолютное линейное отклонение

 

d

 

 

x

x f

116,0

3,87 года.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

556,8

 

 

 

 

Среднее квадратическое отклонение

 

 

 

 

 

 

 

 

 

x

4,31

года.

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент вариации

v

 

100

 

4,31

 

100

15% .

 

 

 

 

 

 

 

28,7

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вариация незначительна, следовательно, совокупность однородна.

18

5.ВЫБОРОЧНЫЙ МЕТОД В СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ

5.1.Понятие о выборочном исследовании. Способы отбора единиц из генеральной совокупности Статистическое наблюдение можно организовать сплошное и несплошное. В выборочном методе не-

сплошного наблюдения обобщающие показатели совокупности устанавливаются по некоторой ее части (сравнительно небольшой –5-10% всей совокупности). Совокупность, из которой производится отбор части единиц, называется генеральной. Отобранная часть единиц называется выборочной совокупностью, или выбор-

кой.

При использовании выборочного метода исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность и уменьшает ошибки регистрации. Выборочный метод является единственно возможным при разрушающем контроле качества продукции. Он распространен в государственной и ведомственной статистике (бюджетные обследования семей рабочих, крестьян, служащих; обследование жилищных условий), в торговле (спрос населения на товар; эффективность новых форм торговли) и т.д.

В основе отбора единиц положен принцип равных возможностей попадания в выборку каждой еди-

ницы генеральной совокупности.

Методы отбора единиц в выборку. Повторный отбор – выбранная единица после фиксации значения возвращается в генеральную совокупность, где может быть опять выбрана. Бесповторный отбор – не возвращается.

Способы отбора определяются правилами формирования выборочной совокупности. Собственно-случайный – образуется в результате непреднамеренного отбора отдельных единиц из гене-

ральной совокупности. Количество отбираемых единиц определяется долей выборки.

Механическая выборка – отбор единиц производится из генеральной совокупности, разбитой на равные интервалы (группы). Генеральная совокупность механически разбивается на равновеликие группы, из каждой группы в выборку отбирается лишь одна единица. Для определения ошибки механической выборки используют формулы случайной безповторной выборки.

Типическая выборка – генеральная совокупность разделяется на однородные типические группы. Затем из каждой группы отбираются единицы в выборку (производительность труда рабочих по группам квалификации).

Серийная или гнездовая выборка – выбираются из генеральной совокупности целые серии и внутри серии обследуются все единицы (коробка, пачка, ящик, …). Отбор серий производится любым способом по схеме бесповторного отбора.

Комбинированная – отбор групп, а внутри отбор отдельных единиц.

Соблюдение правил выборочного метода гарантирует репрезентативность выборочной совокупности (ее воспроизводство генеральной совокупности по изучаемым признакам).

Основные характеристики параметров генеральной и выборочной совокупностей:

N – объем генеральной совокупности (число входящих в нее единиц); n – объем выборки (число обследованных единиц);

x – генеральная средняя (среднее значение признака генеральной совокупности);

~

x – выборочная средняя;

р – генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности;

w – выборочная доля;

2 – генеральная дисперсия (дисперсия признака в генеральной совокупности;

s2 – выборочная дисперсия этого же признака;

– среднее квадратическое отклонение в генеральной совокупности; s – среднее квадратическое отклонение в выборке.

Задача выборочного обследования состоит в том, чтобы на основе характеристик выборочной совокупно-

~

сти (частости w или средней x ) получить достоверные суждения о показателях (доли р или средней x ) в генеральной совокупности.

5.2. Ошибки выборки

Расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки. Она зависит от вариации изучаемого признака, численности выборки, методов отбора единиц в выборку, принятого уровня достоверности результата.

Количество отобранных в выборочную совокупность единиц определяют исходя из принятой доли вы-

борки КВ

 

19

 

 

 

 

КВ =Доля выборки =

объмвыборки

= KB

n

.

 

 

 

 

объемгенеральнойсовокупности

 

N

Например, при КВ = 5% выборки из партии N = 1000 единиц объем выборки n = 50 единиц, а при КВ = 10% – n = 100 единиц.

Различают два вида обобщающих показателей:

относительную величину альтернативного признака, т.е. долю р (удельный вес) единиц совокупности,

обладающих данным значением признака (например, доля нестандартных изделий в партии товара, удельный вес продукции собственного производства в товарообороте общепита, удельный вес продавцов в общей численности);

среднюю величину количественного признака.

Выборочная доля ( w

m

), или частость, определяется отношением числа единиц m, обладающих изу-

n

 

 

чаемым признаком, к общему числу выборочной совокупности n.

Например, если из 100 деталей (n = 100) 95 оказались стандартными (m = 95), то выборочная доля

95

w 0,95 . 100

Для характеристики выборочных показателей используют понятие ошибки выборки.

Ошибка выборки ε (репрезентативности) представляет разность выборочных и генеральных характери-

стик:

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

для средней количественного признака

~

 

 

 

x

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для доли (альтернативного признака)

w

 

 

 

w

 

 

 

p

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При случайном повторном отборе средние ошибки рассчитываются по формулам:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

для среднего количественного признака

 

x

 

 

 

 

 

 

 

,

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для доли (альтернативного признака)

 

 

 

 

 

 

p 1 p

.

 

p

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как 2 , дисперсия признака в генеральной совокупности точно неизвестна, на практике пользуются

значением дисперсии S 2 , рассчитанным для выборочной совокупности на основании закона больших чисел (выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характери-

стики генеральной совокупности). Генеральная дисперсия выражается через выборочную

2 S 2

 

n

 

 

. При

 

 

 

 

n

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

достаточно больших n можно принять

2

 

S 2 . Среднее и дисперсия количественного признака в выборке оп-

ределяется по формулам

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

xi

~

 

xi fi

 

 

 

 

 

 

 

xi

~ 2

 

 

 

 

 

 

~ 2

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

x

 

 

 

 

2

xi x

 

 

 

 

 

 

x

 

или x

 

 

;

 

 

 

 

S

 

 

 

 

 

 

или

S

 

 

 

.

 

 

 

 

 

n

 

fi

 

 

n

 

fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда формулы средних ошибок примут вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

и

 

 

 

w 1 w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При случайном бесповторном отборе численность генеральной совокупности в ходе выборки сокращается. Формулы для среднего значения количественного признака и для доли имеют вид:

 

S 2

 

n

 

 

 

 

 

 

 

 

~

1

,

 

 

w 1 w

1

n

.

 

 

w

 

 

 

 

 

 

x

n

 

N

 

n

 

N

 

 

 

 

 

 

 

 

 

 

Малые выборки. Под малой выборкой понимается несплошное статистическое обследование с небольшим числом единиц – от 4 до 30. Тогда:

1. Генеральная дисперсия выражается через выборочную по формуле:

2 S 2

 

n

 

.

 

 

 

n

 

1

 

 

 

 

20

2. Средняя ошибка малой выборки при повторном отборе имеет вид:

~

S.2

 

.

 

 

 

x

n

1

 

 

 

 

Распространение выборочных результатов на генеральную совокупность производится с учетом за-

кона больших чисел, который определяет с заданной вероятностью предел возможной ошибки различий средних

~

~ ] Ф(t) ,

~

t

 

, .

P[| x x |

x

 

x

x

 

 

где P – вероятность события, указанного в скобках, t – коэффициент доверия, Ф(t) – интеграл нормальной плотности распределения c нулевым средним и единичной дисперсией на отрезке [-t,t]. Функция Ф(t) задается таблицами. Для выборок при n>30 значения t и Ф(t) приведены в таблице.

t

1

1.960

2

2.58

3

Ф(t)

0.683

0.95

0.954

0.99

0.997

Таким образом при заданной вероятности Ф(t) и определяемом из таблицы значении t можно определить

предельные значения характеристик генеральной совокупности и их доверительные интервалы:

для средней величины количественного признака

x

~

~ ,

~

t

~

x

 

 

 

x

x

 

x

для доли альтернативного признака

p

w

w ,

w

t

w

Например, при Р = 0,683 t = 1. Следовательно в 68,3% случаев ошибка не выйдет за пределы 1 (од-

ной средней ошибки выборки).

Распространение характеристик выборки на генеральную совокупность производится следующими

способами.

~

Способ прямого расчета состоит в том, что показатели выборочной доли w, или средней х распростра-

няются на генеральную совокупность с учетом ошибки выборки (количество поступивших в партии товаров нестандартных изделий, …).

Способ поправочных коэффициентов применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета (ежегодная перепись скота у населения, …). Для этого после обобщения данных сплошного учета практикуется 10% выборочное обследование с определением так называемого «процента недоучета».

Пример 1. При проверке качества хлебобулочных изделий проведено 5% выборочное обследование партии батонов. Из 100 отобранных в выборку батонов 90 штук соответствовали требованиям стандарта. Средний вес одного батона 500,5 г при среднем квадратичном отклонении 15,4 г.

Установить возможные значения доли стандартных изделий и среднего веса одного изделия для всей партии товара.

Решение. Значение альтернативного признака m = 90. Число единиц выборки n = 100. Значение альтер-

нативной доли (частости ) определим как

w

m

 

 

 

n ~

 

 

 

Средний вес изделия в выборке известен и равен

x

x

15,4 г ; К В

 

Найдем возможные значения ошибки выборки:

для среднего веса изделия

90

0,9 .

 

 

 

 

 

 

 

100

 

 

 

500,5 г.

 

 

 

n

; N

n

100

2000 .

N

 

K В

0,05

 

 

x

 

x

2

1

 

n

 

 

 

15,42

1

 

100

 

 

1,5 г;

 

 

 

n

 

 

 

N

100

 

2000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

– для показателя средней доли стандартных изделий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w 1 w

 

 

1

n

0,9 1

0,9

 

1

100

0,029

;

w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

N

100

 

2000

 

 

 

 

 

 

 

 

 

 

или от 87,1 до 92,9% удельного веса стандартных изделий в партии.

 

 

 

 

 

 

 

Средний вес изделий во всей партии

 

~

~

500,5

1,5

 

 

499 x

502

 

 

x x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

Предельную ошибку выборки определим с вероятностью 0,99. При этом t = 2,6. Доля стандартных изделий во всей партии p w t 0,9 2,6 0,029 или от 0,825 до 0,975.

Это значит, что в 99 случаях из 100 удельный вес стандартных изделий во всей партии будет находится в преде-

лах от 82,5 до 97,5%.

 

~

 

Средний вес изделия во всей партии

 

t 500,5 2,6 1,5 , от 500,5 – 3,9 до 500,5 + 3,9.

 

x x

С вероятностью равной 0,99 можно утверждать, что средний вес изделия во всей партии находится в пределах от

496,9 до 504,4 г.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]