Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УМК ЧЕЛНОКОВОЙ С.В. СТАТИСТИКА

.pdf
Скачиваний:
66
Добавлен:
12.02.2015
Размер:
2.32 Mб
Скачать

 

 

= W =

310 + 290 + 430

+ 350 + 240

=

Χ

310 + 290 + 430

+ 350 + 240

 

 

W

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ

1,01

0,99 1,05 0,94

1,03

 

=

310 + 290 + 430

+ 350 + 240

 

=

1620

= 1,0031

 

+ 372 + 233

 

 

307 + 293 + 410

 

1615

 

 

 

Ответ: Средний процент выполнения плана реализации картофеля по 5 хозяйствам 100,31%.

 

 

 

 

 

C2

 

 

Средняя квадратическая простая - C =

и

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C2

f

средняя квадратическая взвешенная C =

 

f

 

 

 

 

 

 

 

 

– применяются, в основном, при расчете среднего диаметра труб, деревьев и т.п., но наиболее широко используются в статистике при расчете такого важного показателя вариации как среднеквадратическое отклонение. Аналогичны формуле средней квадратической формулы средних других степеней. Например,

 

 

 

 

 

C3

 

 

средняя кубическая простая C = 3

 

 

,

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C3 f

.

средняя кубическая взвешенная C = 3

f

 

 

 

 

 

 

 

Средняя геометрическая простая - наиболее широкое применение получила для определения среднего темпа роста в рядах динамики:

Т р

= n

k

2

× k

3

× k

4

×... × k

n

 

, где kр – цепные темпы роста, n-их

 

 

p

1

p

2

p

3

p

 

n−1

число.

Пример 2. Объем реализации продукции по совхозу (в текущих ценах) увеличился в 2008г. по сравнению с 2007г. на 2%, в 2009г. по сравнению с 2008г.-на 10,2%, в 2010г. по сравнению с 2009г.-8,7%, а в 2011г. по сравнению с 2010г. – на 21,5%. Используя взаимосвязь цепных и базисных индексов определите, на сколько процентов увеличился объем реализации товаров в 2011г. по сравнению с 2007г. Рас-

41

считайте среднегодовой темп роста за 2007-2011гг. Сделайте краткие выводы.

Решение: Исходные данные представим в таблице:

Годы

Цепные индексы

 

 

2007

-

 

 

2008

1,02

 

 

2009

1,102

 

 

2010

1,087

 

 

2011

1,215

 

 

Между цепными и базисными индексами существует взаимо-

связь: произведение цепных индексов дает базисный индекс послед-

него периода:

1,02*1,102*1,087*1,215=1,4845 или 148,45%, то есть объем реализации товаров в 2011г. по сравнению с 2007г. увеличился на 48,45%.

Среднегодовой темп роста:

Тр = nkp 21 × kp 3 2 × k p 4 3 ×...× k p n n−1 = 41,02 *1,102 *1,087 *1,215 =

= 41,4845 =1,1038

Среднегодовой темп прироста находится на основании среднего темпа

роста: Тпр = Т р -100 = 110,38 -100 = 10,38(%)

Вывод: ежегодно объем реализации товаров увеличивается на 10,38%.

 

Реже

 

применяется

средняя

 

геометрическая взвешенная

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

f

 

 

f1

 

 

 

f 2

 

 

 

f n

где f - интервал времени, в

Т р

 

 

 

 

 

 

 

k

p

2

 

× k

p

3

 

×... × k

p

n

 

,

 

 

 

 

1

 

 

2

 

 

n−1

 

 

 

 

течение которого сохраняется данный темп роста; f - сумма отрез-

ков времени.

Очевидно, что при равенстве весов взвешенные степенные сред-

ние численно равны простым невзвешенным средним, так как суммы частот в числителе и знаменателе взвешенной формулы сокращаются, и она принимает вид невзвешенной формулы.

Между степенными средними величинами имеется соотношение,

называемое правилом межорантности средних:

Cгарм £ Cгеом £ Cарифм £ Cквадр £ Cкуб .

42

4.3.Основные математические свойства средней арифметической, метод «условного нуля», или «моментов»

Наиболее распространенным видом средних величин является средняя арифметическая. Средней арифметической величиной называ-

ется такое среднее значение признака, при вычислении которого об-

щий объем признака в совокупности сохраняется неизменным. Иначе можно сказать, что средняя арифметическая – это среднее слагаемое. При ее вычислении общий объем признака распределяется поровну между всеми единицами совокупности. Знание некоторых математи-

ческих свойств средней арифметической полезно как при ее использо-

вании, так и при ее расчете.

1) Произведение средней на сумму частот всегда равно сумме

произведений вариант на частоты: C × f = C × f C = Cf

f

2) Если к каждой варианте прибавить (отнять) какое-либо произвольное число А, то средняя увеличится (уменьшится) на это же число:

 

 

(C ± А) f

 

 

 

(C ± А) f

C ± А =

f

C =

M А

 

 

 

 

 

f

3) Если каждую варианту разделить (умножить) на какое – либо произвольное число i, то средняя арифметическая уменьшится (увеличится) во столько же раз:

C f

 

 

 

 

 

 

C f

 

(i) f

 

 

 

 

 

(i) f

 

 

C

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

i

 

 

 

 

 

 

 

=

C =

i или

= C×i C =

¸i

 

 

 

 

f

f

f

i

f

 

 

 

 

 

 

 

 

 

 

 

4) Если все частоты (веса) разделить или умножить на какое – либо произвольное число c, то средняя арифметическая от этого не изменится:

 

 

Cf

 

Cfc

C =

=

f

fc

5) сумма отклонений вариант как от простой, так и от взвешенной средней арифметической всегда равняется нулю:

∑(C - C) = 0 и ∑(C - C)f =0

– это означает, что в средней арифметической взаимно погашаются отклонения вариант в ту или иную сторону.

Второе и третье свойства средней арифметической используются для упрощенного (устного) расчета средней величины и среднего квадратического отклонения (абсолютного показателя вариации). Этот

43

упрощенный расчет носит название «метод условного нуля» или «ме-

тод моментов».

Таблица 1 - Данные для расчета средней высоты растений

Группы

 

Число

 

Середина

 

Χ − А

 

Χ − А

 

 

Χ − А 2

 

 

Χ − А

2

растений

 

расте-

 

интервала,

 

 

по высо-

 

 

ний в

 

 

 

 

см

 

 

 

i

 

 

 

i

f

 

 

 

 

i

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

те, см

 

группе

 

 

 

Χ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10-20

 

 

 

4

 

 

 

15

 

 

 

-1

 

 

 

 

-4

 

 

 

1

 

 

 

 

4

 

20-30

 

 

 

6

 

 

 

25

 

 

 

0

 

 

 

 

 

 

0

 

 

 

0

 

 

 

 

0

 

30-40

 

 

 

5

 

 

 

35

 

 

 

1

 

 

 

 

 

 

5

 

 

 

1

 

 

 

 

5

 

40-50

 

 

 

3

 

 

 

45

 

 

 

2

 

 

 

 

 

 

6

 

 

 

4

 

 

 

 

12

 

Итого

 

 

18

 

 

 

 

х

 

 

2

 

 

 

 

 

 

7

 

 

 

6

 

 

 

 

21

 

Для облегчения расчетов за А рекомендуется брать признак с наи-

большей частотой (А = 25), за i - величину интервала (i = 10).

 

 

 

 

 

 

 

 

 

C - А

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

i

 

 

× i + А =

7

10 + 25 = 28,9см

 

 

 

 

 

 

 

 

 

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее квадратическое отклонение (σ) методом моментов исчис-

ляется по формуле: σ = i

 

 

 

= 10

 

 

 

 

 

= 10,1см

 

 

 

μ

2

− μ 2

1,17 − 0,392

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C - А

× f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

где первый момент исчисляется

μ1

=

 

 

 

 

i

 

 

=

 

 

= 0,39

, а вто-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

18

 

 

 

 

 

 

 

 

 

 

 

C - А

2

× f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рой μ2

=

 

 

 

 

 

=

= 1,17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

18

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент вариации (V): V =

×100 =

10.1см

×100 = 34,95%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ

 

 

 

28,9см

 

 

 

 

 

 

Вывод: средняя высота растений составила 28,9 см, колеблемость признака около средней величины высока – 34,95% или 10,1 см.

4.4.Структурные характеристики вариационного ряда – мода, медиана, квартили, децили

Особой категорией средних величин являются структурные сред- ние – мода, медиана, квартили, децили, которые используются для ха-

44

рактеристики структуры вариационного ряда. Различают дискретные и интервальные вариационные ряды распределения. Дискретный вариа- ционный ряд – это таблица, состоящая из двух строк или граф, одна из которых представлена конкретными значениями варьирующего признака, принимающими только целые значения, другая – частотами

(табл. 2). Интервальный вариационный ряд – это таблица, состоящая из двух строк или граф, одна из которых представлена интервалами, в которых варьирующий признак может принимать любое, в том числе и дробное значение, другая – частотами (табл. 1 и 3).

Таблица 2 – Успеваемость студентовзаочников

Оценка, балл

Количество студентов, чел.

3

7

4

10

5

8

Итого

25

Модой называется наиболее часто встречающаяся в ряду распределения величина признака и обозначается М0. В дискретном ряду мода определяется без вычисления как значение признака с наибольшей частотой. Например, по данным экзаменационных ведомостей студентов – заочников чаще всего встречается оценка «хорошо», следовательно, четверка является модой в ряду распределения этих студентов по успеваемости.

В интервальном ряду моду можно определить только расчетным

путем по формуле: Мо

= Χ 0

+ i

 

f Мо f Мо−1

, где

 

 

 

( f Мо

f Мо−1 )+ ( f Мо f Мо+1 )

 

Χ 0 - нижняя граница модального интервала;

i - величина интервала;

f Мо - частота модального интервала;

f Мо−1 - частота предмодального (домодального) интервала; f Мо+1 - частота послемодального ( замодального) интервала.

Модальным называется интервал с наибольшей частотой. По данным таблицы 1 вычислим модальную высоту растений:

 

6 − 4

Мо = 20 + 10

(6 − 4) + (6 − 5)

= 26,7см

Мода имеет большое практическое значение при планировании массового выпуска одежды и обуви, на ее основе определяется объем продукции, пользующейся наибольшим спросом. При изучении товарооборота на рынке в расчет принимается именно модальная цена, а не

45

средняя арифметическая, так как по модальной цене продается наибольшее количество товара.

Медианой называется такая величина варьирующего признака, которая делит упорядоченную по возрастанию или по убыванию признака совокупность на две равные части, то есть медиана стоит в середине ранжированного ряда.

По несгруппированным данным медиана определяется так: при не- четном количестве единиц совокупности медианой будет являться центральная варианта. При четном числе единиц совокупности за медиану принимают арифметическую среднюю величину из двух центральных вариант.

По сгруппированным данным в дискретном вариационном ряду (табл. 2) для определения медианного значения признака находят номер медианной единицы ряда по формуле:

N Ме = n + 1 = 25 + 1 = 13 , 2 2

где n - объем совокупности. 13-й студент относится к группе, получившей оценку «хорошо», следовательно, четверка является медианой.

Винтервальномвариационномрядумедианаопределяетсяпоформуле:

 

 

f

S

Ме−1

 

Ме = Χ 0

+ i

2

,

 

 

 

f Ме

 

 

 

 

 

 

где Х0 - нижняя граница медианного интервала;

f - полусумма всех частот;

2

S Ме−1 - накопленная частота предмедианного интервала; f Ме -частота в медианном интервале.

Медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот. Накопленные частоты – это ряд последовательно суммированных частот. Определим медиану по данным таблицы 3:

18 − 4

Ме = 20 + 10

2

 

= 28,3см,

 

6

 

 

 

следовательно, одна половина растений имеет рост меньше 28,3 см, другая половина – больше.

46

Таблица 3- Расчет медианы

Группы растений по

Число растений в

Накопленные

высоте, см

группе, f

частоты

10-20

4

4

20-30

6

10

30-40

5

15

40-50

3

18

Итого

18

х

Квартили представляют собой значения признака, делящие ранжированную совокупность на четыре равновеликие части:

Ме

Q1 Q2 Q3

Различают нижний квартиль (Q1), отделяющий ¼ часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отсекающий ¼ часть с наибольшими значениями признака. Средним квартилем Q2 является медиана. Это означает, что 25% единиц совокупности по величине будут меньше Q1; 25% единиц будут заключены между Q1 и Q2; 25% - между Q2 и Q3 и остальные 25% превосходят Q3.

Кроме квартилей могут определяться децили – варианты, делящие ранжированный ряд на десять равных частей. Первый дециль отсекает 1/10 часть совокупности, центральный - пятый дециль (медиана, сред-

ний квартиль) отсекает 5/10 части совокупности, последний –

девятый

дециль отсекает 9/10 части совокупности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ме

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D1

D2

D3

D4

D5

D6

D7

D8

D9

Квартили и децили позволяют более глубоко и детально охарактеризовать изучаемую совокупность. Вычисляются они по схеме, идентичной той, по которой вычисляется медиана.

47

ГЛАВА 5. ПОКАЗАТЕЛИ ВАРИАЦИИ

Цель: ознакомиться с понятием вариации, формами распределения единиц совокупности, видами рядов распределения, изучить показатели меры и степени вариации, правило сложения дисперсий, усвоить назначение этих показателей и их расчет.

Учебные вопросы:

5.1.Понятие вариации. Ряды распределения.

5.2.Показатели вариации и способы их расчета.

5.3.Виды дисперсий и правила их сложения.

5.4.Дисперсионный анализ.

Изучив данную тему, студент должен:

-знать сущность и показатели вариации, их расчет, основные свойства дисперсии, виды и правило сложения дисперсий.

- уметь строить и графически изображать ряды распределения, судить о форме распределения.

-владеть навыками расчета и интерпретации показателей вариации, применения дисперсионного анализа.

При освоении темы необходимо:

-изучить главу 5 данного пособия; -изучить материал по данной теме из следующих источников библио-

графического списка: осн. 1-4,78,11,13,15,16,18-22; доп. 36,43,46. -выполнить тесты по изучаемой теме; -ответить на следующие контрольные вопросы:

Что собой представляют ряды распределения?

1.Какими бывают вариационные ряды распределения?

2.Какие основные виды графиков применяются для изображения рядов распределения?

3.Назовите абсолютные показатели вариации.

4.Назовите относительные показатели вариации.

5.В чем состоят особенности расчета показателей вариации по сгруппированным данным?

6.Что такое дисперсия и каковы её особенности как показателя вариации?

7.Назовите виды дисперсий и сформулируйте правило сложения дисперсий.

8.Что представляет собой дисперсия альтернативного признака?

9.В чем смысл дисперсионного анализа?

10.Что называется эмпирическим корреляционным отношением?

11.Что показывает эмпирический коэффициент детерминации?

48

5.1. Понятие вариации. Ряды распределения

Вариацией называется различие, многообразие, изменяемость численных значений признака у единиц изучаемой совокупности. Вариация существует во времени и пространстве. Во времени вариацию принято называть колеблемостью. Если число единиц совокупности незначительно, то за вариацией признака можно проследить по ранжированному ряду. Ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания или убывания изучаемого признака.

Если численность единиц велика, то строят ряды распределения, то есть статистические группировки признака, где известна численность единиц в группах или удельный вес каждой. Ряды распределения делятся на атрибутивные и вариационные.

Атрибутивным ряд распределения является в случае, если группировка проведена по качественному признаку. Например, по итогам Всероссийской переписи населения 2010 года размещение населения по территории Российской Федерации можно представить следующим рядом распределения:

Таблица 1 – Группировка населения по размещению на территории РФ

 

Млн.

В % к

 

чел.

итогу

Российская Федерация

142,9

100

 

 

 

Центральный федеральный округ

38,4

26,9

 

 

 

Северо-Западный федеральный округ

13,6

9,5

 

 

 

Южный федеральный округ

13,9

9,7

 

 

 

Северо-Кавказский федеральный округ

9,4

6,6

 

 

 

Приволжский федеральный округ

29,9

20,9

 

 

 

Уральский федеральный округ

12,1

8,5

 

 

 

Сибирский федеральный округ

19,3

13,5

 

 

 

Дальневосточный федеральный округ

6,3

4,4

 

 

 

Вариационным называется ряд распределения, построенный по количественному признаку. Любой вариационный ряд представляет собой групповую таблицу, содержащую два элемента: варианты признака, обозначаемые Х, и частоты, обозначаемые f. Сумма всех частот – это численность всей совокупности. Иногда вместо частот удобнее использовать частости, то есть частоты, выраженные в долях или процентах, обозначаемые W. Сумма частостей равна 1 или 100 %.

В зависимости от характера вариации признака различают дис- кретные и интервальные вариационные ряды. В случае прерывной

49

вариации величина количественного признака у единиц совокупности может принимать только конкретные целые значения, отличные друг от друга на определенное число целых единиц. Ряд, построенный по таким признакам, называют дискретным вариационным рядом. На-

пример, по итогам Всероссийской переписи населения 2010 года структуру частных домохозяйств Российской Федерации по числу членов домохозяйства в 2010 году можно представить следующим рядом распределения:

Таблица 2 – Группировка домохозяйств по размеру

Домохозяйства, состоящие из:

В % к итогу

 

 

1 человека

25,7

2 человек

28,5

3 человек

22,5

4 человек

14,5

5 человек

5,4

6 и более человек

3,4

Всего домохозяйств

100

При непрерывной вариации, когда признак у отдельных единиц может принимать в определенном интервале или промежутке любые значения как угодно мало отличные друг от друга, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико, целесообразно построе-

ние интервальных вариационных рядов. Например, размещение сель-

ского населения РФ в 2010 году по данным Всероссийской переписи населения 2010 года характеризуется следующими данными:

Таблица 3 - Группировка сельских населенных пунктов

Сельские населенные пункты с

Число сельских

В %

числом жителей (человек):

населенных пунктов, тысяч

к итогу

1

– 10

36,2

0,4

11

– 50

32,7

2,2

51

– 100

13,8

2,7

101

– 500

33,4

21,8

501

– 1000

9,7

18,1

1001

– 3000

6,0

25,1

3001

и более

1,9

29,7

Всего сельских населенных пунктов

133,7

100

Графическое изображение рядов распределения в виде полигона, гистограммы, кумуляты или огивы облегчает их анализ и позволяет судить о форме распределения. Ранжированный ряд представляют в виде огивы, на оси ординат которой обычно в порядке возрастания откладываются значения варьирующего признака (например, урожайность, ц/га), а на оси абсцисс порядковые номера соответствующих

50