Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УМК ЧЕЛНОКОВОЙ С.В. СТАТИСТИКА

.pdf
Скачиваний:
66
Добавлен:
12.02.2015
Размер:
2.32 Mб
Скачать

раз предельная ошибка больше средней, называется коэффициентом

доверия или нормированным отклонением, то есть = tμ t =

.

 

μ

t может быть найдено для любого значения уровня вероятности по таблице «Значение интеграла вероятности». На практике наиболее часто используются вероятности:

P(t) = 0,683

t = 1

P(t) = 0,954

t = 2

P(t) = 0,997

t = 3

Зная выборочную среднюю величину признака (~ ) и ее предель-

Χ

ную ошибку выборки ( ~ ) можно определить доверительный интер-

 

 

 

 

Χ

вал, или пределы,

в которых заключена генеральная средняя (

 

):

Χ

~

 

 

~

 

 

~

 

 

 

 

 

 

Χ − ~

≤ Χ ≤ Χ + ~

или Χ = Χ ± ~ .

Χ

 

 

Χ

 

 

Χ

Часто выборочный метод применяется не для вычисления средней величины признака в генеральной совокупности, а для определения в ней доли единиц совокупности, обладающих каким – либо признаком. В генеральной совокупности доля единиц, обладающих признаком,

обозначается

P =

M

, а в выборочной

ω =

m

. Следовательно, если

 

 

 

 

N

 

n

 

известна выборочная доля (ω) и ее предельная ошибка выборки (

ω),

доверительный интервал для доли определяется: ω – ω < P < ω +

ω

или P = ω ±

ω.

 

 

 

 

7.3. Основные способы формирования выборочной совокупности и расчет ошибок

Существуют следующие способы выборки единиц совокупности:

1)Собственно-случайная, ее разновидностью является механический отбор;

2)Типическая;

3)Серийная;

4)Комбинированная.

Все способы отбора могут быть повторными и бесповторными. При повторном отборе каждая единица после регистрации ее параметров возвращается в генеральную совокупность, а при бесповтор- ном отборе попавшая в выборку совокупность не возвращается в генеральную совокупность.

Собственно-случайной выборкой называется отбор единиц наугад или наудачу, при котором каждая единица имеет равную возможность попасть в выборку. При этом важно четко определить границы

71

генеральной совокупности. Наиболее распространенным способом отбора в данном случае является метод жеребьевки, когда на каждую единицу совокупности заготавливают жребий (карточку, шар или фишку), на котором отмечают порядковый №, информацию или просто отличительный признак единицы совокупности. Необходимое в соответствии с установленным процентом отбора количество жребиев извлекается из общей их совокупности в случайном порядке. Механи- ческий отбор применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, например, ранжирована в порядке возрастания или убывания изучаемого признака. Тогда в соответствии с заданным процентом отбора выбирается каждая i-ая единица совокупности. Например, предусматривается 5%- ная выборка, то есть не-

обходимо отбирать каждую 20-ую единицу: 5% = 1 .

100% 20

Предельная ошибка собственно-случайной выборки определяется по формулам:

Способ отбора

Для средней

 

 

 

 

 

Для доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ω(1 − ω )

 

 

 

 

повторный

~

= t

 

σ 2

 

 

 

 

 

 

ω

= t

 

 

 

 

 

 

Χ

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ 2

 

n

 

 

 

 

ω(1 − ω )

 

 

n

 

бесповторный

~ = t

 

1 −

 

 

 

 

ω

= t

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

Χ

n

 

N

 

 

 

 

n

 

 

N

 

 

 

 

 

 

 

 

 

Пример 1. В порядке случайной бесповторной выборки на перерабатывающем предприятии обследовано 100 рабочих из общего числа рабочих 1000 человек для определения их средней часовой выработки. По результатам выборочного обследования средняя часовая выработка рабочих составила 1,4 нормо-часа, а среднее квадратическое отклонение 0,3 нормочаса. Определите границы средней часовой выработки в генеральной совокупности с вероятностью 0,997.

Дано:

N = 1000чел. n = 100чел.

P(t)= 0,997 t=3;

~

Χ = 1,4нормочаса ; σ = 0,3нормо часа

Найти:

~ − ?

Χ

Решение:

Формула предельной ошибки выборки для средней:

 

 

σ 2

 

 

n

 

 

 

0,32

 

100

~

= t

 

1 −

 

 

 

3

 

1 −

 

 

 

 

 

 

Χ

 

n

 

 

 

100

 

 

 

 

 

N

 

 

 

1000

0,09 нормо-часа Границы средней часовой выработки в гене-

ральной

совокупности

составят

~

 

=1,4 ± 0,09 нормо-часа.

 

Χ ±

~

 

 

Χ

 

 

72

Ответ: средняя часовая выработка в генеральной совокупности будет находится в пределах от 1,31 до 1,49 нормо-часа.

Типической выборка является в тех случаях, когда численность генеральной совокупности предварительно разбивается на несколько типических групп, из которых затем в случайном или ином порядке отбирают определенное число единиц для выборочной совокупности. Типизация генеральной совокупности позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки, которая в этом случае определяется только внутригрупповой вариацией. Отбор единиц в типическую выборку производят в объеме, соответствующем удельному весу типической группы в генеральной совокупности. Например, при обследовании населения области типическими группами могут быть районы. Если по численности населения какой-либо район занимает 12%, то именно 12% населения этого района попадут в выборку.

Предельная ошибка типической выборки определяется по формулам:

Способ отбора

 

Для средней

 

 

 

Для доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

повторный

 

~ = t

 

σ

2

 

 

 

 

ω

= t

 

 

ω(1 − ω )

 

 

 

 

 

 

Χ

 

 

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

2

 

 

n

 

 

 

 

 

 

 

 

 

 

~

 

 

ω(1 − ω )

 

 

 

n

 

 

 

= t

1 −

 

 

 

ω = t

 

 

 

Χ

 

 

 

 

 

 

 

 

бесповторный

 

n

 

N

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

N

где σ 2 и ω(1 − ω ) - средние из частных внутригрупповых дисперсий

для средней и доли соответственно.

Серийная выборка заключается в собственно-случайном или механическом отборе не единиц совокупности, а целых их групп (серий), внутри которых производится сплошное обследование единиц. Общее число серий обозначается R, число отобранных серий r. Например, при обследовании успеваемости отбираются отдельные студенческие группы, в которых обследованию подлежат все студенты. Так как внутри серий обследуются все без исключения единицы, средняя ошибка серийной выборки зависит только от межгрупповой дисперсии.

Предельная ошибка серийной выборки определяется по формулам:

Способ отбора

 

Для средней

 

 

 

Для доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= t

ω(1 − ω )

 

 

 

повторный

 

~

= t

 

σ 2

 

 

ω

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

Χ

 

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ω = t

 

 

 

1 −

 

 

 

Χ

 

 

σ

 

 

 

r

 

 

 

 

 

 

бесповторный

~

= t

 

2 1

 

 

 

 

ω(1 − ω )

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

 

 

 

 

r

 

 

 

R

 

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

73

Комбинированная выборка – это различные сочетания выше рассмотренных способов отбора, например, типического и серийного.

7.4. Определение численности выборки

При организации выборочного наблюдения возникает вопрос о необходимой численности выборки. Превышение численности выборки ведет к увеличению затрат на нее, а если численность выборки недостаточна, то возникают значительные погрешности. Необходимая численность выборки определяется из формулы предельной ошибки выборки, причем для каждого вида и способа отбора:

Виды выборок

Повторный отбор

Бесповторный отбор

Собственно-случайная

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(механическая):

 

 

 

 

 

 

 

t 2σ 2

 

 

 

 

 

 

 

 

 

 

 

t 2σ 2 N

 

 

 

 

 

для средней

n =

 

 

 

 

n =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ N + t

 

σ

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для доли

n =

t 2ω(1 − ω)

 

 

n =

 

 

t 2ω(1 − ω )N

 

 

 

 

 

2ω

2ω N + t 2ω(1 − ω )

 

 

 

 

 

 

 

 

 

 

 

Типическая:

 

 

 

 

 

 

t 2σ

 

 

 

 

 

 

 

 

 

 

 

 

t 2σ

 

 

 

 

 

 

 

 

 

 

для средней

n =

 

2

 

 

 

 

n =

 

 

 

2 N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ N + t

σ

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t 2

 

 

 

 

 

 

 

 

 

 

 

 

для доли

n =

t 2

ω(1 − ω )

n =

 

 

 

ω(1 − ω )N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2ω

2ω N + t 2 ω(1 − ω )

 

 

 

 

 

 

 

 

 

 

 

Серийная:

 

 

 

 

 

 

t 2σ 2

 

 

 

 

 

 

 

 

 

 

 

 

t 2σ 2 R

 

 

 

 

 

 

 

для средней

r =

 

 

r =

 

 

 

 

 

 

 

 

 

 

 

 

Χ R + t

σ

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Χ

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для доли

r =

t 2ω(1 − ω )

 

 

r =

 

 

t 2ω(1 − ω )R

 

 

 

2ω R + t 2ω(1 − ω )

 

 

 

 

 

 

 

 

2ω

 

 

Пример 2. С целью определения доли сотрудников коммерческих банков области в возрасте старше 40 лет, предполагается организовать типическую выборку пропорционально численности сотрудников мужского и женского пола с механическим отбором внутри групп. Общее число сотрудников банков составляет 15 тыс. чел., в том числе 7 тыс. мужчин и 8 тыс. женщин. На основании предыдущих исследований известно, что средняя из внутригрупповых (остаточных) дис-

74

персий составляет 2500. Определите необходимый объем выборки при вероятности 0,954 и ошибке 5%.

Решение:

Общая численность типической выборки составит:

n =

 

t 2σ

2 N

=

 

 

22 ´ 2500 ´15000

= 390чел.

2

2

 

2

5

2

´15000 + 2

2

´ 2500

 

 

D~ N + t σ

 

 

 

 

 

Χ

 

 

 

 

 

 

 

Объем выборки отдельных типических групп определяется по удельному весу мужчин (женщин) в общей численности сотрудников:

nмуж.

=

 

390 × 7000

= 182чел.

 

 

 

 

 

15000

 

 

 

n

=

390 × 8000

= 208чел.

или

 

жен.

15000

 

 

 

 

 

 

 

nжен.

= n - nмуж. = 390 -182 = 208чел.

Вывод: Необходимо отобрать 390 человек, в том числе 182 мужчин и 208 женщин.

Пример 3. В АО 90 бригад рабочих. Планируется проведение выборочного обследования с целью определения удельного веса рабочих, имеющих профессиональные заболевания. Известно, что межсерийная дисперсия доли равна 169. С вероятностью 0,954 рассчитайте необходимое количество бригад для обследования рабочих, если ошибка выборки не должна превышать 5%.

Дано:

R = 90

P(t)= 0,954 t=2

Dω = 5

ω(1 -ω ) =169

Найти: r

Решение:

Численность выборочной совокупности определяется из формулы предельной ошибки серийной выборки для доли:

r =

t 2ω(1

- ω )R

 

 

D2ω R + t 2ω(1 - ω )

22 ×169 ×90

= 21бригада

52 ×90 + 22 ×169

 

Ответ: Нужно отобрать 21 бригаду, чтобы на 95,4% быть уверенным в том, что ошибка выборки не превысит 5%.

75

7.5.Оценка результатов выборочного наблюдения и распространение их на генеральную совокупность

Собранные в ходе выборки данные должны быть распространены на генеральную совокупность. Существует два основных метода распространения: прямой пересчет и способ коэффициентов.

При прямом пересчете выборочная средняя или доля умножается на численность единиц генеральной совокупности. Допустим, по данным выборки средняя урожайность зерновых составила 11,5 ц/га, предельная ошибка выборки 1,5 ц/га. Следовательно, в генеральной совокупности средняя урожайность будет в пределах от 10 до 13 ц/га (11,5±1,5). Посевная площадь равна 500 га. Отсюда валовой сбор составит от 5 до 6,5 тыс.ц (10 ц/га × 500 га и 13ц/га × 500 га).

Способ коэффициентов заключается в применении поправочных коэффициентов для уточнения и проверки данных сплошного наблюдения. Допустим, при сплошном наблюдении при переписи скота было зарегистрировано 3000 коров. Контрольный обход 10% дворов показал наличие 320 коров, хотя по первоначальным данным в этих дворах было

зарегистрировано 310 коров. Определяется коэффициент 320 = 1,0323 и 310

делается поправка намеченного поголовья 1,0323 × 3000 = 3097 коров.

7.6. Особенности малой выборки

Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30. В настоящее время малая выборка используется шире, чем раньше за счет статистического изучения деятельности малых и средних предприятий, коммерческих банков, фермерских хозяйств и т.д. Наряду со статистическим изучением рыночных структур эта необходимость возникает при выборочной проверке качества продукции, при полевых опытах и в селекционной работе и в ряде других случаев. Английский статистик В.С. Госсет (Стьюдент) в 1908 г. доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения. Особенность расчета ошибок малой выборки в том, что при расчете используется не величина генеральной дисперсии, а дисперсия, определенная с учетом числа степеней свободы (k или d.f.). Под числом степеней свободы понимается количество вариантов, которые могут принимать произвольные значения, не меняя величины средней, т.е. при определении дисперсии это

 

 

 

 

~

2

 

 

σ

2

 

 

 

п – 1. σ

2

=

(хi x )

 

; μ

МВ =

МВ

;

МВ = tμ МВ .

МВ

n

−1

 

 

п

 

 

 

 

 

 

 

 

 

 

76

Значение коэффициента доверия t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки п. Для отдельных значений t и n доверительная вероятность малой выборки определяется по специальным таблицам Стьюдента. Однако, выводы по результатам малой выборки имеют практическое значение лишь при условии, что распределение признака в генеральной совокупности является нормальным или приближенным к нормальному. Но точность результатов выборки малого объема все же ниже, чем при большой выборке.

77

ГЛАВА 8. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ДИНАМИКИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ

Цель: изучить правила построения и анализа рядов динамики, ознакомиться с расчетом аналитических показателей динамики.

Учебные вопросы:

8.1.Понятие о рядах динамики, их виды и основные правила построения.

8.2.Показатели ряда динамики.

8.3.Приемы и методы выявления тенденции ряда динамики.

8.4.Интерполяция и экстраполяция рядов динамики.

8.5.Изучение и измерение сезонных колебаний.

Изучив данную тему, студент должен:

-знать виды рядов динамики, особенности исчисления среднего уровня для каждого из них; расчет абсолютных и относительных, цепных и базисных, средних показателей временных рядов; методы выявления тенденции ряда динамики, прогнозирования, анализа сезонных колебаний.

- уметь проводить смыкание, сглаживание, аналитическое выравнивание рядов динамики, рассчитывать средние уровни и аналитические показатели рядов динамики, делать прогноз и измерять сезонные колебания.

-владеть навыками статистического изучения динамики социально – экономических явлений и процессов.

При освоении темы необходимо:

-изучить главу 8 данного пособия; -изучить материал по данной теме из следующих источников библио-

графического списка: осн.1-4,7,8,10,11,13,15,16,18-22; доп. 36,43,46. -выполнить тесты по изучаемой теме; -ответить на следующие контрольные вопросы:

1.Назовите виды рядов динамики.

2.Что характеризуют показатели динамики?

3.Как провести смыкание рядов динамики?

4.Что представляет собой средний уровень ряда?

5.Как связаны между собой цепные и базисные показатели динамики?

6.Чему равен средний абсолютный прирост и средний темп роста?

7.Перечислите приемы и методы выявления тенденции ряда динамики.

8.Как производится сглаживание рядов динамики?

9.Что такое экстраполяция ряда динамики?

10.Расскажите о сезонных колебаниях.

78

8.1.Понятие о рядах динамики, их виды и основные правила построения

Важнейший задачей статистики является изучение изменений показателей во времени, т.е. в динамике. Эта задача решается при помощи анализа рядов динамики (временных или хронологических рядов).

Ряд динамики представляет собой ряд изменяющихся во времени

значений статистического показателя, расположенных в хронологи-

ческом порядке. Составными элементами ряда динамики являются показатели уровня ряда (У) и периоды времени (годы, кварталы, месяцы, сутки) или моменты (даты) времени (t).

Уровни динамического ряда могут быть представлены абсолют-

ными, средними или относительными величинами.

В зависимости от расстояния между уровнями ряды динамики подразделяются на ряды с равноотстоящими и неравноотстоящими

уровнями по времени (или их еще называют полные и неполные). Ряды динамики следующих друг за другом периодов или через определенные промежутки дат называются равноотстоящими, а если же в рядах даются прерывающиеся периоды или неравномерные промежутки между датами, то ряды называются неравноотстоящими.

По времени, отраженному в динамических рядах, они подразделяются на моментные и интервальные.

Моментным называется ряд динамики, уровни которого характеризуют состояние явления на определенные даты (моменты времени). Например, численность населения на конец года или численность работников на 1 число какого-то месяца. Для этого ряда характерно, что в каждом последующем уровне содержится полностью или частично значение предыдущего уровня, суммировать уровни моментного ряда не следует, т.к. это приведет к повторному счету.

Интервальным (периодическим) рядом динамики называется такой ряд, уровни которого характеризуют размер явления за конкретный период времени, например, добыча нефти за 2011г. Суммирование его значений уровней позволит получить ряды динамики более крупных периодов.

Как правило, моментный ряд характеризует состояние условий и факторов производства, а интервальный – итоги процессов производства.

При построении динамических рядов необходимо соблюдать определенные правила.

Важнейшим условием правильного построения ряда динамики является сопоставимость всех входящих в него уровней по территории, кругу охватываемых объектов, единицам измерения, времени регистрации, ценам, методологии расчета и др.

79

Несопоставимые по кругу объектов или методике расчета данные могут быть приведены к сопоставимому виду с помощью приема смы- кания рядов динамики. Чтобы осуществить его первым способом, необходимо наличие разных показателей за один из периодов времени. Затем определяется коэффициент их соотношения (110/55 = 2), на который уровни ряда до этого периода умножаются:

 

2007г.

2008г.

2009г.

2010г.

2011г.

1-ый способ

 

 

 

 

 

Площадь с/х угодий, га

 

 

 

 

 

До реорганизации

50

54

55

 

 

После реорганизации

100 = 50×2

108 = 54×2

110

120

124

2-ой способ

50:55=

54:55=

 

120:110=

124:110=

% к 2001 г.

90,9%

98,2

100,0

109,1

112,7

При другом способе смыкания ряда абсолютные уровни могут заменяться относительными (обычно %). При этом уровни периода, в котором произошли изменения, принимаются за 100%, а остальные пересчитываются в % по отношению к этим уровням соответственно.

8.2. Показатели ряда динамики

Анализ интенсивности изменения во времени осуществляется с помощью абсолютных и относительных показателей, получаемых в результате сравнения уровней. К таким показателям относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного % прироста. Если сравнению подлежат несколько последовательных уровней, то показатели ряда динамики могут вычисляться на постоянной и переменных базах сравнения. При этом принято называть сравниваемый уровень отчетным (уi), а уровень, с которым производится сравнение, базисным (y0).

Для расчета аналитических показателей динамики на постоянной базе каждый уровень ряда сравнивается с одним и тем же базисным уровнем. В качестве базисного выбирается либо начальный уровень ряда динамики, либо уровень, с которого начинается какой-то новый этап развития явления. Исчисленные при этом показатели называются

базисными.

Для расчета аналитических показателей динамики на переменной базе каждый последующий уровень ряда сравнивается с предыдущим. Такие показатели называются цепными.

Базисные показатели ряда динамики характеризуют окончательный результат всех изменений в уровнях ряда от базисного периода до исследуемого периода. Цепные показатели ряда динамики характери-

80