Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ.doc
Скачиваний:
13
Добавлен:
17.11.2018
Размер:
207.87 Кб
Скачать

2. Оценка результатов выборочного наблюдения

2.1. Средняя и предельная ошибки выборки. Построение доверительных границ для средней и доли

Средняя ошибка выборки показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной. Если рассчитать среднюю из ошибок всех возможных выборок определенного вида заданного объема (n), извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику  среднюю ошибку выборки ().

В теории выборочного наблюдения выведены формулы для определения , которые индивидуальны для разных способов отбора (повторного и бесповторного), типов используемых выборок и видов оцениваемых статистических показателей.

Например, если применяется повторная собственно случайная выборка, то  определяется как:

при оценивании среднего значения признака;

если признак альтернативный, и оценивается доля.

При бесповторном собственно случайном отборе в формулы вносится поправка

для среднего значения признака;

для доли.

Вероятность получения именно такой величины ошибки всегда равна 0,683. На практике же предпочитают получать данные с большей вероятностью, но это приводит к возрастанию величины ошибки выборки.

Предельная ошибка выборки () равна t-кратному числу средних ошибок выборки (в теории выборки принято коэффициент t называть коэффициентом доверия):

  t .

Если ошибку выборки увеличить в два раза (t  2), то получим гораздо большую вероятность того, что она не превысит определенного предела (в нашем случае  двойной средней ошибки)  0,954. Если взять t  3, то доверительная вероятность составит 0,997  практически достоверность.

Уровень предельной ошибки выборки зависит от следующих факторов:

 степени вариации единиц генеральной совокупности;

 объема выборки;

 выбранных схем отбора (бесповторный отбор дает меньшую величину ошибки);

 уровня доверительной вероятности.

Если объем выборки больше 30, то значение t определяется по таблице нормального распределения, если меньше  по таблице распределения Стьюдента (Приложение 1).

Приведем некоторые значения коэффициента доверия из таблицы нормального распределения.

Доверительный интервал для среднего значения признака и для доли в генеральной совокупности устанавливается следующим образом:

Итак, определение границ генеральной средней и доли состоит из следующих этапов:

 нахождение в выборке среднего значения признака (или доли);

 определение  в соответствии с выбранной схемой отбора и вида выборки;

 задание доверительной вероятности Р и определение коэффициента доверия t по соответствующей таблице;

 вычисление предельной ошибки выборки ;

 построение доверительного интервала для средней (или доли).

Ошибки выборки при различных видах отбора

1. Собственно случайная и механическая выборка. Средняя ошибка собственно случайной и механической выборки находятся по формулам, представленным в табл. 11.1.

Таблица 1

Формулы для расчета средней ошибки собственно случайной и механической выборки ()

где 2 дисперсия признака в выборочной совокупности.

Пример 2. Для изучения уровня фондоотдачи было проведено выборочное обследование 90 предприятий из 225 методом случайной повторной выборки, в результате которого получены данные, представленные в таблице.

В рассматриваемом примере имеем 40%-ную выборку (90 : 225  0,4, или 40%). Определим ее предельную ошибку и границы для среднего значения признака в генеральной совокупности по шагам алгоритма:

1. По результатам выборочного обследования рассчитаем среднее значение и дисперсию в выборочной совокупности:

Выборочная средняя

Выборочная дисперсия изучаемого признака

2. Определяем среднюю ошибку повторной случайной выборки

3. Зададим вероятность, на уровне которой будем говорить о величине предельной ошибки выборки. Чаще всего она принимается равной 0,999; 0,997; 0,954.

Для наших данных определим предельную ошибку выборки, например, с вероятностью 0,954. По таблице значений вероятности функции нормального распределения (см. выдержку из нее, приведенную в Приложении 1) находим величину коэффициента доверия t, соответствующего вероятности 0,954. При вероятности 0,954 коэффициент t равен 2.

4. Предельная ошибка выборки с вероятностью 0,954 равна

5. Найдем доверительные границы для среднего значения уровня фондоотдачи в генеральной совокупности

Таким образом, в 954 случаях из 1000 среднее значение фондоотдачи будет не выше 1,88 руб. и не ниже 1,74 руб.

Выше была использована повторная схема случайного отбора. Посмотрим, изменятся ли результаты обследования, если предположить, что отбор осуществлялся по схеме бесповторного отбора. В этом случае расчет средней ошибки проводится по формуле

Тогда при вероятности равной 0,954 величина предельной ошибки выборки составит:

Доверительные границы для среднего значения признака при бесповторном случайном отборе будут иметь следующие значения:

Сравнив результаты двух схем отбора, можно сделать вывод о том, что применение бесповторной случайной выборки дает более точные результаты по сравнению с применением повторного отбора при одной и той же доверительной вероятности. При этом, чем больше объем выборки, тем существеннее сужаются границы значений средней при переходе от одной схемы отбора к другой.

По данным примера определим, в каких границах находится доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., в генеральной совокупности:

1) рассчитаем выборочную долю.

Количество предприятий в выборке с уровнем фондоотдачи, не превышающим значения 2,0 руб., составляет 60 единиц. Тогда

m  60, n  90, w m/n  60 : 90  0,667;

2) рассчитаем дисперсию доли в выборочной совокупности

w2 w(1  w)  0,667(1  0,667)  0,222;

3) средняя ошибка выборки при использовании повторной схемы отбора составит

Если предположить, что была использована бесповторная схема отбора, то средняя ошибка выборки с учетом поправки на конечность совокупности составит

4) зададим доверительную вероятность и определим предельную ошибку выборки.

При значении вероятности Р  0,997 по таблице нормального распределения получаем значение для коэффициента доверия t  3 (см. выдержку из нее, приведенную в Приложении 1):

5) установим границы для генеральной доли с вероятностью 0,997:

Таким образом, с вероятностью 0,997 можно утверждать, что в генеральной совокупности доля предприятий с уровнем фондоотдачи, не превышающим значения 2,0 руб., не меньше, чем 54,7%, и не больше 78,7%.

2. Типическая выборка. При типической выборке генеральная совокупность объектов разбита на k групп, тогда

N1N2  …  Ni  …  NkN.

Объем извлекаемых из каждой типической группы единиц зависит от принятого способа отбора; их общее количество образует необходимый объем выборки

n1n2  …  ni  …  nkn.

Существуют следующие два способа организации отбора внутри типической группы: пропорциональной объему типических групп и пропорциональной степени колеблемости значений признака у единиц наблюдения в группах. Рассмотрим первый из них, как наиболее часто используемый.

Отбор, пропорциональный объему типических групп, предполагает, что в каждой из них будет отобрано следующее число единиц совокупности:

где ni  количество извлекаемых единиц для выборки из i-й типической группы;

n  общий объем выборки;

Ni  количество единиц генеральной совокупности, составивших i-ю типическую группу;

N  общее количество единиц генеральной совокупности.

Отбор единиц внутри групп происходит в виде случайной или механической выборки.

Формулы для оценивания средней ошибки выборки для среднего и доли представлены в табл. 11.2.

Таблица 2

Формулы для расчета средней ошибки выборки () при использовании типического отбора, пропорционального объему типических групп

Здесь средняя из групповых дисперсий типических групп.

Пример 3. В одном из московских вузов проведено выборочное обследование студентов с целью определения показателя средней посещаемости вузовской библиотеки одним студентом за семестр. Для этого была использована 5%-ная бесповторная типическая выборка, типические группы которой соответствуют номеру курса. При отборе, пропорциональном объему типических групп, получены следующие данные:

Число студентов, которое необходимо обследовать на каждом курсе, рассчитаем следующим образом:

 общий объем выборочной совокупности:

 количество единиц, отобранных из каждой типической группы:

аналогично для других групп:

п2  31 (чел.);

п3  29 (чел.);

п4  18 (чел.);

п5  17 (чел.).

Проведем необходимые расчеты.

1. Выборочная средняя, исходя из значений средних типических групп, составит:

2. Средняя из внутригрупповых дисперсий

3. Средняя ошибка выборки:

С вероятностью 0,954 находим предельную ошибку выборки:

4. Доверительные границы для среднего значения признака в генеральной совокупности:

Таким образом, с вероятностью 0,954 можно утверждать, что один студент за семестр посещает вузовскую библиотеку в среднем от семи до девяти раз.

3. Малая выборка. В связи с небольшим объемом выборочной совокупности те формулы для определения ошибок выборки, которые использовались нами ранее при «больших» выборках, становятся неподходящими и требуют корректировки.

Среднюю ошибку малой выборки определяют по формуле

Предельная ошибка малой выборки:

Распределение значений выборочных средних всегда имеет нормальный закон распределения (или приближается к нему) при п  100, независимо от характера распределения генеральной совокупности. Однако в случае малых выборок действует иной закон распределения  распределение Стьюдента. В этом случае коэффициент доверия находится по таблице t-распределения Стьюдента в зависимости от величины доверительной вероятности Р и объема выборки п. В Приложении 1 приводится фрагмент таблицы t-распределения Стьюдента, представленной в виде зависимости доверительной вероятности от объема выборки и коэффициента доверия t.

Пример 4. Предположим, что выборочное обследование восьми студентов академии показало, что на подготовку к контрольной работе по статистике они затратили следующее количество часов: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6,6.

Оценим выборочные средние затраты времени и построим доверительный интервал для среднего значения признака в генеральной совокупности, приняв доверительную вероятность равной 0,95.

1. Среднее значение признака в выборке равно

2. Значение среднего квадратического отклонения составляет

3. Средняя ошибка выборки:

4. Значение коэффициента доверия t  2,365 для п  8 и Р  0,95 (Приложение 1).

5. Предельная ошибка выборки:

6. Доверительный интервал для среднего значения признака в генеральной совокупности:

То есть с вероятностью 0,95 можно утверждать, что затраты времени студента на подготовку к контрольной работе находятся в пределах от 6,9 до 8,5 ч.