- •Тема 9. Выборочное наблюдение
- •9.1. Понятие о выборочном наблюдении, его преимущества
- •9.2. Ошибки выборки
- •9.3. Способы отбора единиц, подлежащих выборочному наблюдению
- •Краткие методические указания
- •Контрольные вопросы
- •Опорный конспект
- •Решение типовых заданий
- •Задания для самостоятельного решения
Тема 9. Выборочное наблюдение
9.1. Понятие о выборочном наблюдении, его преимущества
Как известно, наблюдение по полноте обхвата изучаемого явления подразделяются на сплошные и не сплошные. Сплошное наблюдение, предполагающее исследование всех без исключения единиц изучаемой совокупности как правило связано с большими трудовыми и материальными затратами, требует большого количества времени , а иногда не может быть осуществимо или не имеет смысла. Нельзя, к примеру, проводить обследование качества изделий сплошным методом, если это связано с их уничтожением (испытание ткани на разрыв, электрических ламп на продолжительность горения). В связи с этим прибегают к несплошному наблюдению, т.е. обследованию лишь некоторой части, по которой можно судить о свойствах всей совокупности. Самым распространенным в статистической практике является выборочный метод. Суть выборочного наблюдения заключается в том, что обследованию подвергается часть единиц исследуемой совокупности, позволяющих по этой части единиц характеризовать совокупность в целом.
Выборочное наблюдение имеет ряд преимуществ и его применение обусловлено многими причинами:
Быстрота проведения наблюдения.
Обеспечение возможности лучше организовать наблюдение.
Исключаются или сводятся к минимуму ошибки наблюдения.
Выборочное наблюдение используется для ускорения обработки материалов сплошного наблюдения, для контроля данных сплошного наблюдения и в тех случаях, когда наблюдение связано с порчей или уничтожением продукции (испытание ткани на разрыв, электрических ламп на продолжительность горения и т.д.).
Этапы работы при проведении выборочного наблюдения:
постановка цели наблюдения;
составление программы наблюдения;
определение процента и способа отбора;
решение организационных вопросов наблюдения;
регистрация соответствующих признаков (по программе) в отобранной совокупности;
обобщение данных наблюдения;
расчет ошибок выборки;
пересчет выборочных характеристик для всей совокупности.
9.2. Ошибки выборки
Совокупность, из которой производится отбор, называется генеральной (N – численность генеральной совокупности), а все ее обобщающие показатели – генеральными.
Совокупность отобранных единиц – выборочной совокупностью (n – число отобранных единиц), а все ее обобщающие показатели – выборочными.
Основная задача выборочного наблюдения – на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности (соблюдение репрезентативности обязательно).
Показатели |
Обозначение показателей в |
|
Генеральной совокупности |
Выборочной совокупности |
|
Численность единиц совокупности |
N |
n |
Среднее значение признака |
|
|
Дисперсия |
|
|
Среднее квадратическое отклонение |
|
S |
Доля |
Р |
W |
Средняя и доля генеральной совокупности будут несколько отличны от средней и доли в выборочной совокупности на некоторую величину (графическая буква МЮ): или , или , где – средняя ошибка выборки.
Интервал , называется доверительным или пределом, в котором заключено значение средней генеральной (или доли генеральной) по выборочным данным.
Величину отклонения или среднюю ошибку выборки можно определить по формулам:
где:
– средняя ошибка выборочной средней и выборочной доли соответственно, р(1-р)=р·q – дисперсия доли или дисперсия альтернативного признака в выборочной совокупности.
Показатели σ р генеральной совокупности нам неизвестны. Но в теории вероятностей доказано, что в случаях, когда объем выборки превышает 30, можно принять, что , таким образом, в практических расчетах средних ошибок выборки можно использовать формулы:
Чтобы определить уровень среднедушевого дохода в городе было обследовано 500 семей. Средний уровень составил 150 грн., дисперсия выборки - 1120, n= 500, = 150, =1120.
Исчислим среднюю ошибку выборки:
Это значит, что среднедушевой доход населения города находится в пределах от 148,5 грн. (105-1,5) до 151,5 грн. (150+1,5).
Однако ошибка выборки имеет определенную вероятность возникновения. Это означает, что средняя в целом по генеральной совокупности, может находиться в указанных пределах, а может и не находиться. Доказано, что степень вероятности отклонения генеральных характеристик от выборочных – постоянная величина 0,683. Это значит, что в 683 случаях из 1000, средняя генеральной совокупности (х) не выйдет за пределы + - . А в остальных 317 случаях может отличаться от на величину, большую чем .
В нашем примере в 683 случаях среднедушевой доход лежит в пределах 148,5<150<151,5. В 317 случаях – может выйти за указанные пределы.
Чтобы повысить вероятность утверждения, можно расширить пределы, увеличив в некоторое количество раз. С увеличением в – t раз, увеличивается степень вероятности наших утверждений. Приведем некоторые известные нам из курса «Математическая статистика» значения вероятностей при разной величине так называемого коэффициента доверия – t.
Значения вероятностей соответствующее коэффициенту доверия
t |
вероятность |
Т |
вероятность |
t |
вероятность |
1,0 |
0,6827 |
2,00 |
0,9545 |
2,70 |
0,9931 |
1,1 |
0,7287 |
2,50 |
0,9876 |
2,80 |
0,9949 |
1,7 |
0,9109 |
2,58 |
0,9900 |
3,00 |
0,9973 |
1,96 |
0,9500 |
2,60 |
0,9907 |
3,28 |
0,9990 |
Выделенные в таблице коэффициенты доверия с соответствующей степенью вероятности часто используются на практике.
Расширив в рассматриваемом примере пределы отклонений в 3,28 раз, получим следующий доверительный интервал:
150-3,28·1,5≤150≤150+3,28·1,5
142,08≤150≤159,92
т.е. в 999 случаях из тысячи среднедушевой доход будет находиться в указанных пределах.
С учетом коэффициента доверия t, доверительный интервал преображается и выглядит следующим образом:
Величина обозначается (греческая буква «дельта») и носит название – предельная ошибка выборки.
Формулы доверительных интервалов имеют вид:
Поступила на склад партия товаров в количестве 20 000 единиц. Выборочному обследованию подвергли качество 200 единиц. Из них 12 – бракованные. Какова доля брака всей продукции?
Мы имеем =200, W=12/200 =0,06. Доля брака в выборочной совокупности – 0,06 или на каждые 100 изделий 6 бракованных. Для определения доли бракованной продукции в генеральной совокупности используем формулу:
Мы получили Р = 0,06 ± 0,0158; или 0,06-0,0158≤ Р ≤0,06+0,0158.
Следовательно, с вероятностью 0,683, можно утверждать, что доля брака во всей продукции находится в пределах от 0,0442(0,06-0,0158) до 0,0758(0,06+0,0158) или в 683 случаях из 1000 процент бракованных изделий в генеральной совокупности будет составлять в среднем от 4,4 % до 7,6 %.
Приведенные формулы для определения величины ошибки выборки дают возможность рассчитывать, какую необходимо взять численность выборки, чтобы ошибка выборки не превышала определенных заданных размеров.
Если то , а ,
т.е. необходимая численность выборки при измерении средней равна среднему квадрату отклонений, деленному на квадрат допустимой ошибки выборки.
Если в формулу ввести коэффициент t, то она примет такой вид:
При выборочном измерении доли признака средняя ошибка выборки определяется по формуле:
, откуда ,
т.е. необходимая численность выборки равна доле, умноженной на дополнение ее до единицы и деленной на квадрат заданной точности.
Если в формулу ввести коэффициент t, то она примет такой вид:
Чтобы определить средний размер платы за 1 м2 арендуемой площади, обследовали 40 предприятий, рассчитан средний размер арендной платы – 30 грн. за 1 м2. Дисперсия составила – 60. Определить численность выборки, если с вероятностью 0,95 гарантировать, что размер ошибки выборки не будет превышать 1 грн.
Решение:
Из условия мы имеем – 60, Δ = 1. В таблице находим соответствующий вероятности 0,95 коэффициент доверия t=1,96. Для решения воспользуемся формулой:
предприятия.
Из 32 опрошенных предпринимателей высшее образование имеют – 11. Какова должна быть численность выборки, чтобы с вероятностью 0,99 предельная ошибка выборки не превышала 5 % (т.е. 0,05)
Решение:
Для расчета используем формулу:
По данным таблицы находим, что вероятности 0,99 соответствует коэффициент доверия t=2,58, W=11/32, Δ=0,01.
человека.