Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАТИСТИКА.doc
Скачиваний:
41
Добавлен:
21.02.2016
Размер:
1.87 Mб
Скачать

Тема 9. Выборочное наблюдение.

  1. Понятие выборочного наблюдения.

  2. Генеральная и выборочная совокупность.

  3. Понятие об ошибках выборки.

  4. Расчет необходимой численности выборки.

  1. Понятие выборочного наблюдения.

Выборочным называют несплошное наблюдение, при котором статистическому обследованию подвергается часть изучаемой совокупности, отобранная по правилам, определяемым способом отбора. При этом отобранная часть формируется с учетом положений теории вероятности и математической статистики.

У выборочного наблюдения есть свои достоинства. При правильно организованном выборочном обследовании изучается не более 20-25% совокупности - на лицо огромная экономия времени и средств. При этом благодаря работе статистиков – профессионалов значительно повышается точность наблюдений (нередко она выше, чем при сплошном наблюдении). Однако, параметры выборки в силу объективных причин могут отличаться от соответствующих параметров генеральной совокупности, поэтому результаты выборочного исследования распространяются на генеральную совокупность с определенной вероятностью.

Не всякое несплошное наблюдение – это научно-обоснованная выборка. Качество результатов выборочного наблюдения зависит от репрезентативности выборки, т.е. от того, насколько она представительна в генеральной совокупности. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы генеральной совокупности в выборку не может повлиять какой-либо иной фактор кроме случая.

Существуют следующие способы формирования выборки:

- случайный (дает лотерея или жеребьевка, на практике вместо жеребьевки используют генераторы случайных чисел);

- механический (отбираются единицы генеральной совокупности с постоянным шагом. Так, если генеральная совокупность содержит 100 тыс.ед., а требуется выбрать 1 тыс.ед., то в выборку попадет каждая сотая единица);

- типовой (разделение генеральной совокупности на группы по определенным признакам, например, распределение студентов института по факультетам. При этом распределение по группам может быть пропорциональным и непропорциональным. При пропорциональном количество наблюдений в каждой группе где n-численность выборочной совокупности; Nі - объем i-й группы; N - объем генеральной совокупности);

- серийный (случайным или механическим способом выбирают не отдельные единицы, а определенные серии (гнезда), внутри которых производится сплошное наблюдение, например, через каждые 9 часов на протяжении десятого часа вся изготовленная продукция подлежит сплошному исследованию);

- комбинированный (комбинация сплошного и выборочного наблюдения или, например, комбинация типового и серийного отборов, когда серии отбираются в установленном порядке из нескольких типовых групп, комбинация серийного и случайного отборов, при которой отдельные единицы выбираются в каждой отдельной серии в случайном порядке).

Кроме того, выборка может быть повторной и бесповторной.

Повторная выборка – выборка, при которой каждая из единиц, отобранная из генеральной совокупности, после регистрации признаков возвращается назад и может в следующем отборе попасть в выборку еще раз, т.е. повторно.

Бесповторной выборка называется потому, что каждая из единиц после регистрации ее признаков назад не возвращается и в следующем отборе не используется.

  1. Генеральная и выборочная совокупность.

Всю совокупность единиц, которые подлежат обследованию называют генеральной совокупностью. Ее численность обозначается N.

Часть совокупности, которая подлежит выборочному обследованию, называют выборочной, ее численность обозначается n.

Задание выборочного наблюдения – получить правильное представление о показателях генеральной совокупности на основе изучения выборочной совокупности.

При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей:

- доля (удельный вес) (в генеральной совокупности обозначается P, в выборочной – w);

- средняя величина.

Удельный вес дает характеристику совокупности по вариационному признаку и рассчитывается как отношение числа единиц совокупности, которые имеют интересующий нас признак к общему числу единиц совокупности.

Среднее значение вариационного признака во всей генеральной совокупности называется генеральной средней , а среднее значение признака, который подлежит выборочному наблюдению называется выборочной средней .

В процессе статистических исследований нередко приходится ограничивать объем выборки. В статистике доказано, что даже выборки весьма малого объема (до 30 единиц), которые называют малыми выборками, позволяют получить приемлемые для анализа результаты.

Проблема малых выборок была решена в 1908г. английским статистиком У.Гассетом (псевдоним Стьюдент (студент)). Он сумел определить зависимость между величиной доверительного коэффициента t, а так же численностью малой выборки n с одной стороны, и вероятностью нахождения ошибки выборки в заданных пределах с другой стороны. Эта зависимость получила название – распределение Стьюдента.

Для определения возможных границ ошибки пользуются так называемым критерием Стьюдента, который определяется по формуле:

,

где мера случайных колебаний выборочной средней в малой выборке.

Размер s рассчитывается на основе данных выборочного наблюдения по формуле:

.

Для упрощения расчетов имеются специальные таблицы значений критериев Стьюдента.

  1. Понятие об ошибках выборки.

Ошибка выборки возникает из-за различий в вариации значений изучаемого признака у единиц выборочной и генеральной совокупности. Поскольку при соблюдении требований случайного отбора все единицы генеральной совокупности имеют равные шансы попасть в выборку, состав выборки может значительно изменяться при повторении испытаний. Соответственно будут меняться параметры выборки, и возникать ошибки выборки. Ошибки выборки неизбежны, они вытекают из сути метода. Ошибки выборки не могут быть постоянными при повторении отбора.

Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме Чебышева, при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:

при .

А. М. Ляпунов доказал, что независимо от характера распределения генеральной совокупности при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению (центральная предельная теорема). Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:

,

где – нормированное отклонение выборочной средней от генеральной средней.

При определении ошибки выборки речь идет о том, чтобы максимально приблизить показатели выборочной совокупности к показателям генеральной совокупности и выявить допустимые граничные отклонения этих показателей.

В процессе выборочного наблюдения возможно решить 2 задачи:

- установить пределы (границы) среднего значения признака в генеральной совокупности: ;

- найти пределы (границы) доли альтернативного признака в генеральной совокупности: .

Ошибка репрезентативности, или разница между выборочной и генеральной характеристикой (долей или средней), которая возникает вследствие несплошного наблюдения, в основе которого лежит случайный отбор, рассчитывается как граница вероятной ошибки (предельная ошибка выборки).

В общем виде предельная ошибка выборки определяется (на основе теоремы Ляпунова) как:

= t,

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки (значения t при заданной вероятности P определяются по таблице значений, которая рассчитывается по формуле Лапласа).

Например, при P=0,683 t=1,

при P=0,954 t=2,

при P=0,997 t=3.

Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. В качестве уровня доверительной (гарантированной) вероятности принимается, обычно, 0,954 или 0,997. Тогда граница ошибки определяется величиной, удвоенной или утроенной по отношению к средней ошибке выборки .

Средняя ошибка выборки определяется по формулам:

- для повторного случайного отбора

= ;

для бесповторного случайного и механического отборов

= ;

где - дисперсия (для типовой выборки - средняя из внутригрупповых дисперсий; для простой случайной и механической выборок – дисперсия выборочной совокупности).

Таким образом, предельная ошибка выборки для средней рассчитывается по формулам:

- для повторного случайного отбора

;

для бесповторного случайного и механического отборов

.

Предельная ошибка выборки для доли альтернативного признака:

- при повторном отборе

,

  • при бесповторном

,

где -доля альтернативного признака;

m-численность совокупности по альтернативному признаку;

- численность выборочной совокупности.

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики генеральной совокупности, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.

Вероятности конкретного размера ошибок подсчитать невозможно (нецелесообразно), гораздо важнее знать, что ошибка наблюдений не выйдет за определенные пределы.

Рассмотрим пример. Допустим, в результате выборочного исследования жилищных условий жителей города, осуществленного на основе случайной повторной выборки, получен такой ряд распределения.

Таблиця 9.1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]