Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПРАКТИКУМ ПО СТАТИСТИКЕ.doc
Скачиваний:
101
Добавлен:
27.03.2016
Размер:
4.65 Mб
Скачать

4.3. Рекомендации преподавателям

1. Практические занятия. При решении задач на расчет средней величины необходимо использовать алгоритм выбора рабочей формулы средней. Очень важно показать студентам недопустимость замены взвешенных формул невзвешенными.

При использовании относительных показателей особое внимание необходимо уделить осознанному выбору базы сравнения, определению размерности относительных величин и их экономической интерпретации.

При изучений показателей вариации необходимо часть времени выделить обсуждению со студентами сущности, назначения и использования каждого из показателей вариации. . Главное внимание , при этом необходимо обратить на относительные показатели вариации.

Завершением практических занятий по теме должно быть структурных показателей вариационного ряда и выяснением их аналитического смысла. При этом необходимо обратить внимание на вычисление и экономическую интерпретацию квантилей ряда распределения.

2. Задание для самостоятельной внеаудиторной работы студентов может заключаться в подборе из данного задачника задач для расчета относительных, средних, структурных и показателей вариации.

3. Оценочные средства для текущего контроля успеваемости.Промежуточными средствами для текущего контроля успеваемости являются контрольная работа и тестирование по данной теме, а также выполняемые индивидуальные задания.

Тема 5. Выборочные наблюдения

5.1. Методические указания и решение типовых задач

Выборочное наблюдение является одной из центральных в курсе теории статистики. Это обусловлено, прежде всего, взаимосвязью данной темы с другими темами, в частности, со статистическим наблюдением, статистическими показателями, таблицами и др. Поэтому освоение теоретического материала, дает возможность правильно решать практические задачи по данной теме, грамотно интерпретировать полученные результаты, а также служат базовым условием успешного изучения в целом курса теории статистики.

Выборочное наблюдение – это такое несплошное наблюдение, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исследуемую совокупность. При этом наблюдение организуется таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует ( представляет ) всю совокупность.

Совокупность, из которой производится отбор единиц, называется генеральной, и все ее обобщающие показатели – генеральными.

Совокупность отобранных единиц называют выборочной совокупностью, а все ее обобщающие показатели – выборочными.

Имеется ряд причин, в силу которых во многих случаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенные из них следующие:

1) экономия времени и средств в результате сокращения объема работы;

2) сведение к минимуму порчи или уничтожения исследуемых объектов ( определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность );

3) необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц ( при изучении пассажиропотоков , при изучении бюджета семей );

4) достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.

Преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организовано и проведено в строгом соответствии с научными принципами теории выборочного метода. Такими принципами являются: обеспечение случайности ( равной возможности попадания в выборку ) отбора единиц и достаточного их числа. Соблюдение этих принципов позволяет получит объективную гарантию репрезентативности полученной выборочной совокупности.

Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности ( средней и доли ) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических исследованиях ( сплошных и выборочных ) возникают ошибки двух видов: регистрации и репрезентативности.

Ошибки регистрации могу иметь случайный и систематический характер. Случайные ошибки обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. Систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора. Их можно избежать при правильной организации и проведении наблюдения.

Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Для каждого конкретного выборочного наблюдения значение ошибки репрезентативности может быть определено по соответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе - качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповторную выборку.

При повторной выборке общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единиц, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку.

При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует. Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности.

В практике выборочных исследований наибольшее распространение получили следующие виды выборки: собственно – случайная, механическая, типическая, комбинированная.

Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:

объем генеральной совокупности ( число входящих в нее единиц );

объем выборки ( число обследованных единиц );

генеральная средняя ( среднее значение признака в генеральной совокупности );

выборочная средняя;

генеральная для ( доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности );

выборочная доля;

генеральная дисперсия ( дисперсия признака в генеральной совокупности );

выборочная дисперсия того же признака;

среднее квадратическое отклонение в генеральной совокупности;

среднее квадратическое отклонение в выборке.

При выборочном наблюдении должна быть обеспечена случайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно – случайная выборка.

К собственно – случайной выборке относится отбор единиц из всей генеральной совокупности посредством жеребьевки или какого-либо иного подобного способа, например с помощью таблицы случайных чисел. Принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой-либо фактор, случая. При этом количество отобранных в выборку единиц обычно определяется исходя из принятой доли выборки.

Доля выборки есть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

.

Так, при 5% - ной выборке из партии деталей в 1000 ед. объемом выборки составляет 50 ед., а при 10% - ной выборке – 100 ед. и т. д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимуму.

Рассмотрим некоторые вопросы теории выборочного наблюдения и формулы ошибок для простой случайной выборки.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признака и относительную величину альтернативного признака ( долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака ).

Выборочная доля , или частость, определяется отношением числа единиц, обладающих изучаемым признаком, к общему числу единиц выборочной совокупности:

.

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки или, иначе говоря, ошибка репрезентативности, представляет собой разность соответствующих выборочных и генеральных характеристик:

для средней количественного признака

; (5.1)

для доли

. (5.2)

Ошибка выборки свойственна только выборочным наблюдениям. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются соответствующих генеральных показателей.

Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности пополи в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки.

От чего зависит средняя ошибка выборки? При соблюдении принципа случайности отбора средняя ошибка выборки определяется, прежде всего, объемом выборки: чем больше численности при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки также зависит от степени варьирования изучаемого признака. Степень варьирования изучаемого признака, как известно, характеризуется дисперсией илидля альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот.

Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражает в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики неизвестны, и следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам (1). (2).

При случайном повторном отборе средние ошибки выборки рассчитывают по следующим формулам:

для средней количественного признака

; (5.3)

для доли

. (5.4)

Поскольку практически дисперсия признака в генеральной совокупности тоже неизвестна, на практике пользуются выборочной дисперсией, рассчитанным для выборочной совокупности на основании закона больших чисел. Согласно этому закону выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Таким образом, расчетные формулы средней ошибки выборки при случайном повторном отборе будут следующие:

для средней количественного признака

; (5.5)

для доли

. (5.6)

При случайном бесповторном отборе в приведенные выше формулы расчета средних ошибок выборки необходимо подкоренное выражение умножить на коэффициент , поскольку в процессе бесповторной выборки сокращается объем генеральной совокупности. В связи с этим мы получим следующие расчетные формулы:

для средней количественного признака

; (5.7)

для доли

. (5.8)

Механическая выборка применяется в тех случаях, когда генеральная совокупность каким-либо образом упорядочена, т. е. имеется определенная последовательность в расположении единиц ( табельный номер работников, список избирателей, телефонные номера респондентов, номера домов и квартир и т. п.). Для проведения такой выборки устанавливается пропорция отбора, которая определяется соотношением объемов выборочной и генеральной совокупностей. Допустим, из генеральной совокупности в 500000 единиц предполагается получить выборку объемом 10000 единиц. Составляют пропорцию , т. е. необходимо отбирать каждую 50 – ую единицу. Если пропорция равнато отбирается каждая 20 – ая единица и т. д.

Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка, которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль , формы собственности. Затем из каждой типической группы собственно-случайно или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность. При этом, число единиц, подлежащих отбору из каждой группы определяется следующим образом:

,

где объемой типической группы генеральной совокупности;

объем генеральной совокупности и она равна:

;

объем суммарной выборки.

Типическая выборка обычно применяется при изучении сложных совокупностей ( например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдельных отраслях экономики, производительности труда рабочих предприятия, представленных отдельными группами по квалификации ).

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки.

При определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки количественного признака типологической выборки при типологической выборке находят по формулам:

( повторный отбор ); (5.9)

( бесповторный отбор ), (5.10)

где средняя арифметическая групповых диспепсий:

.

Здесь дисперсияой типической группы, и рассчитывается по формуле:

;

где результатго наблюдения, полученного по выборке изой типологической группы.

Выборочная средняя ошибка доли определяется следующим образом.

При повторном отборе:

, (5.11)

где относительная частота ( доля ), полученная изой группы.

При бесповторном отборе подкоренное выражение формулы (6.11) умножается на коэффициент .

Серийная выборка удобно в тех случаях, когда единицы генеральной совокупности объединены в небольшие группы или серии. В качестве таких серий могут рассматриваться партии товара, студенческие группы, бригады и другие объединения. При серийном отборе случайным или механическим способами выбирают не отдельные единицы, а серий, внутри которых проводится сплошное обследование.

Среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:

( повторный отбор ) (5.12);

( бесповторный отбор ), (5.13)

где число отобранных серий;

общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют следующим образом:

,

где средняяой серий;

общая средняя по всей выборочной совокупности.

Среднюю ошибку выборки для доли при серийном отборе:

( повторный отбор ); (5.14)

( бесповторный отбор ). (5.15)

Межсерийную дисперсию доли серийной выборки определяют по формуле:

,

где доля признака вой серии;

общая доля признака во всей выборочной совокупности.

В практике статистических наблюдений помимо рассмотренных способов применяется их комбинация ( комбинированный отбор ).

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.

Выборочные средние и доли распространяют на генеральную совокупность с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выборочной средней и генеральной, т. е. может быть меньше средней ошибки выборки, равной ей или больше ее.

Причем каждое из этих расхождений имеет различную вероятность. Поэтому фактические расхождения между выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью.

Предельную ошибку выборки для средней при случайном повторном отборе можно рассчитать по формуле:

, (5.16)

где нормированное отклонение – « коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки;

средняя ошибка выборки.

Аналогичным образом может быть записан формула предельной ошибки выборки для доли при случайном повторном отборе:

. (5.17)

При случайном бесповторном отборе в формулах расчета предельных ошибок выборки (6.16) и (6.17) необходимо умножить подкоренное выражение на коэффициент .

Выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик генеральной совокупности.

Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:

(для средней ); (5.18)

( для доли ). (5.19)

Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от до.

Аналогичным образом может быть записан доверительный интервал генеральной доли: от до.

При проектировании выборочного наблюдения с заранее заданным значением предельной ошибкой выборки очень важно правильно определить численность ( объем ) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность результатов наблюдения. Формулы для определения необходимой численности выборки легко получить непосредственно из формул ошибок выборки.

Так, из формул предельной ошибки выборки для случайного повторного отбора нетрудно ( предварительно возведя в квадрат обе части равенства ) выразить необходимую численность выборки:

для средней количественного признака

; (5.20)

для доли

. (5.21)

Точно также из формул предельной ошибки выборки для бесповторного отбора находим что

( для средней ); (5.22)

( для доли ). (5.23)

Эти формулы показывают, что с увеличением предполагаемой ошибки выборки значительно уменьшается необходимый объем выборки.

Для расчета объема выборки нужно знать дисперсию. Она может быть заимствована из прошлых обследований данной или аналогичной совокупности.

Пример 1.

При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30 гр. при среднем квадратическом отклонении 4 гр. С вероятностью 0,997 определите пределы, в которых находится средний вес изделий генеральной совокупности.

Решение:

Рассчитаем сначала предельную ошибку случайной повторной выборки по формуле:

,

среднеквадратическая ошибка выборочной средней;

- параметр, получаемый по таблицам теории вероятностей на основании заданной доверительной вероятности ();

- объем выборочной совокупности.

Тогда получим:

Определим пределы генеральной средней по формуле:

.

С учетом имеющихся и полученных данных получим:

.

Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в данной партии импортируемого груза находится в пределах от 29,16 до 30,84 гр.

Пример 2.

В городе проживает 250 тыс. семей. Для определения среднего числа детей в семье была организована 2%-ная случайная бесповторная выборка семей. По ее результатам было получено следующее распределение семей по числу детей:

Число детей в семье

0

1

2

3

4

5

Количество семей

1000

2000

1200

400

200

200

С вероятностью 0,954 найдите пределы, в которых будет находится среднее число детей генеральной совокупности.

Решение:

В начале на основе имеющегося распределения семей определим выборочную среднюю и дисперсию по формулам соответственно:

;

.

Вычислим теперь предельную ошибку случайной бесповторной выборки по следующей формуле:

,

где N - число жителей города (объем генеральной совокупности).

Тогда получим: .

Следовательно, пределы генеральной средней:

.

Таким образом, с вероятностью 0,954 можно утверждать, что среднее число детей в семьях города практически не отличается от 1,5, т.е. в среднем на каждые две семьи приходится три ребенка.

Пример 3.

С целью определения средней фактической продолжительности рабочего дня в государственном учреждении с численностью служащих 480 человек в июне 2008 года была проведена 25%-ная механическая выборка. По результатам наблюдения оказалось, что у 10% обследованных потери времени достигали более 45 мин. в день. С вероятностью 0,683 установите пределы, в которых находится генеральная доля служащих с потерями рабочего времени более 45 мин. в день.

Решение:

Определим объем выборочной совокупности:

.

Выборочная доля равна по условию 10%. Учитывая, что показатели точности механической и собственно-случайной бесповторной выборки определяются одинаково, а также то, что при вероятности 0,683, вычислим предельную ошибку выборочной доли:

.

Пределы доли признака в генеральной совокупности:

.

Таким образом, с вероятностью 0,683 можно утверждать, что доля работников учреждения с потерями рабочего времени более 45 мин. в день находится в пределах от 7,6 до 12,4%.

Пример 4.

В области, состоящей из 20 районов, проводилось выборочное обследование урожайности на основе отбора серии (районов). Выборочные средние по районам составили соответственно 14,5; 16; 15,5; 15 и 14 ц/га. С вероятностью 0,954 найдите пределы урожайности во всей области.

Решение:

Рассчитаем общую среднюю:

.

Так как серийная выборка была осуществлена бесповторным способом, то среднюю ошибку выборки рассчитаем по формуле:

,

где R - число серий в генеральной совокупности (R = 20);

r - число серий в выборочной совокупности (r = 5);

- межсерийная дисперсия, рассчитываемая по формуле:

.

Подставляя сюда данные, получим:

.

Определим теперь предельную ошибку серийной бесповторной выборки при t = 2:

.

Следовательно, урожайность в области с вероятностью 0,954 будет находиться в пределах:

.

Пример 5.

В ста туристических агентствах города предполагается провести обследование среднемесячного количества реализованных путевок методом механического отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,683 ошибка не превышала 3 путевок, если по данным пробного обследования дисперсия составляет 225?

Решение:

Рассчитаем необходимый объем выборки по формуле:

.

Пример 6.

С целью определения доли сотрудников коммерческих банков области в возрасте старше 40 лет предполагается организовать типическую выборку пропорционально численности сотрудников мужского и женского пола с механическим отбором внутри групп. Общее число сотрудников банков составляет 12000 человек, в том числе 7000 мужчин и 5000 женщин.

На основании предыдущих обследований известно, что средняя из внутригрупповых дисперсий составляет 1600. Определите необходимый объем выборки при вероятности 0,997 и ошибке 5%.

Решение:

Рассчитаем общую численность типической выборки по формуле:

.

Вычислим объем отдельных типических групп:

; .

Таким образом, необходимый объем выборочной совокупности сотрудников коммерческих банков составляет 550 человек, в том числе 319 мужчин и 231 женщина.

Пример 7.

В АО 200 бригад рабочих. Планируется проведение выборочного обследования с целью определения удельного веса рабочих, имеющих профессиональные заболевания. Известно, что межсерийная дисперсия доли равна 225. С вероятностью 0,954 рассчитайте необходимое количество бригад для обследования рабочих, если ошибка выборки не должна превышать 5%.

Решение:

Рассчитаем необходимое количество бригад на основе формулы объема серийной бесповторной выборки:

.