 
        
        - •Ссэи рэу им. Г.В. Плеханова
- •Тема 1. Предмет, метод и задачи статистики
- •Методические указания
- •Тема 2. Статистическое наблюдение
- •Методические указания
- •Тема 3. Статистическая сводка и группировка
- •Методические указания
- •Ряд распределения рабочих по тарифному разряду
- •Ряд распределения рабочих по уровню квалификации
- •Задачи для самостоятельной работы
- •Тема 4. Абсолютные и относительные величины
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 5. Средние величины и показатели вариации
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 6. Индексы
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 7. Ряды динамики
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 8. Выборочное наблюдение
- •Методические указания
- •Задачи для самостоятельной работы
- •Тема 9. Статистическое изучение связи между признаками
- •Методические указания
- •Задачи для самостоятельной работы
- •План для самоконтроля
- •Список рекомендуемой литературы
Методические указания
Эта тема связана со многими другими темами курса теории статистики, а также с математической статистикой и теорией вероятностей, в которых дается математическая теория закона больших чисел, являющаяся теоретической основой выборочного метода исследования.
Вначале здесь необходимо выяснить причины применения выборочного наблюдения, далее надо ознакомиться с основными его понятиями. Один из вопросов темы – виды выборки (повторная и бесповторная) и способы отбора, обеспечивающие репрезентативность выборки (случайный или собственно случайный, механический, типический, серийный).
Главными вопросами этой темы являются определение средней ошибки выборки собственно случайного отбора – для средней и для доли; предельной ошибки выборки при заданном уровне вероятности; пределов для средней и для доли; необходимой численности выборки (объема выборки).
Для успешного усвоения темы 8 необходимо ознакомиться с представленным теоретическим материалом и целесообразно решить предлагаемые задачи.
Выборочное наблюдение (ВН) – один из видов несплошного наблюдения. Выборочным наблюдением называют такое несплошное наблюдение, при котором статистическому обследованию подвергаются не все единицы изучаемой совокупности, а лишь отобранные случайным образом.
Цель ВН состоит в том, чтобы по характеристикам отобранной части единиц судить о характеристиках всей совокупности.
Причины применения ВН:
- экономия времени и средств в результате сокращения объема работ; 
- минимум порчи или даже уничтожения исследуемых объектов; 
- необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц; 
- достижение большей точности результатов обследования. 
При изучении темы необходимо усвоить следующие понятия:
а) генеральная совокупность – вся изучаемая совокупность (общее число рабочих завода). Объем генеральной совокупности обозначают N;
б) выборочная совокупность – часть генеральной совокупности, отобранная для ВН. Число единиц выборочной совокупности обозначают n;
в)
генеральная средняя ( )
– средняя величина признака для
генеральной совокупности;
)
– средняя величина признака для
генеральной совокупности;
г)
выборочная средняя ( )
– средняя величина признака для
выборочной совокупности;
)
– средняя величина признака для
выборочной совокупности;
д) генеральная доля (p) – отношение числа единиц генеральной совокупности, обладающих значением изучаемого признака ко всему числу единиц генеральной совокупности;
е) выборочная доля (w) – отношение числа единиц выборочной совокупности, обладающих значением изучаемого признака к числу единиц выборочной совокупности, т.е. это доля признака в выборочной совокупности.
Различают повторную и бесповторную выборку. При повторной выборке единицы генеральной совокупности, попавшие в выборку, вновь возвращаются после обследования в генеральную совокупность и участвуют в дальнейшей процедуре отбора, а при бесповторной – не возвращаются.
Примером повторной выборки является обследование пассажиропотока на городском транспорте, а бесповторной – выборочное изучение качества какой-либо продукции. Бесповторная выборка применяется чаще, чем повторная.
Различают следующие основные способы отбора:
- случайный (собственно случайный); 
- типический; 
- серийный (гнездовой); 
- механический. 
Первые три способа отбора могут быть проведены с помощью повторной или бесповторной выборки, механический отбор производится только с помощью бесповторной выборки.
В
процессе ВН возникают специфические
ошибки – ошибки репрезентативности(ОР). Они возникают вследствие различия
структуры выборочной и генеральной
совокупностей. В общем виде ОР – это
разность между обобщающими выборочными
показателями и соответствующими
показателями генеральной совокупности.
ОР для средней – это
 ,
а для доли –
,
а для доли – .
.
Для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.
Средняя ошибка
выборки показывает, на сколько в среднем
отклоняются выборочные характеристики
от генеральных. Если
обследуется признак в форме средней,
то средняя ошибка выборки ( )
определяется:
)
определяется:
а) при повторной выборке:
 ,
,
где
 – выборочная
дисперсия,
– выборочная
дисперсия,
 
 –объем выборки;
–объем выборки;
б) при бесповторной выборке:
 ,
,
где N – объем генеральной выборки,
 –доля выборки.
–доля выборки.
Вторая формула может быть использована не только для собственно случайного отбора, но и для механического.
Если обследуется
признак в форме доли,
то средняя ошибка выборки ( )
определяется:
)
определяется:
а) при повторной выборке:
 ,
,
где w – доля признака в выборочной совокупности;
б) при бесповторной выборке:
 .
.
Заметим, что формулы
повторной и бесповторной выборки
отличаются на выражение  ,
которое всегда меньше единицы. Из этого
следует, что средняя ошибка выборки при
бесповторном отборе меньше средней
ошибки выборки при повторном отборе.
,
которое всегда меньше единицы. Из этого
следует, что средняя ошибка выборки при
бесповторном отборе меньше средней
ошибки выборки при повторном отборе.
При проведении выборочного наблюдения исследователя устраивает средняя ошибка выборки в определенных границах. Поэтому необходимо ориентироваться на предельную ошибку выборки при заданном уровне вероятности.
Предельная ошибка
выборки ( )
– это наперед заданное сколь угодно
малое число, которое определяется по
формуле:
)
– это наперед заданное сколь угодно
малое число, которое определяется по
формуле:
 ,
,
где
 – коэффициент
доверия, зависящий от вероятности,
определяется по соответствующим таблицам
(если, например,
– коэффициент
доверия, зависящий от вероятности,
определяется по соответствующим таблицам
(если, например,  =0,954,
то
=0,954,
то  =2,
если
=2,
если  =0,997,
то
=0,997,
то  =3).
=3).
Таким образом,
предельная ошибка выборки равна t-кратной
средней ошибки. Для ее определения при
заданном уровне вероятности необходимо:
а) определить среднюю ошибку выборки
( )
– по соответствующей формуле, б) исходя
из заданной вероятности
)
– по соответствующей формуле, б) исходя
из заданной вероятности  ,
с помощью специальных таблиц, найти
число
,
с помощью специальных таблиц, найти
число  ,
соответствующее вероятности, в) найти
произведение
,
соответствующее вероятности, в) найти
произведение  .
.
Пределы (вероятные границы, доверительные интервалы), в которых находятся соответствующие генеральные показатели, устанавливаются по следующим формулам:
1) для средней:
 ,
,
где
 – генеральная
средняя;
– генеральная
средняя;
 
 –выборочная
средняя;
–выборочная
средняя;
 
 –предельная
ошибка выборочной средней;
–предельная
ошибка выборочной средней;
2) для доли:
 ,
,
где
 –
генеральная доля;
–
генеральная доля;
w – выборочная доля;
 –предельная
ошибка выборочной доли.
–предельная
ошибка выборочной доли.
Определение объема выборки (n) при заданной ее точности является проблемой, обратной рассмотренной ранее – определение предельной ошибки выборки при данном ее объеме. Формула объема выборки – в четырех вариантах – получается из соответствующей формулы предельной ошибки.
Если обследуется признак в форме средней, то объем выборки при повторной выборке определяется:
 ;
;
при бесповторной выборке:
 .
.
Если обследуется признак в форме доли, то объем выборки при повторной выборке определяется:
 ,
,
при бесповторной выборке:
 .
.
Для успешного усвоения темы целесообразно решить предлагаемые типовые задачи.
Типовая задача 1
Для определения среднего срока пользования краткосрочным кредитом в банке была проведена пяти процентная бесповторная выборка, в которую попало 100 счетов. В результате обследования установлено, что средний срок пользования краткосрочным кредитом – 30 дней при среднем квадратическом отклонении – 9 дней. В пяти счетах срок пользования кредитом превышал 60 дней.
С вероятностью 0,954 определите пределы, в которых будет находиться срок пользования краткосрочным кредитом в генеральной совокупности и доля счетов со сроком пользования более 60 дней.
Для определения пределов, в которых будет находиться срок пользования краткосрочным кредитом в генеральной совокупности, рассчитаем среднюю и предельную ошибки выборки. Так как отбор бесповторный и обследуется признак в форме средней, то воспользуемся следующими формулами:
- средняя ошибка выборки:
 ;
;
- предельная ошибка выборки:
 .
.
Для вероятности
0,954 t=2.
Следовательно, 
 дней.
дней.
Тогда пределы, в которых будет находиться срок пользования краткосрочным кредитом в генеральной совокупности, определяются как:
 ,
,
 ,
,
 .
.
Срок пользования краткосрочным кредитом находится в границах от 28,2 до 31,8 дней.
Определим долю счетов со сроком пользования более 60 дней.
Выборочная доля счетов со сроком пользования более 60 дней равна:
 .
.
Средняя ошибка выборки для доли счетов со сроком пользования более 60 дней определяется по формуле:
 ,
,
 .
.
Предельная ошибка выборки для доли счетов со сроком пользования более 60 дней равна:
 .
.
Тогда пределы, в которых будет находиться доля счетов со сроком пользования более 60 дней, равны:
 ,
,
 ,
,
 .
.
Удельный вес счетов со сроком пользования более 60 дней находится в границах от 1 до 9%.
Типовая задача 2
Произведено выборочное обследование длительности производственного стажа рабочих. В выборку было взято 200 рабочих из общего количества в 1000 человек. Результаты выборки следующие:
| Стаж, лет | 2-4 | 4-6 | 6-8 | 8-10 | 
| Число рабочих | 50 | 80 | 45 | 25 | 
На основании приведенных данных определить:
1) с вероятностью 0,954 возможные пределы колебаний средней продолжительности стажа всех рабочих;
2) какое число рабочих надо взять в выборку, чтобы ошибка не превышала 0,5 года на основе приведенных выше показателей.
- Возможные пределы колебания среднего стажа рабочих: 
 ,
,
гдепредельная ошибка
определяется по формуле  .
.
Определим средний стаж и дисперсию стажа работников и подставим полученные значения в формулу предельной ошибки выборки:
 лет,
лет,

 года.
года.
 ,
,
 .
.
Средний стаж рабочих предприятия с вероятностью 0,954 находится в границах от 5,25 до 5,75 года.
- Объем выборки рассчитывается по следующей формуле: 
 рабочих.
рабочих.
Для выполнения поставленных условий необходимо обследовать 58 рабочих.
