
- •Лекция 6 выборочное наблюдение, (начало "ряды динамики")
- •1. Теоретические основы выборочного наблюдения
- •3. Проверка типичности выборочных данных и способы их распространения
- •Ряды динамики
- •1. Ряды динамики и их виды
- •Выплавка чугуна и стали в бывшем советском союзе за 1970 — 1975 гг., тыс. Руб.
- •2. Сопоставимость уровней ряда — основная предпосылка анализа рядов динамики
- •3. Показатели анализа динамики
- •Сварка труб газопровода в сентябре
- •Лекция 7 ряды динамики (продолжение), индексы (начало)
- •4. Приемы анализа рядов динамики
- •5. Выявление основной тенденции динамики
- •6. Приемы изучения сезонных колебании (самотоятельно)
- •Индексы
- •1. Общие понятия об индексах
- •2. Принципы и методы исчисления общих индексов
- •Лекция 8. Индексы (окончание), изучение взаимосвязей.
- •3. Преобразование агрегатного индекса в индексы средние
- •5. Индексы постоянного (фиксированного) и переменного состава
- •2. Виды и формы корреляционных взаимосвязей между явлениями
- •Уровни энерговооруженности (х) и производительность труда (у) по 25 заводам
- •7. Метод аналитических группировок
- •8. Однофакторный корреляционно-регрессионный анализ
- •10. Многофакторный корреляционно-регрессионный анализ 1
Лекция 6 выборочное наблюдение, (начало "ряды динамики")
1. Теоретические основы выборочного наблюдения
Понятие о выборочном наблюдении и его задачах. Выборочным называется такое наблюдение, при котором характеристика всей совокупности единиц дается по некоторой их части, отобранной в случайном порядке. Выборочное наблюдение - наиболее распространенный вид несплошного наблюдения в советской статистике.
Широкое распространение выборочных наблюдений объясняется тем, что они требуют значительно меньше сил и средств, чем сплошные, позволяют быстрее подводить итоги и более тщательно организовать и провести наблюдение, а следовательно, дают и более точные результаты, чем сплошные. Выборочные наблюдения применяют также для проверки результатов сплошных наблюдений.
Кроме того, нередко выборочное наблюдение является единственно возможным.
Генеральная и выборочная совокупность, доля и средняя.
Вся совокупность единиц называется генеральной совокупностью, и ее численность обозначается N, а та часть совокупности единиц, которая подвергается выборочному обследованию, называется выборочной совокупностью, ее численность обозначается n.
При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей: относительными и средними величинами.
сводный показатель для генеральной совокупности называется генеральной долей, или долей в генеральной совокупности, и обозначается латинской буквой р, а для выборочной совокупности - выборочной долей, или частостью, .
Кроме измерения доли перед выборочным наблюдением может стоять задача измерения среднего значения варьирующего признака во всей совокупности.
Среднее значение варьирующего признака во всей совокупности называется генеральной средней (х-), а среднее значение признака у единиц, которые подверглись выборочному наблюдению,—выборочной средней (х- - -).
Понятие об ошибке выборки. Задача выборочного наблюдения — дать верное представление о сводных показателях всей совокупности фактов на основе некоторой части их, подвергнутой обследованию.
Поскольку речь идет о варьирующих признаках и изучают не всю совокупность единиц, а только часть их, то можно заранее сказать, что сводные показатели по этим признакам у части единиц совокупности почти никогда не будут абсолютно совпадать со сводными показателями всех единиц совокупности.
Возможные пределы отклонений выборочной доли и выборочной средней от доли и средней в генеральной совокупности носят название ошибки выборки (иначе она называется ошибкой репрезентативности).
Надо различать ошибки выборки и ошибки регистрации.
По своей природе ошибки выборки могут быть тенденциозными и случайными, (исключая, ситуации когда будут отобраны лучшие или худшие единицы для выборочного обследования). Отбор конкретных единиц должен быть произведен не по усмотрению того лица, которое проводит обследование, а в случайном порядке.
Если принцип случайного отбора не соблюдается, то применить теоремы закона больших чисел нельзя, так как эти теоремы выведены для закономерностей, возникающих в случайном процессе.
Формулы средней ошибки выборки. При соблюдении принципа случайного отбора ошибка выборки определяется прежде всего численностью выборки. Чем больше численность выборки при прочих равных условиях, тем меньше величина ошибки выборки.
Ошибка выборки также определяется степенью варьирования изучаемого признака, а степень варьирования характеризуется в статистике средним квадратом отклонений - дисперсией: 2 или р(1—р) (для альтернативного признака).
У всех единиц совокупности одинаковое значение признака, то величина дисперсии будет равна 0. Не будет и ошибки выборки, так как любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.
Зависимость величины ошибки выборки от ее абсолютной численности и от степени варьирования признака находит выражение в формулах средней ошибки выборки. Она обозначается греческой буквой (мю). Есть две формулы средней ошибки выборки.
Когда выборочно измеряется среднее значение признака, формула средней ошибки выборки имеет такой вид:
где ( - средняя ошибка выборки;
2 - дисперсия варьирующего признака;
п - численность единиц выборочной совокупности.
Для измерения средней ошибки доли альтернативного признака применяют другую формулу, которая имеет вид
где р - доля признака в генеральной совокупности (например, если процент брака в продукции составляет от всей продукции 0,5 %, то р = 0,005); п - численность единиц выборочной совокупности.
1. Математическое доказательство этих формул исходит из схемы так называемой повторной выборки. Суть ее заключается в том, что общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу совокупности, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при отборе других единиц вновь попасть в выборку. Такая схема выборки называется схемой повторной выборки.
при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе выборки. Применительно к бесповторной выборке в приведенные ранее формулы средней ошибки выборки необходимо добавить дополнительный множитель в подкоренное выражение:
Следовательно, для бесповторной выборки формулы средней ошибки выборки примут такой вид:
Предположим, что производится 225 наблюдений в первом случае из генеральной совокупности в 4500 единиц и во втором — из генеральной совокупности в 225000 единиц. Пусть дисперсии в обоих случаях равны 25. Тогда в первом случае при 5 %-ном отборе ошибка выборки составит:
Во втором случае при 0,1 %-ном отборе ( 225 / 225000) она будет равна:
с определенной степенью вероятности мы можем утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины, которая называется предельной ошибкой выборки. Предельная ошибка выборки (она обозначается греческой буквой «дельта» — Д) связана со средней ошибкой следующим равенством:
Приводим краткую выдержку из таблицы значений интеграла вероятностей (табл. 9.1 - в таблице выделены t =1,96 с вероятностью 0,95, t = 2,58 с вероятностью 0.99 и t = 3,28 с вероятностью 0,999, которым на практике часто пользуются).
Таблица 9.1
Значение вероятности при разной величине коэффициента доверия (t)
t |
Вероятность |
t |
Вероятность |
t |
Вероятность |
1,0 |
0,6827 |
1,8 |
0,9281 |
2,5 |
0,9876 |
1,1 |
0,7287 |
1,9 |
0,9426 |
2,58 |
0,99 |
1,2 |
0,7699 |
1,96 |
0,95 |
2,6 |
0,9907 |
1,3 |
0,8064 |
2,0 |
0,9545 |
2,7 |
0,9931 |
1.4 |
0,8385 |
2,1 |
0,9643 |
2,8 |
0,9949 |
1.5 |
0,8664 |
2,2 |
0,9722 |
2,9 |
0,9963 |
1,6 |
0,8904 |
2,3 |
0,9786 |
3,0 |
0,9973 |
1,7 |
0,9109 |
2,4 |
0,9836 |
3.28 |
0,9990 |
Расчет необходимой численности выборки. Приведенные формулы для определения величины ошибки выборки дают возможность не только определять эти ошибки, но и рассчитывать предварительно, какую необходимо взять численность выборки, чтобы ошибка выборки не превышала определенных заданных размеров. В практике при проектировании выборочного наблюдения всегда определяют его численность.
Под точностью понимается допустимая ошибка выборки.
Если в формулу ввести коэффициент доверия, то она примет такой вид:
2. Способы формирования выборочных совокупностей. Нерайонированный и районированный отбор.
Таким отбором является собственно-случайным районированным отбором будет такой, когда единицы отбираются из отдельных частей (групп), на которые предварительно разбивается генеральная совокупность с полным их охватом. Примером районированного отбора является отбор предприятий по отраслям, студентов института — по отдельным курсам и факультетам.
Собственно-случайный отбор. Собственно-случайный отбор дает лотерея или жеребьевка.
Механический отбор. Однако на практике собственно-случайный отбор применить бывает сложно, и поэтому его используют очень редко. Обычно применяют механический отбор единиц выборочной совокупности, который организовать значительно легче. При механическом отборе 100 студентов из 1000 поступают так составляют алфавитный список, в который включают всех студентов, и определяют интервал, равный частному от деления численности генеральной совокупности на численность выборочной совокупности. В нашем примере интервал равен 10 (1000 : 100). Значит, по составленному в алфавитном порядке списку будем механически выбирать каждого десятого студента. Интервал при механическом отборе равен обратной величине относительного объема выборки: например, при 5 % -ной выборке интервал равен 20 (1:0,05), при 2 %-ной—50 (1:0,02) и т. д.
Типический отбор с механической выборкой. Часто имеют дело с неоднородными по изучаемым показателям совокупностями. В этом случае обычно прибегают к предварительному районированию генеральной совокупности, т. е. разбивают на группы (на отдельные типы) по признакам, от которых зависят изучаемые показатели. Внутри этих групп производится механический отбор единиц выборочной совокупности. Такой способ отбора называется типическим отбором с механической выборкой или механическим отбором с предварительным районированием. Типический отбор выгодно применять при большой дисперсии групповых средних, когда велика межгрупповая вариация.
Многоступенчатая выборка. Типический отбор часто сочетают с несколькими стадиями (ступенями) отбора. При этом каждая стадия имеет свою единицу отбора. Такая выборка называется многоступенчатой.
Многофазная выборка. Многофазная выборка отличается от многоступенчатой тем, что на всех ступенях выборки сохраняется одна и та же единица отбора.
Комбинирование выборочного наблюдения со сплошным. Сочетание выборочного обследования со сплошным характерно для многофазовой выборки, хотя она может быть организована и без такого комбинирования. Комбинирование выборочного наблюдения со сплошным интересно тем, что оно позволяет лучше проверить типичность выборочных данных, сопоставляя основные показатели по выборочным и массовым данным.
Серийная выборка. Для всех рассмотренных видов случайного отбора необходим отбор отдельных единиц выборочной совокупности, однако применяют и такие способы отбора, при которых в выборку попадают не отдельные единицы, а целые серии (гнезда). Такой способ отбора называется серийным. Например, при 10 %-ном выборочном обследовании качества продукции можно брать каждую десятую выпущенную единицу продукции, а можно организовать выборку так, что через каждые 9 часов в течение одного (десятого) часа вся выработанная в течение этого часа продукция будет подвергнута сплошному обследованию.
Моментные наблюдения. Особым видом выборочного наблюдения является моментное наблюдение, получившее в последнее время широкое распространение в промышленности и других отраслях народного хозяйства. Суть его состоит в том, что на определенные моменты времени фиксируется наличие отдельных элементов изучаемого процесса.
Малая выборка. Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 20.
(Самостоятельно).