- •Содержание
- •Введение
- •1. Предмет и метод статистики
- •2. Статистические наблюдения
- •2.1. Понятие о статистической информации
- •2.2. Основные организационные формы статистического наблюдения.
- •2.3. Ошибки статистического наблюдения
- •3. Сводка и группровка статистических данных
- •4. Выборочное наблюдение
- •5. Способы наглядного представления статистических данных
- •5. 2. Статистические графики
- •6. Абсолютные и относителбные величины в статистике
- •6.1. Статистические показатели, их виды
- •6. 3. Относительные величины
- •7. Средние величины
- •8. Мода, медиана, квартили
- •8.2. Медиана
- •8.3.Квартили
- •9. Ряды динамики и ряды распределения
- •9. 1. Ряды динамики
- •9.2. Приемы обработки и анализа рядов динамики
- •9.3. Выявление сезонных колебаний
- •10. Средние характеристики рядов динамики
- •11. Показатели вариации
- •11.1. Абсолютные показатели вариации
- •11.2. Относительные показатели вариации
- •12. Индексы
- •12.1. Понятие об индексах
- •12. 2. Агрегатные индексы физического объёма, цен и себестоимости
- •12.4. Базисные и цепные индексы, их взаимосвязь
- •12.5. Индексы средних величин
- •13. Статистическое изучение связей между явлениями
- •13.1.Типы связей между явлениями, их характеристика
- •13.3. Измерение степени тесноты корреляционной связи между двумя признаками
- •13.4. Уравнения регрессии, их виды
- •13.5. Корреляционно-регрессивные модели (крм),
- •Земцова Елена михайловна теория статистики Учебное пособие
- •454001 Челябинск, ул. Братьев Кашириных, 129
4. Выборочное наблюдение
Понятие о выборочном наблюдении
Выборочное наблюдение представляет собой один из наиболее широко применяемых видов сплошного наблюдения.
Выборочное наблюдение – это метод статистического исследования, при котором характеристика всей совокупности фактов (генеральной совокупности) дается по некоторой ее части (выборочной совокупности) (см. рис.4 )
В последние годы выборочное наблюдение широко применяется в работе органов статистики, так как это позволяет:
– сэкономить затраты средств и труда на обработку информации;
– сократить ошибки регистрации на этапе сбора данных;
– повысить оперативность получения сведений.
В отличие от других методов несплошного наблюдения (монографического наблюдения, метода основного массива) выборочное наблюдения имеет важную особенность – возможность попадания в выборочную совокупность равна для всех единиц генеральной совокупности.
Это предупреждает появление тенденциозных ошибок при формировании выборки.
Виды выборочного наблюдения
Рис. 9. Классификация выборочного наблюдения
В зависимости от способа отбора единиц различают:
– повторную выборку – после отбора, какой-то единицы, она снова возвращается в совокупность и может быть снова набрана, т.е. вероятность попадания каждой отдельной единицы в выборочную совокупность остается постоянной;
– бесповторную выборку – отобранная единица не возвращается обратно и возможность попадания у оставшихся единиц в выборочную совокупность постоянно возрастает.
По форме организации способа отбора выборочное наблюдение может быть:
– случайным – случайный отбор;
– механическим – отбор единиц в выборочную совокупность из генеральной производится через равные интервалы (группы);
– типическим – в выборочной совокупности более равномерно представлены различные типы (части) генеральной совокупности;
– серийным – отбираются серии единиц, которые подвергаются сплошному исследованию;
– комбинированным – комбинация нескольких форм организации выборочного наблюдения.
Ошибки выборочного наблюдения
Между характеристиками выборочной и генеральной совокупности, как правило, существует расхождение, которое называется ошибкой.
Ошибки выборочного наблюдения могут быть двух видов:
– ошибки регистрации – свойственны любому наблюдению, вызваны несовершенством измерительных приборов, недостаточной квалификацией работников и т.п.;
– ошибки репрезентативности (представительности) присущи только несплошным наблюдениям, возникают из-за того, что выборочная совокупность не точно характеризует генеральную.
Ошибка выборки зависит от следующих факторов:
– степени вариации изучаемого признака;
– численности выборки;
– метода отбора единиц в выборочную совокупность;
– принятого уровня достоверности результатов исследования.
В математической статистике доказывается, что значение средней ошибки повторной выборки равно:
1. средняя
2. среднее квадратическое отклонение выборочное или генеральное
где µ − ошибка выборки; δ2 − дисперсия (средний квадрат отклонений); n − объем выборки (число обследованных единиц).
При бесповторном отборе формула средней ошибки выборки принимает вид:
,
где N – объем генеральной совокупности.
Предельная ошибка выборки , гдеt – коэффициент доверия. Определяется по справочным таблицам в зависимости от уровня вероятности.
В целом ряде случаев средние и относительные величины для какой-либо совокупности рассчитываются на основе данных выборочного наблюдения, суть которого заключается в том, что из генеральной совокупности, наудачу, чисто случайно, отбирается n единиц, составляющих выборочную совокупность; для отобранных единиц рассчитываются обобщенные характеристики (средние или относительные показатели), а затем результаты выборочного обследования распространяются на всю генеральную совокупность. Основной задачей при этом является определение ошибок выборки, т.е. возможных расхождений между выборочной средней () и генеральной () или выборочной долей единиц (w), обладающих изучаемым признаком, и генеральной долей (p).
Различают среднюю и предельную ошибки выборки.
Средняя ошибка выборки (µ) характеризует среднюю величину возможных расхождений выборочной и генеральной средней (или доли) и представляет собой по форме и содержанию среднее квадратическое отклонение возможных значений выборочной средней от генеральной.
В математической статистике доказывается, что - дисперсия возможных значений выборочной средней – вn раз меньше дисперсии изучаемого признака и генеральной совокупности, т.е. .
Исходя из этого средняя ошибка выборочной средней при повторном отборе определяется по формуле:
,
где - дисперсия изучаемого показателя в генеральной совокупности (т.к. дисперсия изучаемого показателя в генеральной совокупности неизвестна, то фактически в формулу подставляется дисперсия выборочная, которая при большом числе наблюдений близка к генеральной), аn – объем (численность) выборки.
Как видно из формулы, средняя ошибка выборки (µ) при повторном отборе зависит от показателя вариации () и от объема выборки (n).
Средняя ошибка выборочной доли определяется по формуле:
,
где w – выборочная доля единиц, обладающих изучаемым признаком, а w(1 − w) – дисперсия доли (альтернативного признака).
При бесповторном отборе в формулах под знаком радикала появляется множитель ,
где N –численность генеральной совокупности.
Говоря об ошибках выборки, следует иметь в виду, что в каждой конкретной выборке разность может быть меньше, больше или равнаµ. И вероятность каждой такой ошибки различна.
Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки.
Предельная ошибка выборки, обозначаемая через , рассчитывается как
,
где µ − средняя ошибка выборки, t – коэффициент доверия.
При бесповторной выборке формула ошибки выборки имеет вид:
,
где δ2 – межсерийная дисперсия; s – число отобранных серий;S – число серий в генеральной совокупности.
Все рассмотренные выше формулы используются при так называемой большой выборке.
Если n < 20 (у некоторых авторов n <30), то выборка именуется малой и при расчете ошибок выборки необходимо учитывать следующие моменты. Во-первых, в формуле средней ошибки в знаменателе принимается n – 1, т.е.
.
И, во-вторых, при нахождении вероятности допуска той или иной ошибки или определении доверительных интервалов исследуемого показателя в генеральной совокупности пользуются таблицами вероятность Стьюдента, где определяется в зависимости от объема выборки иt.
Формулы предельной ошибки выборки позволяют решить следующие три задачи:
1. Определить доверительные пределы.
для генеральной средней:
;
для доли:
.
2. Определить вероятность допуска той или иной заданной ошибки .
В этом случае определяется и по таблице (приn>20) находится вероятность (P).
3. Определить необходимую численность выборки (n), обеспечивающую с определенной вероятностью заданную точность ().
Формулы для n определяются из соответствующих формул предельной ошибки.
Так, для определения средней () из формулыприповторном отборе имеем:
,
Для доли аналогично из получаем:
.
При бесповторном отборе из иимеем:
−для средней ();
−для доля (w).
Как видно, в формулах для определения необходимой численности выборки, получаемых из формул случайной ошибки выборки, предполагается обязательное знание величины дисперсии признака () или [w (1 – w)].
Обычно в этих формулах используется значение дисперсии признака в аналогичных предшествующих исследованиях или же проводится пробное обследование небольшого числа единиц, для которых определяется значение . В случае изучения доли определенных единиц в совокупности при отсутствии каких-либо сведений о дисперсии принимается максимальное значение [w (1 – w)], равное 0,25.
Рассмотрим решение некоторых задач к этой теме с применением формул предельной ошибки выборки.
Задача 1.
Методом собственно случайной выборки обследована жирность молока у 100 коров. По данным выборки средняя жирность молока оказалась равной 3,64%, а дисперсия составила 2,56.
Определить: а) среднюю ошибку выборки; б) с вероятностью, равной 0,954, предельные значения генеральной средней.
Решение:
A. Формула средней ошибки выборки: .
По условию n = 100, =2,56. Отсюда
Б. Формула предельной ошибки выборки: .
По таблице значений F(t) при P = 0,954 находим, что t = 2. Отсюда , или, т.е. предельные значения жирности молока (или доверительный интервал генеральной средней) определяются как.
Задача 2.
На основе выборочного обследования 600 рабочих (n = 600) одной из отраслей промышленности установлено, что удельный вес численности женщин составил 0,4 (w = 0,4).
С какой вероятностью можно утверждать, что при определении доли женщин, занятых в отрасли, допущена ошибка (), не превышающая 5% (0,05)?
Решение:
Чтобы определить вероятность допуска той или иной ошибки, из формулы находим показательt, связанный с вероятностью:
По таблице значений F(t) для t=2,5 находим, что P=0,988, т.е. с вероятностью 0,988 можно утверждать, что при определении доли женщин (0,4) в общем числе рабочих допущена ошибка не более 0,05 (5%).
Задача 3.
Сколько рабочих завода нужно обследовать в порядке случайной выборки для определения средней заработной платы, чтобы с вероятностью (P),равной 0,954, можно было бы гарантировать ошибку не более 50 руб.? Предполагаемое среднее квадратическое отклонение заработной платы =200 руб.
Решение.
Из формулы находимn:
(человека).
Контрольные вопросы к теме:
1. Дайте определение выборочного наблюдения. Для чего в экономике применяют выборочное наблюдение.
2. Перечислите и охарактеризуйте виды выборочного наблюдения.
3. Расскажите об ошибках выборочного наблюдения, от каких факторов они зависят.
4. Расскажите о предельной ошибке выборки, какие задачи позволяют решить формулы предельной ошибки выборки.