Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема-6_с-54-66.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
238.59 Кб
Скачать

6.3. Ошибки выборочного наблюдения

При проведении выборочного наблюдения и оценки параметров генеральной совокупности по выборочным данным возникают ошибки двух видов: ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации – ошибки, связанные с процессом сбора данных.

Ошибки репрезентативности – ошибки, связанные с тем, что оценки параметров всей совокупности единиц выполняются на основе частичных, а не полных данных.

Ошибку регистрации практически невозможно измерить. Для того чтобы снизить влияние ошибок регистрации на точность оценок, необходимо свести к минимуму возможность этих ошибок за счет серьезной и продуманной подготовки наблюдения. Ошибка репрезентативности в выборочной совокупности, сформированной случайным образом, является случайной величиной и поддается оценке инструментами теории вероятностей.

Рассмотрим сущность и методы оценки ошибки репрезентативности на следующем примере.

Пример. В табл. 6.2 представлены результаты сдачи экзамена 2000 студентами, из которых случайным отбором сформированы две выборочные совокупности по 400 человек. Рассчитаем среднюю оценку на экзамене (показатель средней величины) и среднюю долю студентов, сдавших экзамен на «4» и «5» (показатель доли), в генеральной и выборочных совокупностях.

Таблица 6.2

Результаты экзамена

Оценка

Число студентов

Генеральная

совокупность

I выборочная

совокупность

II выборочная

совокупность

2

50

8

6

3

750

155

136

4

1000

200

210

5

200

37

48

Итого

2000

400

400

  1. Расчет средней оценки:

– по генеральной совокупности

– по выборочным совокупностям

  1. Расчет ошибки выборочных оценок:

  1. Расчет доли студентов, сдавших экзамен на «4» и «5»:

– по генеральной совокупности

– по выборочным совокупностям

  1. Расчет ошибки выборочных оценок:

Как видно из примера, выборочная средняя и выборочная доля являются переменными величинами и зависят от того, какие единицы совокупности попали в выборку.

Русский математик А.М. Ляпунов доказал, что распределение выборочных средних значений признака (а следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений стремится к нормальному закону. При этом средняя ошибка выборочных оценок среднего значения признака может быть рассчитана по формуле

Значение генеральной дисперсии при проведении выборочных исследований, как правило, неизвестно. Поэтому для расчета используют оценку генеральной дисперсии:

– если объем выборки n больше или равен100:

– если объем выборки n меньше 100:

Ошибка конкретной выборки может существенно отличаться от средней ошибки. Но модуль отношения индивидуальной ошибки к средней ошибке практически не превышает 3, если n > 100 (согласно нормальному закону распределения). Это отношение называют нормированным отклонением (t):

Распределение t при n является нормальным и определяется уравнением Лапласа–Гаусса:

а определенный интеграл плотности вероятности распределения в пределах (–t;

+t) определяет вероятность попадания t в данный интервал.

Таким образом, благодаря русскому математику Александру Михайловичу Ляпунову, немецкому ученому Карлу Фридриху Гауссу и французскому – Пьеру Симону Лапласу современные исследователи имеют возможность определить, насколько может с заданной степенью вероятности отклоняться рассчитанная по выборочным данным характеристика от ее реального значения в генеральной совокупности. Именно такая возможность придает практическую ценность любому выборочному наблюдению.

Максимальную величину отклонения среднего значения признака по выборке от среднего значения признака по генеральной совокупности с определенной степенью вероятности называют предельной ошибкой выборочной оценки, а соответствующую вероятность – доверительной вероятностью.

Рассчитать точные значения параметров генеральной совокупности невозможно, поскольку оценка выполняется по неполному множеству единиц. Но для каждой величины возможно определить интервал, в который с заданной доверительной вероятностью попадает значение этой величины. Границы интервала (доверительного интервала) определяются с учетом предельной ошибки.

Таким образом, средняя генеральная характеристика по какому-либо признаку (например, средний доход или средний возраст покупателей, средний вес или средний размер изготовленных деталей) может быть определена с учетом предельной ошибки средней величины:

,

где – среднее значение признака по выборке; – предельная ошибка репрезентативности для средней величины; – среднее значение признака по генеральной совокупности.

Предельная ошибка средней величины рассчитывается по формуле

,

где t – коэффициент доверия; – дисперсия признака в генеральной совокупности; N – размер генеральной совокупности; n – размер выборочной совокупности;

(Nn)/(N – 1) – коэффициент корректировки на бесповторность (при повторной выборке данный коэффициент равен 1).

Коэффициент доверия выбирается по таблице «Значения интеграла вероятностей для нормального распределения» (приложение 1) по заданному значению доверительной вероятности F(t). При отсутствии в таблице точного значения доверительной вероятности коэффициент доверия выбирается по ближайшему большему значению (чтобы гарантировать требуемую надежность оценки) или на основе интерполяции. Значение генеральной дисперсии принимается равной выборочной дисперсии при n > 100, при n < 100 значение выборочной дисперсии корректируется умножением на n/(n – 1).

Объемные показатели (например, емкость рынка по какому-либо товару в натуральном выражении или объем денежных средств, которые покупатели готовы потратить на этот товар) определяются умножением генеральной средней величины (с учетом ошибки оценки) на количество единиц в генеральной совокупности.

Пример. Для определения скорости расчетов с кредиторами предприятий одной корпорации была проведена случайная выборка 50 платежных документов, по которым средний срок перечисления и получения денег составил 28,2 дня со средним квадратическим отклонением 5,4 дня. Определить средний срок прохождения всех платежей в течение данного года с доверительной вероятностью 0,95.

Решение. Для того чтобы лучше сориентироваться в применении расчетных формул, рекомендуется записать исходные данные в системе принятых обозначений:

n = 50; = 28,2; S = 5,4; F(t) = 0,95; = ?

  1. По таблице (приложение 1) выбираем значение t, соответствующее вероятности F(t) = 0,95: t = 1,96.

  2. Корректируем значение выборочной дисперсии, учитывая, что n < 100 (n = 50):

  1. Рассчитываем предельную ошибку:

  1. Рассчитываем доверительный интервал:

Ответ: с вероятностью 0,95 можно утверждать, что средняя продолжительность расчетов предприятий данного треста с кредиторами не менее 26,7 и не более 29,7 дня.

Структурные параметры генеральной совокупности (доли единиц генеральной совокупности, обладающих каким-либо признаком или удовлетворяющих какому-либо условию, например, доля покупателей, имеющих автомобиль, или доля покупателей с доходом ниже прожиточного минимума) определяется с учетом предельной ошибки доли:

,

где p – показатель доли в выборочной совокупности; – предельная ошибка доли;  – показатель доли в генеральной совокупности.

Предельная ошибка доли рассчитывается по формуле

,

где при ; при n < 100; обозначения t, N, n, приведены на с. 61.

Пример. По данным выборочного наблюдения 100 платежных документов предприятий корпорации оказалось, что в 6 случаях сроки расчетов с кредиторами не были выполнены. С вероятностью 0,954 установить доверительный интервал доли платежных документов без нарушения сроков для корпорации в целом.

Решение. Введем обозначения: n = 100; p = (100–6)/100 = 0,94 (доля документов без нарушения сроков); F(t) = 0,954; = ?

1. По таблице (приложение 1) выбираем значение t, соответствующее вероятности F(t) = 0,954: t = 2,00.

2. Рассчитываем значение выборочной дисперсии ( , так как n = 100):

3. Рассчитываем предельную ошибку:

4. Рассчитываем доверительный интервал:

Ответ: с вероятностью 0,954 можно утверждать, что доля платежей, выполненных в срок, находится в интервале

Точность оценок генеральных параметров зависит от вида выборочного наблюдения. В табл. 6.3 представлены формулы для расчета предельных ошибок выборочных оценок для разных видов наблюдений.

Таблица 6.3

Формулы предельной ошибки средней и ошибки доли по видам выборки

Вид выборки

Средняя ошибка оценки

показателя средней

показателя доли

Повторная –

отбор единицами

Бесповторная –

отбор единицами

Серийная

(нерайонированная)

Районированная –

отбор единицами – бесповторная

Районированная –

отбор сериями –

бесповторная