Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уфимский Государственный Авиационный Технический Университет

Предмет:

Статистика

Файл:

Чалиев А.А. Конспект лекций с методическими указаниями и контрольными заданиями / Statistics-do2006.doc

Скачиваний:

Добавлен:

02.05.2014

Размер:

1.42 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 2211 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

3.2. Средняя ошибка выборки

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая , а во втором — выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р .

Разности — и W — р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Величина ошибки выборки зависит от структуры последней. Например, если при определении среднего балла успеваемости студентов факультета в одну выборку включить больше отличников, а в другую - больше неудачников, то выборочные средние баллы и ошибки выборки будут разными.

Поэтому в статистике определяется средняя ошибка повторной и бесповторной выборки в виде ее удельного среднего квадратического отклонения по формулам

= - повторная; (1.35)

= - бесповторная; (1.36)

где Дв — выборочная дисперсия, определяемая при количественном признаке статистических величин по обычным формулам из гл.2.

При альтернативном или атрибутивном признаке выборочная дисперсия определяется по формуле

Дв = w(1-w). (1.37)

Из формул (1.35) и (1.36) видно, что средняя ошибка меньше у бесповторной выборки, что и обусловливает ее более широкое применение.

3.3. Предельная ошибка выборки

Учитывая, что на основе выборочного обследования нельзя точно оценить изучаемый параметр (например, среднее значение) генеральной совокупности, необходимо найти пределы, в которых он находится. В конкретной выборке разностьможет быть больше, меньше или равна. Каждое из отклоненийотимеет определенную вероятность. При выборочном обследовании реальное значениев генеральной совокупности неизвестно. Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (в данном случае среднее значение) в генеральной совокупности. Отклонение выборочной характеристики от генеральной называетсяпредельной ошибкой выборки .Она определяется в долях средней ошибки с заданной вероятностью, т.е.

= t, (1.38)

где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме П. Л. Чебышёва, при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:

при.

А. М. Ляпунов доказал, что независимо от характера распределения генеральной совокупности при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению. Это так называемая центральная предельная теорема. Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция отt с помощью интеграла вероятностей Лапласа:

где – нормированное отклонение выборочной средней от генеральной средней.

Значения интеграла Лапласа для разных tрассчитаны иимеются в специальных таблицах, из которых в статистике широко применяется сочетание:

Вероятность	0,683	0,866	0,950	0,954	0,988	0,990	0,997	0,999
t	1	1,5	1,96	2	2,5	2,58	3	3,5

Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения t и определяют предельную ошибку выборки по формуле (1.38)

При этом чаще всего применяют = 0,95 и t = 1,96, т.е. считают, что с вероятностью 95% предельная ошибка выборки вдвое больше средней. Поэтому в статистике величина t иногда именуется коэффициентом кратности предельной ошибки относительно средней.

После исчисления предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности. Такой интервал для генеральной средней величины имеет вид

(-) (+), (1.39)

а для генеральной доли аналогично

(w-)p(w +). (1.40)

Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики генеральной совокупности, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 2211 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

Соседние файлы в папке Чалиев А.А. Конспект лекций с методическими указаниями и контрольными заданиями

#
02.05.20141.42 Mб56Statistics-do2006.doc
#
02.05.20141.54 Кб21_info.txt