Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая статистика. Лекция 1,2 Хаджи А.А...doc
Скачиваний:
18
Добавлен:
02.09.2019
Размер:
2.86 Mб
Скачать

§4. Оценка генеральной дисперсии по исправленной выборочной

Пусть из генеральной совокупности в результате независимых наблюдений над количественным признаком извлечена повторная выборка объёма :

Требуется по данным выборки оценить неизвестную генеральную дисперсию . Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что выборочная дисперсия является смещённой оценкой , другими словами, математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно

.

Легко «исправить» выборочную дисперсию так, чтобы её математическое ожидание было равно генеральной дисперсии. Достаточно для этого умножить на дробь , после чего получим исправленную дисперсию, которую обозначают через :

Исправленная дисперсия является, конечно, несмещённой оценкой генеральной дисперсии, а именно:

.

Итак, в качестве оценки генеральной дисперсии принимают исправленную дисперсию

§5. Точность оценки, доверительная вероятность (надёжность). Доверительный интервал

Точечной называется оценка, которая определяется одним числом. Все оценки, рассмотренные выше, – точечные. При выборке малого объёма точечная оценка может значительно отличаться от оцениваемого параметра. По этой причине при небольшом объёме выборки следует пользоваться интервальными оценками.

Интервальной называется оценка, которая определяется двумя числами - концами интервала. Пусть найденная по данным выборки статистическая характеристика служит оценкой неизвестного параметра и будем считать . Очевидно, тем точнее определяет , чем меньше абсолютная величина разности . Другими словами, если и , то чем меньше , тем точнее оценка. Таким образом, положительное число характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству . Можно лишь говорить о вероятности , с которой это неравенство осуществляется.

Надёжностью (доверительной вероятностью) оценки по называется вероятность , с которой осуществляется неравенство , т.е.

Обычно надёжность оценки задаётся наперёд, причём в качестве берут число, близкое к единице: 0,95; 0,99; 0,999.

Пусть . Откуда . Это соотношение означает, что вероятность того, что интервал заключает в себе неизвестный параметр , равна .

Доверительным интервалом называется интервал , который покрывает неизвестный параметр с заданной надёжностью .

Основной задачей применения выборочного метода является определение по данным выборочного обследования признаков, характеризующих генеральную совокупность. В частности, выборочное наблюдение проводится для определения границ, в которых должна находиться генеральная средняя, а также для определения по данным о выборочной доле границ, в которых должна находиться генеральная доля. Такая постановка вопросов требует применения теоремы Лапласа в виде

(| - |<δ) ,

где - генеральная средняя, - выборочная средняя, - средняя квадратическая ошибка выборки.

При решении всех таких вопросов требуется применение величины , выражающей среднюю ошибку репрезентативности. Значения этой ошибки определяется по четырём формулам:

- для случайной повторной выборки при определении средней признака

где обозначает дисперсию средней ( ) в выборке, причём генеральная дисперсия заменяется дисперсией случайной величины в выборке (поскольку генеральная дисперсия неизвестна);

- для случайной повторной выборки при определении доли признака

где обозначает доли данного и противоположного признака в выборке;

- для случайной бесповторной выборки при определении средней

где обозначает необследованную часть генеральной совокупности;

- для случайной бесповторной выборки при определении доли

Пример 2. Из партии, содержащей 8000 деталей, было проверено 1000 деталей. Среди них оказалось 4% нестандартных. Определить вероятность того, что доля нестандартных деталей во всей партии, отличается от их доли в выборке ( не более чем на 0,015 , если выборка: а) повторная, б) бесповторная.