
- •Элементы математической статистики
- •§1. Основные сведения из математической статистики
- •§2. Статистическое распределение выборки. Полигон и гистограмма
- •§3. Статистические оценки параметров распределения
- •§4. Оценка генеральной дисперсии по исправленной выборочной
- •§5. Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
- •§6. Методы расчёта сводных характеристик выборки Условные варианты
- •Начальные и центральные теоретические моменты
- •Обычные, начальные и центральные эмпирические моменты
- •Условные эмпирические моменты
- •§7. Метод произведений для вычисления выборочных средней и дисперсии
- •Сведение первоначальных вариант к равноотстоящим
- •§8. Оценка отклонения теоретического и эмпирического распределений от нормального. Асимметрия и эксцесс
§4. Оценка генеральной дисперсии по исправленной выборочной
Пусть из генеральной совокупности в результате независимых наблюдений над количественным признаком извлечена повторная выборка объёма :
…
…
Требуется по данным выборки оценить неизвестную генеральную дисперсию . Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что выборочная дисперсия является смещённой оценкой , другими словами, математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно
.
Легко «исправить»
выборочную дисперсию так, чтобы её
математическое ожидание было равно
генеральной дисперсии. Достаточно для
этого умножить
на дробь
,
после чего получим исправленную
дисперсию, которую обозначают через
:
Исправленная дисперсия является, конечно, несмещённой оценкой генеральной дисперсии, а именно:
.
Итак, в качестве оценки генеральной дисперсии принимают исправленную дисперсию
§5. Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
Точечной называется оценка, которая определяется одним числом. Все оценки, рассмотренные выше, – точечные. При выборке малого объёма точечная оценка может значительно отличаться от оцениваемого параметра. По этой причине при небольшом объёме выборки следует пользоваться интервальными оценками.
Интервальной
называется
оценка, которая определяется двумя
числами - концами интервала. Пусть
найденная по данным выборки статистическая
характеристика
служит оценкой неизвестного параметра
и будем считать
.
Очевидно,
тем точнее определяет
,
чем меньше абсолютная величина разности
.
Другими словами, если
и
,
то чем меньше
,
тем точнее оценка. Таким образом,
положительное число
характеризует точность
оценки.
Однако статистические
методы не позволяют категорически
утверждать, что оценка
удовлетворяет неравенству
.
Можно лишь говорить о вероятности
,
с которой это неравенство осуществляется.
Надёжностью
(доверительной
вероятностью) оценки
по
называется вероятность
,
с которой осуществляется неравенство
,
т.е.
Обычно надёжность оценки задаётся наперёд, причём в качестве берут число, близкое к единице: 0,95; 0,99; 0,999.
Пусть
.
Откуда
.
Это соотношение означает, что вероятность
того, что интервал
заключает в себе неизвестный параметр
,
равна
.
Доверительным интервалом называется интервал , который покрывает неизвестный параметр с заданной надёжностью .
Основной задачей применения выборочного метода является определение по данным выборочного обследования признаков, характеризующих генеральную совокупность. В частности, выборочное наблюдение проводится для определения границ, в которых должна находиться генеральная средняя, а также для определения по данным о выборочной доле границ, в которых должна находиться генеральная доля. Такая постановка вопросов требует применения теоремы Лапласа в виде
(|
-
|<δ)
,
где
- генеральная средняя,
- выборочная средняя,
- средняя квадратическая ошибка выборки.
При решении всех таких вопросов требуется применение величины , выражающей среднюю ошибку репрезентативности. Значения этой ошибки определяется по четырём формулам:
- для случайной повторной выборки при определении средней признака
где
обозначает дисперсию средней (
)
в выборке, причём генеральная дисперсия
заменяется
дисперсией случайной величины в выборке
(поскольку генеральная дисперсия
неизвестна);
- для случайной повторной выборки при определении доли признака
где
обозначает доли данного и противоположного
признака в выборке;
- для случайной бесповторной выборки при определении средней
где
обозначает необследованную часть
генеральной совокупности;
- для случайной бесповторной выборки при определении доли
Пример 2.
Из партии, содержащей 8000 деталей, было
проверено 1000 деталей. Среди них оказалось
4% нестандартных. Определить вероятность
того, что доля нестандартных деталей
во всей партии, отличается от их доли в
выборке (
не более чем на 0,015 , если выборка: а)
повторная, б) бесповторная.