Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 11.doc
Скачиваний:
23
Добавлен:
07.02.2016
Размер:
1.04 Mб
Скачать

26

Тема 11

Статистические оценки параметров генеральной совокупности. Статистические гипотезы.

Определение статистической оценки. Точечные статистические оценки: смещенные и несмещенные, эффективные и состоятельные. Интервальные статистические оценки. Точность и надежность оценки, определение доверительного интервала, построение доверительных интервалов для при известном и неизвестном . Определение статистической гипотезы. Нулевая и альтернативная, простая и сложная. Ошибки первого и второго рода. Статистический критерий, наблюдаемое значение критерия. Критическая область. Область принятия нулевой гипотезы, критическая точка. Общая методика построения правосторонней, левосторонней и двухсторонней критических областей. Эмпирические и теоретические частоты. Критерии согласия.

1. Определение статистической оценки. Точечные статистические оценки.

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение. Например, если наперед известно, что изучаемый признак распределен в генеральной совокупности по нормальному закону, то необходимо оценить математическое ожидание и среднеквадратическое отклонение, т. к. эти два параметра полностью определяют нормальное распределение. Если имеются основания считать, что признак имеет распределение Пуассона, то необходимо оценить параметр , которым это распределение определяется. Обычно имеются лишь данные выборки, полученные в результате наблюдений: , , ... , . Через эти данные и выражают оцениваемый параметр. Рассматривая , , ... , как значения независимых случайных величин , , ... , , можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения - это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра.

Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Статистическая оценка неизвестного параметра генеральной совокупности одним числом называется точечной. Ниже рассматриваются следующие точечные оценки: смещенные и несмещенные, эффективные и состоятельные.

Для того, чтобы статистические оценки давали хорошие приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Укажем эти требования. Пусть есть статистическая оценка неизвестного параметра теоретического распределения. Допустим, что по выборке объема найдена оценка . Повторим опыт, т. е. извлечем их генеральной совокупности другую выборку того же объема и по ее данным найдем оценку и т. д. Получим числа , , ... , , которые будут различны между собой. Таким образом, оценку можно рассматривать как случайную величину, а числа , , ... , - как ее возможные значения.

Если оценка дает приближенное значение с избытком, тогда найденное по данным выборок число () будет больше истинного значения . Следовательно, и математическое ожидание (среднее значение) случайной величины будет больше, чем , т. е. . Если дает приближенное значение с недостатком, то .

Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим ошибкам. Поэтому нужно потребовать, чтобы математическое ожидание оценки было равно оцениваемому параметру. Соблюдение требования устраняет систематические ошибки.

Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру , т. е. .

Смещенной называют статистическую оценку , математическое ожидание которой не равно оцениваемому параметру.

Однако ошибочно считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения могут быть сильно рассеяны вокруг своего среднего значения, т. е. дисперсия величины может быть значительной. В этом случае найденная по данным одной выборки оценка, например, , может оказаться весьма удаленной от своего среднего значения , а значит, и от самого оцениваемого параметра . Приняв в качестве приближенного значения , мы допустили бы большую ошибку. Если потребовать, чтобы дисперсия величины была малой, то возможность допустить большую ошибку будет исключена. Поэтому к статистической оценке предъявляются требования эффективности.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки ) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.

Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при стремится к нулю, то такая оценка оказывается и состоятельной.

Рассмотрим вопрос о том, какие выборочные характеристики лучше всего в смысле несмещенности, эффективности и состоятельности оценивают генеральную стреднюю и дисперсию.

Пусть изучается дискретная генеральная совокупность относительно количественного признака. Генеральной средней называется среднее арифметическое значений признака генеральной совокупности. Она может быть вычислена по формулам или , где - значения признака генеральной совокупности объема , - соответствующие частоты, причем .

Пусть из генеральной совокупности в результате независимых наблюдений над количественным признаком извлечена выборка объема со значениями признака . Выборочной средней называют среднее арифметическое выборочной совокупности. Она может быть вычислена по формулам или , где - значения признака в выброчной совокупности объема , - соответствующие частоты, причем .

Если генеральная средняя неизвестна и требуется оценить ее по данным выборки, то в качестве оценки генеральной средней принимают выборочную среднюю, которая является несмещенной и состоятельной оценкой. Отсюда следует, что если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой. В этом состоит свойство устойчивости выборочных средних.

Заметим, что если дисперсии двух совокупностей одинаковы, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности. Она зависит от объема выборки: чем объем выборки больше, тем меньше выборочная средняя отличается от генеральной.

Для того, чтобы охарактеризовать рассеяние значений количественного признака генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику - генеральную дисперсию. Генеральной дисперсией называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения , которая вычисляется по формулам: , или .

Для того, чтобы охарактеризовать рассеяние наблюденных значений количественного признака выборки вокруг своего среднего значения , вводят сводную характеристику - выброрчную дисперсию. Выборочной дисперсией называют среднее арифметическое квадратов отклонений наблюденных значений признака от их среднего значения , которая вычисляется по формулам: , или .

Кроме дисперсии , для характеристики рассеяния значений признака генеральной (выборочной) совокупности вокруг своего среднего значения пользуются сводной характеристикой - средним квадратическим отклонением. Генеральным средним квадратическим отклонением называют квадратный корень из генеральной дисперсии:. Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии:

Пусть из генеральной совокупности в результате независимых наблюдений над количественным признаком извлечена выборка объема . Требуется по данным выборки оценить неизвестную генеральную дисперсию . Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что выборочная дисперсия является смещенной оценкой ; другими словами, математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно .

Легко исправить выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Достаточно для этого умножить на дробь . В результате получим исправленную дисперсию, которую обычно обозначают через . Исправленная дисперсия будет несмещенной оценкой генеральной дисперсии: .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]