Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория вероятности-математика..doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
3.26 Mб
Скачать

§ 4. Статистическое оценивание числовых характеристик случайной величины и ее закона распределения

В связи с тем, что состав выборки может быть различным, выводы, сделанные относительно генеральной совокупности по выборочным значениям могут быть различными, а иногда и ложными. Решение этой проблемы приводит к рассмотрению критериев согласия, анализ которых позволяет сделать вывод:

  • имеющиеся опытные данные и избранный вид теоретического распределения не противоречат друг другу,

  • избранное распределение в качестве предполагаемого теоретического для исследуемого признака отклоняется.

Статистической оценкой неизвестного параметра генеральной совокупности называется любая функция вариант выборки, которая дает представление о значении неизвестного параметра. Основной задачей статистического оценивания является получение значений неизвестных параметров на основе выборки из генеральной совокупности. Так, например, если случайная величина распределена по нормальному закону, то по выборке необходимо оценить математическое ожидание и среднеквадратическое отклонение.

Выборочная характеристика, используемая в качестве приближенного значения неизвестной генеральной характеристики, называется ее точечной статистической оценкой. Она определяется одним числом. Ранее были рассмотрены выборочные среднее и дисперсия , которые интерпретировались как приближенные значения неизвестных математического ожидания и дисперсии изучаемой случайной величины , т.е. являлись точечными оценками этих неизвестных характеристик.

Обозначим через некоторый неизвестный параметр генеральной совокупности, а через – точечную оценку этого параметра. Оценка есть функция от независимых элементов генеральной совокупности, где – объем выборки. Поэтому оценка , как функция случайных величин, также является случайной и свойства можно исследовать с использованием понятий теории вероятностей.

В общем случае точечная оценка не связана с оцениваемым параметром . Поэтому естественно потребовать, чтобы была близка к . Это требование формируется в терминах несмещенности, состоятельности и эффективности.

Статистическая оценка неизвестного параметра называется несмещенной, если математическое ожидание равно самому параметру:

.

Статистическая оценка неизвестного параметра называется эффективной, если она имеет минимальную дисперсию среди остальных оценок параметра .

Статистическая оценка называется состоятельной, если для нее соблюдается условие:

для любого .

Это означает, что чем больше число наблюдений , тем больше уверенность (вероятность стремится к 1) в незначительном отклонении от неизвестного параметра . Очевидно, что «хорошая оценка» должна быть состоятельной, иначе эта оценка не имеет практического смысла, так как увеличение объема исходной информации не будет приближать оценку к «истинному» значению .

Теорема. Выборочное среднее есть состоятельная и несмещенная оценка генеральной средней .

Теорема. Выборочное среднее является эффективной несмещенной оценкой для , если случайная величина имеет нормальное распределение , где – математическое ожидание, – дисперсия случайной величины .

Теорема. Выборочная дисперсия является состоятельной, но смещенной оценкой генеральной дисперсии .

Таким образом, если в качестве оценки генеральной дисперсии принимать выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам. В результате значение генеральной дисперсии будет занижаться. Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Для этого достаточно умножить на дробь п/(п-1). Сделав это, получим «исправленную» дисперсию, которую обычно обозначают через :

.

Теорема. Исправленная дисперсия является состоятельной и несмещенной оценкой для генеральной дисперсии .

Замечание: На практике пользуются исправленной дисперсией, если п<30.

Теорема. Относительная частота появления события в испытаниях является состоятельной оценкой вероятности .

Одним из первых приемов оценивания параметров является метод моментов, разработанный Пирсоном. На практике этот метод сравнительно прост в вычислениях, но иногда приводит к малоэффективным оценкам.

Исследуя свойства оценок, получаемых с помощью метода моментов, английский математик Р. Фишер предложил более надежный метод оценивания параметров распределения по данным выборки случайной величины X — метод максимального правдоподобия. Метод максимального правдоподобия приводит к более сложным вычислениям, но оценки, получаемые с его помощью, как правило, оказываются более надежными. Этот метод наиболее полно использует данные выборки об оцениваемом параметре, поэтому он особенно эффективен в случае малых выборок.

Пусть X —случайная величина, которая в результате n испытаний приняла значения х1,x2, , хn c распределением, зависящим от параметра θ. Требуется найти его точечную оценку.

Функцией правдоподобия случайной величины X называют функцию аргумента θ:

а) ,

если X — непрерывная случайная величина с плотностью распределения ,

б)

если X — дискретная случайная величина, - вероятность того, что в результате испытания величина X примет значение xi .

В качестве точечной оценки параметра θ принимают такое его значение θ*=θ*(х1,x2, , хn), при котором функция правдоподобия достигает максимума. Оценку θ* называют оценкой наибольшего правдоподобия. Функции L и LnL достигают максимума при одном и том же значении θ, поэтому вместо максимума функции L целесообразно находить максимум функции LnL, которую называют логарифмической функцией правдоподобия. Точку максимума функции LnL, аргумента θ можно найти, например, следующим образом:

  1. найти производную: ;

  2. приравнять производную нулю и найти критическую точку — корень полученного уравнения (уравнение правдоподобия);

3) найти вторую производную: ; при этом если вторая производная при θ=θ* отрицательна, то θ* является точкой максимума.

Найденную точку максимума θ* принимают в качестве оценки наибольшего правдоподобия параметра θ.

Пример. Найти оценку максимального правдоподобия для параметра распределения Пуассона.

Распределение Пуассона имеет вид , где принимает любые целые неотрицательные значения.

Пусть – выборка из генеральной совокупности . Тогда . Преобразовав произведение, получим

.

Поэтому логарифмическая функция максимального правдоподобия имеет вид

.

Находим критическую точку, решая уравнение . Получим . Отсюда следует .

Так как при , то найденная критическая точка есть точка максимума. Поэтому оценкой максимального правдоподобия для параметра является случайная величина т.е. .

Для выборок малого объема точечные оценки могут значительно отличаться от оцениваемого параметра, и вопрос о точности получаемых оценок становится очень важным. В математической статистике он решается введением интервальных оценок. Общая теория построения интервальных оценок заключается в определении случайной величины, зависящей от оцениваемого параметра. Зная распределение этой случайной величины, находят соответствующие доверительные границы и сам доверительный интервал с требуемой точностью.

Интервальной оценкой для параметра θ называется такой интервал со случайными границами, что .

Вероятность называется надежностью интервальной оценки или доверительной вероятностью, случайные величины – доверительными границами, а сам интервал называется доверительным интервалом. Центром этого интервала является значение точечной оценки .

Надежность принято выбирать равной 0.95, 0.99, в этом случае событие, состоящее в том, что интервал покроет параметр , будет практически достоверным.

Таблица 4.1.

Таблица доверительных интервалов для параметров нормального распределения.

Параметр

Доверительный интервал

Статистическая оценка

Математическое ожидание

а) при известном σ

, где - точность оценки

n объем выборки

t - значение аргумента функции Лапласа Ф(t)

а - математическое ожидание

σ-среднеквадратическое отклонение

Математическое ожидание

б) при неизвестном σ

- выборочная средняя

S - исправленное среднеквадратическое отклонение

n -объем выборки

распределение Стьюдента, степень свободы k = n - 1

Дисперсия (среднеквадратическое отклонение)

границы ( ), соответствующие надежности γ находят по таблице:

(распределение Пирсона) из условия

,

где - случайная величина имеющая распределение Пирсона.

имеет распределение

-хи-квадрат с

n-1 степенями свободы.

Например, для оценки математического ожидания генеральной совокупности нормально распределенного признака по выборочной средней и известном среднеквадратическом отклонении генеральной совокупности применяется формула:

.

При этом t определяется по таблицам функции Лапласа из соотношения

,

где - среднеквадратическое отклонение; n - объем выборки.

Замечание 1. Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:

  1. при возрастании объема выборки п число убывает и, следовательно, точность оценки увеличивается;

  2. увеличение надежности оценки γ=2Ф(t) приводит к увеличению t (Ф(t) — возрастающая функция), следовательно, и к возрастанию ; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Замечание 2. Если требуется оценить математическое ожидание с наперед заданной точностью и надежностью γ, то минимальный объем выборки, который обеспечит эту точность, находят по формуле (следствие равенства ).

Пример. Найти доверительный интервал для оценки математического ожидания нормального распределения с надежностью 0,95, зная выборочную среднюю , объем выборки n=100 и среднеквадратическое отклонение .

Решение. Воспользуемся данными из таблицы приложения 2. Для этого из выражения где Ф(t) - функция Лапласа, n = 100, σ = 4, δ - точность оценки, γ=0,95, найдем t. Получаем t=1,96, тогда . Доверительный интервал будет равен .

Пример. На контрольных испытаниях n=15 ламп была определена средняя продолжительность горения лампы, =3000ч. Считая, что срок службы лампы распределен нормально с =16ч, определить доверительную вероятность того, что точность средней равна 10ч.

Решение. Подставляя числовые данные в формулу .

По таблице приложения 2 найдем вероятность Ф(2,4)=0,9836; это и есть доверительная вероятность γ.

Пример. На контрольных испытаниях 16 осветительных ламп были определены: средняя продолжительность работы лампы =3000ч и исправленное среднее квадратическое отклонение .S=20ч. Считая, что срок службы каждой лампы является нормально распределенной случайной величиной, определить с надежностью 0,9 доверительный интервал для математического ожидания.

Решение. Так как γ=0,9, k=16-1  в соответствии с формулой находим =1,753  .

Таким образом, с вероятностью 0,9 можно быть уверенным в том, что доверительный интервал (2991,235; 3008,765) покроет неизвестное математическое ожидание, а среднее =3000ч определяет значение математического ожидания с точностью 8,765.

Пример. По результатам измерения диаметра 25 корпусов электродвигателей было получено, что =100мм, S=16 мм. Предполагая нормальное распределение результата измерения, найти вероятность того, что (0,9 ;1,1 ) накроет математическое ожидание.

Решение. Приравнивая нижнюю границу, равную 0,9 , нижней границе , получаем 0,9 = . Отсюда . Такой же результат имеем, если приравнять 1,1 верхней границе, равной .

Подставляем числовые данные в формулу

Зная и число степеней свободы k=n1==24, по таблице приложения 3 находим, что γ≈0,99. Таким образом, вероятность Р(0,9 <М(Х)<1,1 )≈0,99.