
- •Теория вероятностей . Математическая статистика и случайные процессы
- •Оценка параметров функции распределения и построение гистограммы по опытным данным Методические указания
- •220200 - Автоматизация и управление
- •2.2.Статистический ряд. Гистограмма
- •2.3.Числовые характеристики распределения
- •2.4.Оценка параметров распределения
- •2.4.1. Метод моментов.
- •2.4.2.Метод наибольшего правдоподобия
- •3.Задания на контрольно-курсовую работу
- •Задание n1 Распределения Пуассона случайной величины X
- •4.Порядок выполнения работы
- •5.Оформление отчета
- •7.Контрольные вопросы
- •Оценка параметров функции распределения и построение гистограммы по опытным данным
2.4.2.Метод наибольшего правдоподобия
Рассмотренный выше метод моментов приводит обычно к относительно простым формулам для оценки параметров, однако в ряде случаев эти оценки малоэффективны или вовсе несостоятельны. Например, для применения метода моментов теоретические моменты должны существовать, что не для всех распределений выполняется. Например, у распределения Коши, имеющего плотность
,
все моменты бесконечны.
Поэтому необходимы и другие методы, лишенные отмеченных недостатков.
Метод наибольшего правдоподобия обладает важным достоинством: он всегда приводит к состоятельным оценкам, имеющим наибольшую точность. Этот метод наилучшим образом использует всю информацию о неизвестных параметрах распределения, имеющуюся в выборке. Однако на практике он часто приводит к необходимости решать весьма сложные системы уравнений.
Метод наибольшего правдоподобия был предложен Р.Фишером, одним из основоположников математической статистики и является наиболее обоснованным и проверенным методом, широко используемом в математической статистике.
Случай дискретных распределений
.Рассмотрим случай оценки параметра
распределения дискретной случайной
величины X, вероятности
значений которой определяются согласно
распределению
,
где
- неизвестный параметр, который нужно
оценить по выборке
.
Функция
называется функцией
правдоподобия. Если число случаев,
когда случайная величина X
приняла значения
равно соответственно
,
где
-
размер выборки, то функция правдоподобия
.
Согласно методу наибольшего правдоподобия в качестве оценки неизвестного параметра принимается то значение, при котором функция правдоподобия принимает наибольшее значение для данной выборки. То есть в качестве оценки для берется наиболее вероятное значение для данной выборки.
Это значение находится в результате решения уравнения
.
Практически удобнее находить максимум функции ln(L), тогда соответствующее уравнение примет вид:
.
Это уравнение принято называть уравнением правдоподобия. Решение этого уравнения дает максимум функции правдоподобия, если для него выполняется условие
.
Если распределение
имеет два пара параметра
и
,
то есть имеет вид
,
то для оценки этих параметров используются
система из двух уравнений правдоподобия:
.
При большем числе параметров число подобных уравнений соответственно увеличивается.
Проиллюстрируем применение метода наибольшего правдоподобия на примерах.
Пример 1. При
n-кратном повторении
опыта событие А проявилось m
раз. Оценим вероятность события А
по методу наибольшего правдоподобия.
Будем считать, что случайная величина
X принимает значение
1, если произошло событие А и 0, если
произошло противоположное событие
.
Согласно (8.1.1) функция правдоподобия в данном случае имеет вид:
,
где - оцениваемая вероятность.
После логарифмирования получаем, что
.
После дифференцирования по получаем следующее уравнение:
,
после решения которого получаем, что
.
Крышечкой сверху будем отличать оценку параметра от его точного значения.
Пример 2. Рассмотрим случай оценки параметра дискретной случайной величины Х, распределенной по закону Пуассона
Согласно (8.1.1) функция правдоподобия равна
.
После логарифмирования получаем
.
После дифференцирования получаем:
,
Откуда
,
где
-
статистическая вероятность того, что
X=i.
Таким образом, в качестве оценки параметра а распределения Пуассона следует брать статистическое среднее выборки.
Случай непрерывных распределений. Если
случайная величина X
имеет непрерывную плотность
распределения
,
где
-
параметр распределения, который нужно
оценить по выборке реализаций этой
случайной величины
,
то в этом случае функция правдоподобия
.
Согласно методу наибольшего правдоподобия наилучшей оценкой параметра является значение, для которого функция правдоподобия достигает максимума.
Если функция дифференцируема по , то это значение находится из уравнения
.
Практически удобнее пользоваться логарифмической формой этого уравнения
.
Это уравнение называется уравнением правдоподобия.
Если плотность распределения случайной
величины X имеет два
параметра
и
,
то есть имеет вид
,
то оценки наибольшего правдоподобия
находятся из системы двух уравнений
К сожалению, эти уравнения не всегда
дают явные выражения для оценок параметров
и их приходится решать численными
методами.
Если область определения плотности
зависит от параметров, то максимум
функции правдоподобия может достигаться
на границе этой области. В этом случае
надо анализировать непосредственно
функцию правдоподобия .
Если уравнение правдоподобия имеет несколько корней, то надо брать то решение, при котором функция правдоподобия максимальна.
Пример 3. Оценим данным методом
параметр показательного распределения
случайной величины T
по выборке ее реализаций
.
В этом случае
,
а функция правдоподобия
.
Уравнение правдоподобия в этом случае имеет вид:
.
В результате решения этого уравнения получаем, что оценка наибольшего правдоподобия
.
Пример
4. Оценим параметры
случайной величины Х, распределенной
по нормальному закону с плотностью
по выборке реализаций .
Функция правдоподобия в этом случае равна
,
а уравнения правдоподобия:
Из первого уравнения получаем, что
.
Из второго уравнения получаем, что
.
В данном случае оценки наибольшего правдоподобия совпали с ранее выведенными оценками по методу моментов. Но это не всегда так.