
- •Теория вероятностей и математическая статистика. Часть 1
- •Введение
- •1.Основные понятия теории вероятностей
- •1.1. Понятие вероятности
- •1.2. События. Пространство элементарных исходов.
- •1.3.Вероятностное пространство
- •1.4. Условные вероятности
- •Независимость событий
- •2. Случайные величины. Распределение вероятностей
- •2.1. Виды случайных величин. Распределение дискретных случайных величин.
- •2.2. Характеристики дискретной случайной величины и их свойства.
- •2.3.Непрерывные случайные величины. Функция плотности вероятностей.
- •2.4.Интегральная функция распределения
- •2.5. Нормальный закон распределения. Асимметрия. Эксцесс.
- •2.6.Функция от случайных величин
- •Двумерные случайные величины
- •Условные законы распределения.
- •Корреляционный момент. Коэффициент корреляции.
- •3.Основы статистической методологии. Статистическое оценивание.
- •3.1. Выборочные статистики. Функция правдоподобия.
- •3.2. Эмпирическая функция распределения. Гистограмма. Свойства оценок
- •Общие свойства оценок параметров
- •Неравенство Крамера-Рао в частном случае
- •Достаточные оценки параметров.
- •Оценивание параметров методом максимального правдоподобия.
- •Интервальные оценки параметров распределения
- •3.7.1. Доверительный интервал для оценки математического ожидания
- •3.7.2 Доверительный интервал для оценки дисперсии
- •Статистическая проверка гипотез
- •Заключение
- •Литература
Оценивание параметров методом максимального правдоподобия.
Будем считать, что как и ранее, плотности вероятности случайных величин x1, x2,…,xn зависят от параметров {U1, U2,…,Ur}. Функция правдоподобия p(x/u) для независимых наблюдений имеет вид (3.25)
Разумным выбором оценок параметров {Ui} является выбор таких U*1, U2*,…,Ur*, которые дают максимальное значение функции правдоподобия.
Оценки параметров U1, U2,…,Ur , найденные максимизацией функции правдоподобия, называются оценками максимального правдоподобия.
Так как положение максимумов функций p(x/U) и ln p(x/U) совпадает, удобнее рассматривать вторую функцию, так как процесс нахождения максимума ln p(x/U) в целом ряде случаев проще.
Используя необходимые условия экстремума функции, получим в предположении, что допустимо дифференцирование ln p(x/U) по Ui систему
i=1,2,…,n
(3.29)
Эта система в общем случае является нелинейной системой алгебраических уравнений.
Для решения этой системы, т.е. для нахождения оценок, в общем случае приходится применять численные методы. Одним из наиболее распространенных является следующий.
Разложим функцию правдоподобия l(U) в ряд Тейлора в окрестности точки U0 и получим
l(U)
(3.30)
Или, используя матричные обозначения, запишем
l(U)=l(U0)+(U-U0)c+1/2(U-U0)TA(U-U0)…,
где А-квадратичная матрица размером
m*m с элементом
,
стоящих в i-строке и в
j-столбце; с-вектор-столбец
с элементами
.
Пренебрегая в (3.30) членами третьего порядка и выше порядков, найдем из уравнения
l(U)=l(U0)+1/2ΔU T AΔU (3.31)
поправки ΔU=b, минимизирующие l(U). С этой целью мы продифференцируем (3.31) по bi и приравняем частные производные нулю.
Получим систему уравнений
……………………………………………………………………………….
Решая эту систему уравнений относительно вектора поправок ΔU=U- U0, уточним значения параметров. Процедуру можно повторить, заменяя в уравнении (3.31) вектор U0 на вектор U0+ ΔU. Исследуем свойства получаемых оценок. Для этого заметим, что в точке максимума правдоподобия
, i=1,2,…,m.
Тогда
l(U)
l(U0)+1/2(U-
U0)TA(U-
U0)
(3.32)
В пределе при n элементы матрицы А, которые зависят от конкретной выборки, можно заменить соответствующими математическими ожиданиями
.
Интервальные оценки параметров распределения
Наряду с точечными оценками параметров,
представляющими из себя некоторую
функцию от выборки, в статистике широкое
использование находят интервальные
оценки параметров. Интервальная оценка
параметра указывает границы возможных
значений выборочных оценок с некоторой
заданной степенью достоверности. Поэтому
интервальные оценки параметров позволяют
установить точность и надежность
точечных оценок. Границы возможных
значений называются доверительными
интервалами. Заданная степень достоверности
называется доверительной вероятностью.
Смысл интервальной оценки становится
очевидным, если вспомнить, что любая
точечная оценка (статистика)
является случайной величиной и, когда
g(x) непрерывная
функция, а {xi}
случайные величины, характеризующиеся
плотностями f(xi),
то
полностью определяется плотностью
вероятности gn(U).
Предположим, что оцениваемый параметр неслучайное число. Ясно, что оценка тем точнее, чем меньше абсолютная величина / -Un/ и, следовательно, точность оценки Qn можно характеризовать неравенством
/
-Un/
(3.33)
где
-некоторое
положительное число.
Так как случайная величина, то неравенство (3.33) имеет вероятностный смысл и важно знать- какова вероятность выполнения этого неравенства при фиксированном . Эта вероятность и является доверительной вероятностью Pдов. При практических расчетах чаще решают обратную задачу- по заданной доверительной вероятности находят такое , что
P{/ -Un/< }=Pдов. (3.34)
Интервал [( -Un)( +Un)] называется доверительным интервалом.
Из равенства (3.34) следует
P{/ -Un/< }=Р [ -Un<U< +Un] (3.35)
т.е. соотношения (3.34) и (3.35) характеризуют (для несмешанной оценки) вероятность того, что интервал ( -Un)( +Un) заключает в себе (покрывает) неизвестный параметр U и равен Рдов.