- •Орлов а.И. Об оценивании параметров гамма-распределения
- •О развитии математических дисциплин
- •Параметризация семейства гамма-распределений
- •Области применения гамма-распределения
- •Одношаговые оценки вместо оценок максимального правдоподобия
- •Метод моментов оценивания параметров и проверки гипотез
- •Влияние интервальности исходных данных
- •Табличное и программное обеспечение в нормативно-технической документации
Метод моментов оценивания параметров и проверки гипотез
Термин "метод моментов" применяют как общее название приемов, основанных на использовании функций от выборочных моментов. Его применяют как для оценивания параметров, так и для проверки гипотез (например, нормальность распределения можно проверять с помощью таких функций от выборочных моментов, как выборочные асимметрия и эксцесс).
Оценки параметров методом моментов (ОММ) представляют интерес как сами по себе, так и как начальные значения при вычислении ОШО. Известно [24], что для гамма-распределения асимптотические дисперсии оценок метода моментов больше, чем для ОМП (а потому и для ОШО). Однако ОММ обладают преимуществом простоты расчета, а при учете интервальности исходных данных оказываются лучше ОМП и ОШО в широком диапазоне значений параметров (см. ниже).
Метод
моментов оказался полезен для проверки
согласия эмпирических данных с семейством
гамма-распределений [25]. Он основан на
том, что для
=-параметрического
семейства распределений
моментов связаны некоторым соотношением,
а именно, некоторая функция от моментов
равна 0. Статистика критерия согласия
получается путем подстановки в эту
функцию выборочных моментов вместо
теоретических, а критические значения
находятся исходя из асимптотической
нормальности статистики критерия.
Критерий метода моментов является,
очевидно, несостоятельным, однако
предельные распределения состоятельных
критериев типа Колмогорова или типа
омега-квадрат для проверки согласия с
гамма-распределением нам неизвестны.
По сравнению с также несостоятельным
критерием хи-квадрат критерий метода
моментов обладает тем преимуществом,
что допускает непосредственное
использование выборочных моментов и
не требует предварительного нахождения
оценок параметров из условия минимизации
хи-квадрат (о различных ошибках при
использовании критерия хи-квадрат см.
[26]).
Основное
используемое в [1] утверждение о функциях
от выборочных моментов - их асимптотическая
нормальность. При этом необходимо уметь
вычислять асимптотическую дисперсию.
Как правило, она, как и асимптотическое
смещение, имеет порядок
,
где
- объем выборки. Это значит, что
асимптотическое смещение - бесконечно
малая величина по сравнению с
асимптотическим средним квадратическим
отклонением, а потому при больших
- им можно пренебречь.
В распространенных учебниках, как ни странно, нет технологии расчета асимптотических распределений функций от выборочных моментов, а потому и алгоритмов нахождения доверительных интервалов для параметров. Эта технология состоит из следующих двух этапов.
1. Устанавливается асимптотическая нормальность вектора, координаты которого - начальные моменты. При этом используется многомерная центральная предельная теорема (отсутствующая во многих курсах теории вероятностей) и ковариационная матрица выборочных моментов (см., например, [27, с.387]).
2. С помощью метода линеализации (приближения дважды дифференцируемой функции в окрестности точки с помощью главного линейного члена) устанавливается предельное распределение функции от асимптотически нормального вектора, введенного на этапе1.
В конкретных постановках реализация этих двух этапов может оказаться достаточно трудоемкой. Она может составить (и составляла) предмет дипломных и курсовых работ.
Во многих областях статистики применяются суммы некоторых функций от элементов независимой выборки, в частности, в регрессионном и дискриминантном анализе. В настоящее время они изучаются обычно в предположении нормальности результатов наблюдений. Однако реальные распределения обычно не являются нормальными [28]. Этот факт давно известен специалистам (сопоставьте [28] с более ранними данными в [29]), однако упорно игнорируется авторами учебников. Описанная выше технология позволяет избавиться от предположения нормальности и получить асимптотические распределения лишь в предположении существования необходимого числа моментов, как это сделано в [30] для выборочного коэффициента вариации. Отметим, что при таких иссследованиях оказываются полезными асимптотические формулы для моментов функций от выборочных моментов, имеющиеся в классических учебниках [27, 31], но отсутствующие в современных.
В [1] асимптотические формулы рекомендуется применять при конечных объемах выборок. В частности, при расчетах доверительных интервалов используются асимптотические дисперсии ОШО(ОМП) и ОММ, в которых истинные значения параметров заменены на их точечные оценки. Конечно, подобные рекомендации требуют обоснования, т.е. дальнейших исследований, которые не были проведены при разработке ГОСТ 11.011-83 из-за недостатка времени и финансирования и не проведены до сих пор из-за отсутствия стимула. Доведение общих теоретических соображений до предназначенных для практического использования обоснованных алгоритмов требует трудоемких исследований, не представляющих самостоятельного интереса для теоретиков. С другой стороны, заказчики научно-исследовательских работ часто также не понимают необходимости подобных исследований. В результате имеем массу ошибочных рекомендаций, в том числе на уровне учебников и стандартов [4-6]. Отметим, что хотя в соответствии с технологией подготовки государственных стандартов проект [1] был разослан на отзыв более чем в 100 организаций, ни одна из них не стала настаивать на проведении указанных исследований.
Не менее необходимым является изучение устойчивости (робастности) используемых в [1] оценок параметров к малым отклонениям исходных данных и предпосылок модели. Особенно это представляется актуальным в связи с использованием в оценках выборочных моментов высоких порядков. Однако популярная среди теоретиков [32, 33] модель засорения (Тьюки-Хьюбера) представляется не вполне адекватной. Эта модель нацелена на изучение влияния больших "выбросов". Поскольку любые реальные измерения лежат в некотором фиксированном диапазоне, например, зафиксированном в техническом паспорте средства измерения, то зачастую выбросы не могут быть слишком большими.. Поэтому представляются полезными иные, более общие схемы устойчивости [34], в которых, например, учитываются отклонения распределений результатов наблюдений от предположений модели.
