
- •Математичечская статистика
- •1. Генеральная и выборочная совокупность данных
- •2. Статистическое распределение выборки. Выборочный ряд, полигон, гистограмма и комулянта выборки.
- •3. Выборочные характеристики
- •1. Распределения Стьюдента и Пирсона
- •2. Таблицы распределения выборочных величин
- •1. Точечные оценки.
- •2. Методы построения точечных оценок
- •3. Интервальные оценки и алгоритм построения
2. Таблицы распределения выборочных величин
Обычно
выборочные распределения задаются
таблично в виде право-сторонних функций
распределения
и/или обратных к ним квантилей
известны [10] и приводятся в Приложениях
2-5.
Рис.11.3 Правосторонняя квантиль
В статистическом комплексе программ MS Exel эти распределения представлены следующими функциями:
- правостороннее
распределение
Пирсона,
- правосторонняя
квантиль
Пирсона,
- правостороннее
Т-распредел.
Стьюдента,
- двухстороннее Т
-распредел.
Стьюдента,
-
двухсторонняя Т
-квантиль Стьюдента,
-
правостороннее F-распределение
Фишера,
-
правосторонняя квантиль Фишера.
Для работы с нормальной случайной величиной имеются следующие полезные функции:
- весовая функция
нормального распределен;
- интегральная
функция нормального распред;
- обратная
интегральная функция;
- функция Гаусса
стандартная
;
- Функция Лапласа
стандартная
.
Лекция № 12
Статистические оценки параметров распределения
Пусть
распределение наблюдаемой случайной
непрерывной величины Х
(признак генеральной совокупности),
задается функцией плотности вероятности,
где
параметр или параметры распределения.
Допустим, что вид функции
известен или
ограничен некоторым классом функций,
а параметр неизвестен
и должен быть оценен по выборке
,
где n
– объем выборки.
1. Точечные оценки.
Точечной статистической оценкой параметров распределения или характеристик наблюдаемой случайной величины Х, называется построенная по данным выборки объема n величина:
.
Оценка *n является так же случайной величиной, т.к. зависит от случайной выборки, поэтому ее можно представить как функцию от случайных величин *n =*n(Х1, Х2,.., Хn), где Хi независимые случайные величины, распределенные так же как и сама величина Х. Для того, что бы оценки, получаемые по данным различных выборок соответствовали истинному значению параметра , оценка должна удовлетворять следующим требованиям.
Оценка должна быть несмещенной, т.е. ее математическое ожидание должно совпадать с истинным значением параметра для любого объема n
М(*n) = .
или хотя бы
асимптотически несмещенной:
.
Оценка должна быть состоятельной, т.е. с ростом объема выборки оценка должна сходится по вероятности к истинному значению параметра:
для любого >
0 .
Для состоятельности оценки достаточно выполнения следующего:
,
тогда из неравенства Чебышева для случайной величины *n
следует состоятельность
оценки.
Построенная оценка для использования на практике должна быть эффективной, т.е. ее дисперсия должна быть минимальной среди всех возможных оценок при фиксированном объеме выборки:
D(*n,эф) = min D(*n).
Величину дисперсии эффективной оценки можно найти используя неравенство Рао-Крамера
,
где
- информация Фишера. Коэффициент
эффективности оценки kэф(*)=
D(*n,эф)/
D(*n)
показывает
степень эффективности оценки *,
если
,
то говорят об асимптотической эффективности
оценки.
Отметим, что на практике не всегда удается удовлетворить всем перечисленным требованиям к оценке, но введенные свойства оценок всегда позволяют проранжировать имеющиеся оценки по их качеству.
В качестве примера рассмотрим оценки математического ожидания М(Х) = m и дисперсии D(Х) = 2 наблюдаемой случайной величины X. Построим точечные оценки:
,
и рассмотрим их свойства. Поскольку М(Хi) = m и D(Хi) = 2 то можно вычислить, что для оценки m* справедливо:
М(m*) = m; D(m*) = 2 /n 0 при n
Из этого следует несмещенность и состоятельность оценки m*.
Рассматривая же оценку 2* можно получить:
;
Из чего следует не только состоятельность, но и смещенность оценки 2*. Смещеность оценки здесь легко может быть исправлена. Рассмотрим оценку:
.
Оценка 2*=S2 является уже несмещенной и состоятельной оценкой. Величина S2 называется исправленной (уточненной) выборочной дисперсией, а величина S исправленным среднеквадратическим выборочным отклонением (выборочный стандарт).
В заключении
напомним что относительная частота wn
появления
события в независимых испытаниях
Бернулли является несмещенной,
состоятельной и эффективной оценкой
неизвестной вероятности этого события
р*=wn
(теорема
Бернулли), а
эмпирическая функция выборочного
распределения
является состоятельной несмещенной
оценкой неизвестной функцией распределения
наблюдаемой случайной величины
(теорема Гливенко).