
- •3. Геометрическая вероятность.
- •7. Закон распределения и функц. Распред. Дискретной случ. Величины
- •9.Непрерывные случ. Вел-ны
- •Показательный закон распределения
- •22. Основные понятия теории оценок
- •24. Методы получения оценок: метод моментов и метод наибольшего правдоподобия, функция правдоподобия( дискретный и непрерывный случаи), примеры.
- •26.Общая схема проверки гипотез:
22. Основные понятия теории оценок
Опр.1.
Любая ф-ия от выборки (числовая) наз-ся
статистикой.
—статистика
Задача оценки
параметра а
состоит в том, чтобы подобрать статистику
,
кот-я в некотором смысле была бы близка
к оцениваемому параметру
Опр.2.
Если с ростом объёма выборки n
оценка
сколь
угодно близко приближается к оцениваемым
параметрам а,
то такая оценка
наз-ся состоятельной
Опр.3. Оценка
нас волнует такая, что её матем. ожидание
равно оцениваемому параметру, наз-ся
несмещённой.
— несмещённая оценка.
Если это не так, то оценка смещённая.
Теор. (о состоя-ти
оценки):
Если оценка
–несмещённая
оценка параметра а, т.е
и её дисперсия стремится к 0 с увеличением
объёма выборки, т.е.
,
то такая оценка будет состоятельной.
Док-во:
Воспользуемся
нер-вом Чебышева:
.
Возьмём произвольное
.
.
Перейдём к пределам:
.
С вероятностью 1 будет противоположное
нер-во. Теорема док-на
Опр.4.
Несмещённая оценка
параметра а наз-ся эффективной,
если её дисперсия наименьшая по сравнения
с дисперсией любой другой несмещённой
оценки.
Опр.5. Оценку наз-ют точечной ,если она определяется одним числом.
Оценка вер-ти случайного события А
Проведём серию из
n
независимых опытов Х – число появления
события А в этих опытах
— индикатор события А.
—
число успехов
По теореме Бернулли,
возьмём в качестве оценки относит-ую
частоту
Теорема:
Оценка
,равная
относит. частоте
=
x
/ n
явл-ся состоятельной, несмещённой и
эффективной.
22. Статистическая оценка – любая функция от выборки. Свойства статистической оценки:
Несмещенность
Состоятельность
Эффективность
Теорема:
Оценки
и
–
несмещенные, а оценка
– состоятельная.
Доказательство:
Сначала
докажем несмещенность оценок. Нужно
проверить, что M
=a,
M
=σ
.
По определению имеем
M
=M
=
=a.
Далее,
M
=
,
где
Выполним тождественные преобразования:
=
=
=
Далее воспользуемся
тем, что MX
=
σ
+a
,
и при
M
(X
X
)=MX
·MX
(
случайные величины X
и
X
независимы)
=
σ
+a
)–
=(1–
)
σ
,
то
есть
M
=σ
.
Докажем состоятельность оценки . Для этого вычислим D :
D
=
→
0.
Если D и M → 0, то – состоятельная оценка параметра x.
24. Методы получения оценок: метод моментов и метод наибольшего правдоподобия, функция правдоподобия( дискретный и непрерывный случаи), примеры.
Метод моментов
Пусть x
,
x
…
x
–
независимая выборка из распределения
с плотностью p(x;
θ
,…,
θ
),
зависящей от параметров θ
,…,
θ
.
Определение: Интеграл вида
m
(
θ
,…,
θ
)=
называется теоретическим моментом
порядка k,
а статистика
называется выборочным моментом порядка
k.
Предположим, что
при k=1,2….r,
все теоретические моменты m
(
θ
,…,
θ
)
конечны и что система уравнений
m
(
θ
,…,
θ
),
k=1,2,…,r
однозначна разрешима, причем решение
m
(
b
,…,
b
),
k=1,2,…r
дается непрерывными обратными функциями
m
.
При этих условиях имеет место
Теорема о методе
моментов.
Оценки
,
получаемые как решения системы уравнений
m
(
b
,…,
b
),
k=1,2,…r
состоятельны.
Пример 1.
Найти методом моментов по выборке x
,
x
…
x
точечную
оценку неизвестного параметра λ
показательного распределения с
плотностью p(x)=
λe
(x
>0).
Решение. Здесь
неизвестный параметр один, поэтому
вычисляем теоретический и выборочный
моменты: m
=
=
,
Искомая оценка
имеет вид
.
Метод наибольшего правдоподобия
Случай непрерывных распределений
Пусть x , x … x – независимая выборка из непрерывного распределения с плотностью p(x; θ).
Определение 1: Функция вида L(x , x … x ; θ)=p(x ; θ)…p(x ; θ) называется функцией правдоподобия.
Определение 2:
Оценкой наибольшего правдоподобия
параметра θ называют число
,
которое находится из условия L(x
,
x
…
x
;
)=max
L(x
,
x
…
x
;
θ)
При выполнении
некоторых условий, смысл которых состоит
в том, что p(x;
θ) – достаточно гладкая функция, а
интеграл
=1
достаточно быстро сходится, оценка
максимального правдоподобия обладает
следующими свойствами:
она состоятельна
она асимптотически нормальна, т.е при больших n можно рпиближенно считать, распределение приближенно нормельным.
она асимптотически эффективна, т.е при больших n оценку можно считать близкой к эффективной.
Недостатком метода является то, что иногда оценки получаются смещенными.
Случай дискретного распределения
Определение 1:
Пусть P(
)=P
,
где
–
число из выборки, а
– та случайная величина, которая приняла
значение
.
Функция вида L(x
,
x
…
x
;
θ)=P(x
;
θ)…P(x
;
θ) называется функцией правдоподобия
в дискретном случае.
Оценкой наибольшего правдоподобия параметра θ называют число , которое находится из условия L(x , x … x ; )=max L(x , x … x ; θ).
Пример: Методом
наибольшего правдоподобия найти оценку
параметра λ распределения Пуассона
P
=
, λ>0,
–
целые неотрицательные числа.
Решение. Составляем
функцию правдоподобия L(x
,
x
…
x
;
λ)=
И находим, что ее
максимум достигается в точке
=
.
25.Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.
Доверительным называют интервал, который с заданной надёжностью γ покрывает заданный параметр.
Интервальной оценкой (с надёжностью γ) математического ожидания а нормального распределённого количественного признака по выборочной средней хв
1. при известном среднем квадратическом отклонении σ генеральной совокупности служит доверительный интервал хв – t (σ/√n) < a < хв + t (σ/√n), где δ = t (σ/√n) – точность оценки, n – объём выборки, t – значение аргумента функции Лапласа Ф(t), при котором Ф(t) = γ/2.
2. при неизвестном σ (и объёме выборки n < 30) хв – tγ (s/√n) < a < хв + tγ (s/√n), где s – исправленное выборочное среднее квадратическое отклонение, tγ находят по таблицам распределения Стьюдента по заданным n (число степеней свободы k = n – 1) и γ.
Интервальной оценкой (с надёжностью γ) среднего квадратического отклонения σ нормально распределённого количественного признака Х по исправленному выборочному среднему квадратическому отклонению s служит доверительный интервал s (1 – q) < σ < s (1 + q) (при q < 1), 0 < σ < s (1 + q) (при q > 1), где q находят по таблицам распределения χ2 по заданным n и γ.