
- •Основные непрерывные распределения
- •1. Равномерное распределение
- •3. Нормальное распределение
- •4. Выборочные моменты
- •Основные распределения в статистике
- •1. Распределение хи-квадрат
- •2.2. Распределение Стьюдента
- •Точечные оценки.
- •Несмещенность. Состоятельность
- •Интервальное оценивание
- •Проверка гипотезы о виде закона распределения
- •Метод наименьших квадратов (мнк)
- •Выполнение работы.
- •1)Проверка гипотезы о виде закона распределения (по критерию хи-квадрат).
4. Выборочные моменты
Пусть имеется выборка Zn = = col(X1, ...,Хп), которая порождена СВ X с функцией распределения FХ (x).
Определение 4.1. Для выборки Zn объема п выборочными начальными и центральными моментами порядка r СВ X называются следующие СВ:
Определение 4.2. Выборочным средним и выборочной дисперсией СВ X называются соответственно
Пусть существуют исследуемые моменты νг, μТ. Тогда справедливы следующие свойства.
Свойства выборочных
моментов
1)
для любого
и для всех г = 1,2,
2)
,
где
.
3)
.
Основные распределения в статистике
1. Распределение хи-квадрат
Определение 2.
1. Пусть Uk,
,
- набор из n независимых нормально
распределенных СВ,
~N(0;1).
Тогда СВ
Имеет распределение хи-квадрат с n степенями свободы, что обозначается Xn~χ2(n)
Свойства распределения хи-квадрат χ2(n)
СВ Xn имеет следующую плотность распределения:
где
- гамма-функция.
СВ Xn~χ2(n) имеет моменты:
Сумма любого числа m независимых СВ Xk,
, имеющих распределение хи-квадрат с nk степенями свободы, имеет распределение хи-квадрат с
степенями свободы.
Распределение хи-квадрат обладает свойством асимптотической нормальности:
при
где СВ U имеет распределение N(0;1). Это означает, что при достаточно большом объеме n выборки можно приближенно считать Xn~N(n; 2n). Фактически эта аппроксимация имеет место уже при n > 30.
2.2. Распределение Стьюдента
Определение 2.2.
Пусть U и
— независимые
СВ, U ~N(0;
1),
~ χ2(n)
. Тогда СВ
имеет распределение
Стьюдента с n степенями свободы, что
обозначают как
~S(n).
Свойства распределения Стьюдента S(n)
1) СВ имеет плотность распределения
2) СВ
имеет
МО, равное М[Тn]
= 0 для всех n
2,
и дисперсию D[
]
= n/(n - 2)
при n > 2. При n = 2 дисперсия
.
3) Можно показать,
что при
распределение S (n) асимптотически
нормально, т. е.
,
где СВ U имеет
распределение N(0; 1). При n
30
распределение Стьюдента S (n)
практически
не отличается от N(0; 1).
Точечные оценки.
Параметром
распределения
СВ X
называется
любая числовая характеристика этой СВ
(математическое ожидание, дисперсия
и т.п.) или любая константа, явно входящая
в выражение для функции распределения.
В общем случае
будем предполагать, что параметр
распределения θ
может быть
векторным, т. е.
В случае
параметрической статистической модели
(
)
таким
параметром распределения может служить
неизвестный вектор
,
характеризующий распределение
.
Пусть имеется выборка Zn = со1(X1, ... ,Хп) с реализацией zn = col(x1, ...,хп).
Точечной
(выборочной) оценкой неизвестного
параметра распределения
называется произвольная статистика
(Zn),
построенная
по выборке Zn
и принимающая
значения в множестве
.
Реализацию (zn) оценки (Zn) принимают, как правило, за приближенное значение неизвестного параметра θ.
Несмещенность. Состоятельность
Оценка
(Zn)
параметра
θ называется
несмещенной,
если ее МО
равно θ, т.е.
для
любого
Оценка
(Zn)
параметра
θ называется
состоятельной,
если она
сходится по вероятности к θ,
т.е. Р
при
со для любого
.
Оценка
(Zn)
параметра
θ называется
сильно
состоятельной, если
она сходится почти наверное к θ,
т.е.
при
для любого
.
Очевидно, что если оценка сильно состоятельная, то она является также состоятельной.
Несмещенная
оценка
*(Zn)
скалярного
параметра θ
называется
эффективной,
если
Функцией правдоподобия для неизвестного параметра θ∈Θ⊂ℝs называется: в случае непрерывной наблюдаемой СВ X — плотность распределения
L(zn,θ1,...,θs)≜fZn(zn,θ1,...,θs)=∏ fX(xk,θ1,...,θs),
где fX(x,θ1,...,θs) — плотность распределения СВ X, а в случае дискретной наблюдаемой СВ X — произведение вероятностей
L(zn,θ1,...,θs)≜∏PX(xk,θ1,...,θs),
где PX(xk,θ1,...,θn) — вероятность события {X=xk}.
Оценкой максимального правдоподобия (МП-оценкой) параметра θ∈Θ называется статистика θˆ(Zn), максимизирующая для каждой реализации zn функцию правдоподобия, т.е.
θˆ(zn)=argmaxθ∈ΘL(zn,θ).
Способ построения МП-оценки называется методом максимального правдоподобия .
Поскольку функция правдоподобия L(zn,θ) и её логарифм lnL(zn,θ) достигают максимума при одних и тех же значениях θ, то часто вместо L(zn,θ) рассматривают логарифмическую функцию правдоподобия lnL(zn,θ).
В случае дифференцируемости функции lnL(zn,θ) по θ МП-оценку можно найти, решая относительно θ1,...,θs систему уравнений правдоподобия
∂lnL(zn,θ1,...,θs)/∂θ1=0,...,∂lnL(zn,θ1,...,θs)/∂θs=0.