- •Основные непрерывные распределения
- •1. Равномерное распределение
- •3. Нормальное распределение
- •4. Выборочные моменты
- •Основные распределения в статистике
- •1. Распределение хи-квадрат
- •2.2. Распределение Стьюдента
- •Точечные оценки.
- •Несмещенность. Состоятельность
- •Интервальное оценивание
- •Проверка гипотезы о виде закона распределения
- •Метод наименьших квадратов (мнк)
- •Выполнение работы.
- •1)Проверка гипотезы о виде закона распределения (по критерию хи-квадрат).
4. Выборочные моменты
Пусть имеется выборка Zn = = col(X1, ...,Хп), которая порождена СВ X с функцией распределения FХ (x).
Определение 4.1. Для выборки Zn объема п выборочными начальными и центральными моментами порядка r СВ X называются следующие СВ:
Определение 4.2. Выборочным средним и выборочной дисперсией СВ X называются соответственно
Пусть существуют исследуемые моменты νг, μТ. Тогда справедливы следующие свойства.
Свойства выборочных моментов
1) для любого и для всех г = 1,2,
2) , где .
3) .
Основные распределения в статистике
1. Распределение хи-квадрат
Определение 2. 1. Пусть Uk, , - набор из n независимых нормально распределенных СВ, ~N(0;1). Тогда СВ
Имеет распределение хи-квадрат с n степенями свободы, что обозначается Xn~χ2(n)
Свойства распределения хи-квадрат χ2(n)
СВ Xn имеет следующую плотность распределения:
где - гамма-функция.
СВ Xn~χ2(n) имеет моменты:
Сумма любого числа m независимых СВ Xk, , имеющих распределение хи-квадрат с nk степенями свободы, имеет распределение хи-квадрат с степенями свободы.
Распределение хи-квадрат обладает свойством асимптотической нормальности:
при
где СВ U имеет распределение N(0;1). Это означает, что при достаточно большом объеме n выборки можно приближенно считать Xn~N(n; 2n). Фактически эта аппроксимация имеет место уже при n > 30.
2.2. Распределение Стьюдента
Определение 2.2. Пусть U и — независимые СВ, U ~N(0; 1), ~ χ2(n) . Тогда СВ имеет распределение Стьюдента с n степенями свободы, что обозначают как ~S(n).
Свойства распределения Стьюдента S(n)
1) СВ имеет плотность распределения
2) СВ имеет МО, равное М[Тn] = 0 для всех n 2, и дисперсию D[ ] = n/(n - 2) при n > 2. При n = 2 дисперсия .
3) Можно показать, что при распределение S (n) асимптотически нормально, т. е. , где СВ U имеет распределение N(0; 1). При n 30 распределение Стьюдента S (n) практически не отличается от N(0; 1).
Точечные оценки.
Параметром распределения СВ X называется любая числовая характеристика этой СВ (математическое ожидание, дисперсия и т.п.) или любая константа, явно входящая в выражение для функции распределения.
В общем случае будем предполагать, что параметр распределения θ может быть векторным, т. е.
В случае параметрической статистической модели ( ) таким параметром распределения может служить неизвестный вектор , характеризующий распределение .
Пусть имеется выборка Zn = со1(X1, ... ,Хп) с реализацией zn = col(x1, ...,хп).
Точечной (выборочной) оценкой неизвестного параметра распределения называется произвольная статистика (Zn), построенная по выборке Zn и принимающая значения в множестве .
Реализацию (zn) оценки (Zn) принимают, как правило, за приближенное значение неизвестного параметра θ.
Несмещенность. Состоятельность
Оценка (Zn) параметра θ называется несмещенной, если ее МО равно θ, т.е. для любого
Оценка (Zn) параметра θ называется состоятельной, если она сходится по вероятности к θ, т.е. Р при со для любого .
Оценка (Zn) параметра θ называется сильно состоятельной, если она сходится почти наверное к θ, т.е. при для любого .
Очевидно, что если оценка сильно состоятельная, то она является также состоятельной.
Несмещенная оценка *(Zn) скалярного параметра θ называется эффективной, если
Функцией правдоподобия для неизвестного параметра θ∈Θ⊂ℝs называется: в случае непрерывной наблюдаемой СВ X — плотность распределения
L(zn,θ1,...,θs)≜fZn(zn,θ1,...,θs)=∏ fX(xk,θ1,...,θs),
где fX(x,θ1,...,θs) — плотность распределения СВ X, а в случае дискретной наблюдаемой СВ X — произведение вероятностей
L(zn,θ1,...,θs)≜∏PX(xk,θ1,...,θs),
где PX(xk,θ1,...,θn) — вероятность события {X=xk}.
Оценкой максимального правдоподобия (МП-оценкой) параметра θ∈Θ называется статистика θˆ(Zn), максимизирующая для каждой реализации zn функцию правдоподобия, т.е.
θˆ(zn)=argmaxθ∈ΘL(zn,θ).
Способ построения МП-оценки называется методом максимального правдоподобия .
Поскольку функция правдоподобия L(zn,θ) и её логарифм lnL(zn,θ) достигают максимума при одних и тех же значениях θ, то часто вместо L(zn,θ) рассматривают логарифмическую функцию правдоподобия lnL(zn,θ).
В случае дифференцируемости функции lnL(zn,θ) по θ МП-оценку можно найти, решая относительно θ1,...,θs систему уравнений правдоподобия
∂lnL(zn,θ1,...,θs)/∂θ1=0,...,∂lnL(zn,θ1,...,θs)/∂θs=0.