
Шпаргалка Раздел 4 Математическая статистика
.docxВыборка
Выборка
– это последовательность
независимых одинаково распределенных
с.в., распределение каждой из которых
совпадает с распределением генеральной
совокупности.
n – объем выборки – число элементов в выборке
Генеральная совокупность.
Генеральная совокупность – это с.в. X(ω), т.е. множество всех возможных ее значений или все теоретически возможные результаты наблюдения (опыта)
Реализация выборки.
Реализация выборки – это конкретные значения выборки полученные в результате наблюдений: .
Выборочный метод статистического исследования предполагает, что на основе выборки можно сделать заключение о генеральной совокупности.
Ранг элемента выборки.
Ранг – номер элемента в вариационном ряду (если есть несколько одинаковых элементов, то считается средний ранг).
Вариационный ряд выборки
Ранжирование
– расположение результатов наблюдения
в порядке неубывания. Результат
ранжирования – вариационный
ряд:
x(1),…,x(n),
x(1)=
xi,
x(n)=
xi,
Размах выборки и интервал варьирования
– размах выборки
– интервал
варьирования
Выборочное среднее
Выборочное
среднее :
Для
группированных данных :
– центр
i-го
интервала группировки.
Выборочная дисперсия
Выборочная
дисперсия:
Для
группированных данных:
Несмещенная выборочная дисперсия
Несмещенная (исправленная выборочная дисперсия:
Эмпирическая функция распределения
Статистическая
(эмпирическая, выборочная) функция
распределения с.в. X – это функция
,
равная доле таких значений
, что
:
где
– число наблюдений <
Полигон частот
Полигоном
частот
называют ломаную, отрезки которой
соединяют точки с координатами (
Гистограмма
Гистограмма
частот – столбчатая диаграмма с
основаниями длины h
и высотами
Выборочные квантили
Статистическая оценка
Оценкой
параметра
теоретического распределения называют
его приближенное значение, зависящее
от данных выбора, т.е. оценка есть
некоторая функция от результатов
наблюдений (статистика):
=
.
Свойства точечных оценок
1. Состоятельность
2. Несмещенность
3. Эффективность
Состоятельность оценки
Оценкой
параметра
называется состоятельной, если она
сходится по вероятности к оцениваемому
параметру при
,
т.е.
Несмещенность оценки.
Оценка
параметра
называется несмещенной, если она в
среднем совпадает с
,
т.е. М
Эффективность оценки.
Несмещенная оценка параметра называется эффективной, если она имеет наименьшую дисперсию среди всех несмещенных оценок параметра
Метод моментов.
Идея: приравнивание теоретических и выборочных моментов.
Если необходимо оценить параметров получим систему:
MX
=
=
DX
=
=
…
M(
Метод максимального правдоподобия
Идея: найти максимум функции правдоподобия, т.е. подобрать такие значения параметров распределения, при которых выборка наиболее правдоподобна
Интервальное оценивание
При интервальном оценивании указывается интервал, в который с заданной вероятностью попадает параметр
≤
Обычно
–
≤
≤
+
Этот интервал называется доверительным интервалом, а вероятность называется доверительной вероятностью или надежностью оценки ( обозначается ƴ), величина α = 1 - ƴ - уровнем значимости оценки.
P( ≤ ) = 1 – α = ƴ
Обычно уровень значимости α = 0,01 ; 0,05 ; 0,1
Уровень значимости при интервальном оценивании
Надёжностью оценки (обозначается ), величина =1- - уровнем значимости оценки.
P( ≤ ) = 1 – α = ƴ
Обычно уровень значимости =0,01;0,05;0,1.
Статистическая гипотеза
Статистической гипотезой Н называется предположение относительно параметров или вида распределения случайной величины
Ошибки первого и второго рода при проверке гипотезы
Ошибка первого рода – отвергается нулевая гипотеза, когда она на самом деле верна. P(H1|H0)=α
Ошибка второго рода – отвергается альтернативная гипотеза, когда она на самом деле верна. P(H0|H1)=β
Общая схема проверки гипотез
1. Располагая выборкой Х1, …, Хn, формулируют нулевую (Н0) и альтернативную (Н1) гипотезы;
2. Назначается уровня значимости α (стандартные значения α: 0.1, 0.05, 0.01);
3. Выбирается статистика критерия Tn=T(Х1, …, Хn) (тип критерия). Обычно из перечисленных ниже: U – нормальное распределение, X2 – распределение Пирсона, t – распределение Стьюдента, F – распределение Фишера-Снедекора;
4.
По статистике критерия Tn
определяют критическую область S
(и
).
Для ее определения достаточно найти
критическую точку tкр,
т.е. границу (или квантиль), отделяющую
область S
от
;
5.Сравнение табличных и вычисленных значений статистики критерия.
Критерий согласия Х2 Пирсона
Эта статистика при имеет Х2 распределения с k=m-r-1 степенями свободы, где m – число групп (интервалов) выборки, r – число параметров предполагаемого распределения.
Критерий согласия Колмогорова
Является наиболее простым критерием согласия. Он связывает эмпирическую функцию распределения F*n(x) с функцией FX(x) непрерывной случайной величины Х. Гипотезы: Н0:FX(x)=F0(x) Н1:FX(x)≠F0(x)
Статистика Колмогорова имеет вид:
Dn=
|F*n(x)-F0(x)|
Эта
статистика, умноженная на
при
имеет распределение Колмогорова
независимо от распределения с.в. Х:
,
где К(х) – функция распределения
Колмогорова, для которой составлена
таблица, которую можно использовать
для расчетов уже при n>=20
α |
0,1 |
0,05 |
0,02 |
0,01 |
0,001 |
x0 |
1,224 |
1,358 |
1,520 |
1,627 |
1,950 |