- •Введение в математическую статистику.
- •15) Лемма Неймана-Пирсона (рэндомизированный и нерэндомизированный вариант).
- •21) Проверка независимости признаков.
- •Пример:
- •24) Общая задача дисперсионного анализа.
- •25) Однофакторный, двуфакторный дисперсионный анализ. Однофакторный дисперсионный анализ
- •Двуфакторный дисперсионный анализ
- •26) Байесовская классификация.
- •27) Общая постановка задачи оценивания.
- •1) Минимаксный подход.
- •2) Байесовский подход
- •28) Достаточные статистики. Критерий факторизации. Достаточные статистики
- •Критерий факторизации
- •29) Условное матожидание, его своиства.
- •30) Теорема о ковариации.
- •31) Теорема Леммана Шафе. Алгоритм построения эффективных оценок.
- •Алгоритм нахождения эффективных оценок
- •32) Примеры вывода полноты.
- •33) Доверительный интервал и примеры. Доверительный интервал.
- •Примеры
- •34) Неравенство Рао-Крамера. Теорема Рао-Крамера
- •Пример 1.
- •Пример 2.
- •Пример 3.
21) Проверка независимости признаков.
22) Критерий Колмогорова, Колмогорова-Смирнова.
Критерий Колмогорова
Лемма Смирнова
Критерий Колмогорова-Смирнова
23) Непараметрические критерии.
Критерий Колмогорова
Критерий Уилкоксона.
Критерий применяется для сравнения двух независимых выборок объема n1 и n2 и проверяет гипотезу H0, утверждающую, что выборки получены из однородных генеральных совокупностей и, в частности, имеют равные средние и медианы.
Статистика W критерия определяется следующим образом. Расположим n1 + n2 значений объединенной выборки в порядке возрастания, т.е. в виде вариационного ряда. Каждому элементу ряда сопоставим в соответствие его номер в ряду – ранг. Если несколько элементов ряда совпадают по величине, то каждому из них присваивается ранг, равный среднему арифметическому их номеров. Последний элемент в ранжированной объединенной выборке должен иметь ранг n1 + n2. Этот факт можно использовать при проверке правильности ранжирования.
Пусть R1 – сумма рангов первой выборки, R2 – сумма рангов второй выборки. Вычислим значения 1 и 2:
Правильность вычислений проверяется по формуле:
Выборочное значение B статистики критерия есть наименьшее из чисел 1 и 2. Существуют специальные таблицы, где приводятся вероятности того, что W < B, при условии, что гипотеза H0 верна, т.е. значения
p = P[W<B/H0]
для выборок объема n1 и n2.
Если объем каждой из выборок больше 8, то проверку гипотезы H0 можно проводить, используя статистику
имеющую (при условии, что верна гипотеза H0) приблизительно нормальное распределение N(0,1). В этом случае гипотеза H0 отклоняется на уровне значимости , если выборочное значение z статистики Z удовлетворяет неравенству
zB < U (или zB > U1-)
при левосторонней (правосторонней) альтернативной гипотезе H1, и если
| zB | > U1-/2
при двусторонней альтернативной гипотезе H1.
Пример:
Роды в срок: 0,80 (3); 0,83 (4); 1,89 (14); 1,04 (7); 1,45 (11); 1,38 (10); 1,91 (15); 1,64 (13); 0,73 (1); 1,46 (12) m=10
Прерванная: 1,15 (8); 0,88 (5); 0,90 (6); 0,74 (2); 1,21 (9) n=5
W=8+5+6+2+9 = 30
= 40
= ;
= -1,225
= 0,01, t= -1,225
D = 0 – не отвергаем.
24) Общая задача дисперсионного анализа.
Пусть сущкствуют векторы Y=X+
X,YRn, Rn, A – матрица mxn Rm – неизвестный вектор (параметр)
cov() = cov(y) = 2E, E= 0.
y1 = x11+ x12+ … + x1mm +
y2 = x212 + x222 + … + x2mm + 2,
матрица x – известна, - не известна.
H0 : HT=0 (можно считать, что =1).
Статистика критерия, который решает эту задачу.
F – критерий. F=(*) - r –ранг X, k – ранг H.
F=x0, yi – не зависимые стандартные случайные величины.
Это распределение Фишера с Fk,n-r степеней свободы.
R02=min (Y-X)T(Y-X)
R12=min (Y-X)T(Y-X) по 1:HT=0
Y=X+
Y
Y-X X
X
x - проекция. R02 – расстояние от Y до X
R0 – длина вектора (Y-X)
(Y-X)X.
(Y-X)X(-1)
- означает, что cov=0 => независимость.
(Y-X) и X(-1) – независимы => независимы и их длины : R02 и (R12-R02)
Значит числитель и знаменатель (*) независимы.
F=-чтобы дисперсия всех величин =1
R0 – сумма координат вектора Y находится в ортогональном дополнении пространства X => размерность общая – n
размерность X - n
=> размерность ортогонального дополнения X=(n-r).
Таблицы дисперсионного анализа.
|
Степени свободы |
Сумма квадратов |
Средний квадрат |
Отклонение от числа H=0 |
k |
R12-R02 |
(R12-R02)/k |
Остаточная сумма квадратов |
n-r |
R02 |
R02/(n-r) |
Полная сумма квадратов |
n-k-r |
R12 |
F |
Y=X+
Проверяем гипотезу HT=0
Решением является F-критерий
Предположим, что R(x)=r; R(H)=k | F – отношение Фишера F=
Если H0 верна, то F имеет распределение Фишера – с n-r степенями свободы
Fk,n-r=
Когда H0 – неверная – нецентральный критерий Фишера.
Очень большие значения.
W : F>t добиваемся P(Fk,n-r>t)=
R1 – сумма квадратов отклонений
R02=min (Y-X)T(Y-X)
R12=min (Y-X)T(Y-X) по 1:HT=0