- •Полные статистики.
- •Свойства условных математических ожиданий.
- •Теорема о построении эффективных оценок
- •Алгоритм нахождения эффективных оценок
- •Неравенство Рао-Крамера. Теорема Рао-Крамера
- •Пример 1.
- •Пример 2.
- •Пример 3.
- •Лемма Неймана-Пирсона ( нерэндомизированный вариант).
- •Лемма Неймана-Пирсона ( рэндомизированный вариант).
- •Статистика
- •Критерий
- •Критерий согласия Пирсона
- •Статистика критерия
- •Правило критерия
- •28) Критерий согласия Пирсона (Хи-квадрат)
- •Поведение, когда гипотезаверна.
- •Поведение, когда гипотезаневерна.
- •Критерий проверки.
- •Границы применимости критерия на практике.
- •Доверительный интервал и примеры. Доверительный интервал.
- •Примеры
- •Общая задача дисперсионного анализа.
- •Однофакторный, двуфакторный дисперсионный анализ. Однофакторный дисперсионный анализ
- •Двуфакторный дисперсионный анализ
- •Байесовская классификация.
- •Дискриминантный анализ
Общая задача дисперсионного анализа.
Пусть сущкствуют векторы Y=X+
X,YRn,Rn,A– матрицаmxnRm– неизвестный вектор (параметр)
cov() =cov(y) =2E,E= 0.
y1 =x11+x12+ … +x1mm +
y2 =x212 +x222 + … +x2mm +2,
матрица x– известна,- не известна.
H0:HT=0 (можно считать, что=1).
Статистика критерия, который решает эту задачу.
F– критерий.F=(*) -r– рангX,k– рангH.
F=x0,yi– не зависимые стандартные случайные величины.
Это распределение Фишера с Fk,n-rстепеней свободы.
R02=min(Y-X)T(Y-X)
R12=min(Y-X)T(Y-X) по1:HT=0
Y=X+
Y
Y-X
X
X
x- проекция.R02– расстояние отYдоX
R0– длина вектора (Y-X)
(Y-X)X.
(Y-X)X(-1)
- означает, что cov=0 => независимость.
(Y-X) иX(-1) – независимы => независимы и их длины :R02и (R12-R02)
Значит числитель и знаменатель (*) независимы.
F=- чтобы дисперсия всех величин =1
R0– сумма координат вектораYнаходится в ортогональном дополнении пространстваX=> размерность общая –n
размерность X-n
=> размерность ортогонального дополнения X=(n-r).
Таблицы дисперсионного анализа.
|
Степени свободы |
Сумма квадратов |
Средний квадрат |
Отклонение от числа H=0 |
k |
R12-R02 |
(R12-R02)/k |
Остаточная сумма квадратов |
n-r |
R02 |
R02/(n-r) |
Полная сумма квадратов |
n-k-r |
R12 |
F |
Y=X+
Проверяем гипотезу HT=0
Решением является F-критерий
Предположим, что R(x)=r;R(H)=k|F– отношение ФишераF=
Если H0верна, тоFимеет распределение Фишера – сn-rстепенями свободы
Fk,n-r=
Когда H0– неверная – нецентральный критерий Фишера.
Очень большие значения.
W:F>tдобиваемсяP(Fk,n-r>t)=
R1– сумма квадратов отклонений
R02=min(Y-X)T(Y-X)
R12=min(Y-X)T(Y-X) по1:HT=0
Билет №32
Однофакторный, двуфакторный дисперсионный анализ. Однофакторный дисперсионный анализ
Предположим, что наши наблюдения: yij=i+iji=1..I,j=1..J
Считаем, что на наблюдения влияет -фактор (например фактор наблюдения)
i–i-ый способ обработки.
влияет ли способ обработки на наблюдение т.е.
H0:==…=
Сначала покажем, что это линейная схема.
Y=;=; Надо чтобыY=Xp+, тогда Х=R(x)=числу столбцов, т.е.R(X)=I
Проверим H0:==…=
Рассмотрим HT
H1T=R(H)=I-1
n=k=I-1;n-r=n-I
Чтобы найти minнадо продифференцировать поk
R02=min;==0
k=yk.некое усреднение
R02=
Предположим, что все iравны и равны
R12=min
если продифференцировать по , получим
k=y..;R12=
R12-R02=;y.. – усреднение по двум параметрам
Двуфакторный дисперсионный анализ
yij=+i+j+ij;i=1..I,j=1..y
Предположим, что ==0
Теперь на наблюдения действуют два фактора
HA=1=…=I=0
HB=1=…=y=0
Пусть существует пшеница разных сортов, она высажена в различных регионах.
Наблюдение – урожайность.
Вопрос – какой сорт лучше.
Но в различных районах – разный урожай, но фактор региона мешает, поэтому на все сорта высаживать, чтобы проверить.
можно наоборот.
- общее решение.
Будем проверять только H
=- независимы,X=
т.к. Y=X+
везде присутствует
Ранг : r=R(x)=I+Y+1-2=I+Y-1
n-r = IY-I-Y+1=(I-1)(Y-1)
Ранг H - ?
HT=
Ранг H : R(H)=Y-1=k
Как вычислять R02иR01
R02=(*)
==0
Метод множителей Лагранжа.
G=Q-21-22
|
просуммируем поi, с учетом, что==0
если (*) дифференцируема по , то получим оценку для
=y..оценка для
=>`=`=0
i=yi.-y..
j=y.j-y..
Подставим в (*)
R12=? предположим, чтоYij=+i+ij(считаем,нет)
получим тоже самое
=y..
i=yi.
R12=;R12-R02=вычислили все для дисперсионного анализа
Билет №33