Скачиваний:
175
Добавлен:
01.05.2014
Размер:
285.7 Кб
Скачать

39. Различные постановки задач проверки статистических гипотез. Задачи проверки согласия, однородности, независимости, случайности. Основной метод построения критериев значимости. Альтернативы и различимость.

При анализе различных типов данных возможны различные постановки задач.

Проверка согласия.

Тип данных:

а) однородные – выборка

б) неоднородные – со связями (регрессионная модель)

Гипотеза согласия:

Задача проверки гипотезы согласия в указанной модели – задача проверки согласия (обычно используется ранговый критерий)

Проверка однородности:

Тип данных :

Две (несколько) выборок ~F, ~G

() – независимы

Гипотеза однородности:

(т.е. X1 и Y1 имеют одинаковое распределение)

Проверка независимости:

Тип данных:

Выборка из k-мерного распределения с функцией распределения F=F(x1…xn), Fi – распределение компонент.

Гипотеза независимости:

- это задача проверки независимости.

Проверка случайности:

х1,…,хn – какие-то наблюдения (не обязательно независимые, но обязательно одинаово распределенные)

Гипотеза случайности:

Θ – множество всех распределений

Θ0 – множество распределений с независимыми и одинаово распределенными компонентами.

Альтернативы и различимость:

Например:

- при альтернативе

Как можно их точно различить?

При фиксированном количестве данных нельзя (!) сказать, что H0 верна с какой-либо вероятностью (т.к. близкие параметры не различимы). При определенных условиях регулярности граница различимости О(1/)

, n- число данных

Если не рассматривать альтернативу, то критерии, решающие задачи без альтернативы, наз-ся критерий значимости.

Проверка значимости

Ответ: Н0 отвергается на уровне α либо Данные не противоречат Н0.

Методы построения критерия значимости

Пусть

- основная гипотеза.

Задача- построить критерий значимости уровня α.

Статистика критерия .

а) - не зависит от параметра при .

б) распределение не зависит от параметра при (если (б) сохраняется и при , то такой критерий бессмысленен).

Распределение известно (напр. ф.р. - G(x)).

Тогда нерандомизованный критерий строиться:

Возможен асимптотический подход.

40. Проверка гипотез о параметрах нормального распределения.

На примере критерия Стьюдента.

1)Данные - выборка из . - неизв.

Задача параметрическая.

Гипотеза: а=а0 (сложная гипотеза, т.к. σ неизвестно).

Критерий Стьюдента:

Статистика критерия .

- не зависит от мешающего параметра.

При θ=0)

- не зависит от θ.

Распределение ~Sn-1

Распределение Стьюдента симметрично

Принимаем гипотезу, если она попала в интервал (<tα), иначе отвергаем.

2) 2 выборки. По двум выборкам обычно выбирается с одинаковыми дисперсиями. Надо построить статистику для проверки гипотезы однородности.

.

41. Критерий согласия Колмогорова.

Пусть х1…хn – выборка из непрерывного распределения в ф.р. F – полностью неизв. F0 – фиксированная ф.р.

(простая гипотеза согласия, но не параметрическая, т.к. ф-я многомерная).

Критерий Колмогорова:

Статистика критерия: , Fn(x) – выборочная (эмпирическая) ф.р.

Асимптотический критерий , , К – ф.р. Колмогорова.

Для вычисления Dn достаточно вычислить , , , .

Вар.ряд

X(1)

X(2)

F0(Xi)

||

A

||

B

max(A,B)

||

C

42. Критерий хи-квадрат для проверки простой гипотезы согласия.

Разбивается вся вещественная прямая на зоны.

Ø, Ii - интервал

Данные группируются (гистограмма)

ni – число наблюдений в i-й зоне

Ii – зона

Проверка:

H0 : F=F0 (простая гипотеза)

ni можно назвать частотами, ni – выборочные вероятности .

При справедливости H0 рассмотрим теоретические вероятности

- теоретические вероятности попадания в зону.

Статистика критерия

Предельное распределение

X

Рассмотрим случайный вектор (n1…nr) имеет мультиномиальное распределение

Матрица ковариации

Известно, что, если X~Nk(0,D)

XTD-1X~

Критерий (ас.)

43. Критерий хи-квадрат для проверки сложной параметрической гипотезы согласия.

,,

Например: x1…xn~N(a,σ2)

H0 : a=a0

dimΘ0=1

Возможны

H0 :x1~N(a,σ2), a,σ2 – неизв.

dimΘ0=2

Поставим задачу проверки значимости

ni – частоты

pi(θ) – зависит от θ

-не является статистикой даже при Н0

I. Мультиномиальное ОМП

ni~мульт.распр-е (p1(θ),…, pn(θ))

Мульт. функция правдоподобия

Если pi – дифф-мы

Решая это уравнение, получиться оценка (мультиномиальная) ОМП

! Нельзя использовать ОМП по не группированным данным.

Пусть - мультиномиальное ОМП

Выберем статистику

критерия для сложной гипотезы

II.

Утверждение: пусть p(θ) – дважды дифф. по θ.

Матрица имеет ранг m –полный ранг, тогда ~ и

44. Постановка задач линейной регрессии. Метод наименьших квадратов. Геометрическая интерпретация. Оценка по методу наименьших квадратов. Примеры.

Линейная регрессия.

Модель:

Y1,…,Yn – независимые (некоррелированные) наблюдения

Пусть предполагается, что справедлива следующая модель .

- наблюдения (отклики), X’ – n*m –матрица (известны, характеризуют условия проверки эксперимента). Отклики линейно зависят от условий через параметр β. β – неизвестный параметр = . -ошибка (шумы).

Основные предположения:

а)

б)

- мешающий параметр – неизвестен.

В условиях (а), (б) EY=X’β.

Задача точечного оценивания – построить оценки параметра β при мешающем параметре .

Оценка по методу наименьших квадратов (МНК)

, где норма

Примеры:

1) Измерительный прибор

/некор. О.Р.С.В./

Прямая на плоскости . - хар-ка процесса.

В матричной форме - нормальные уравнения. Если rk(XXT)=m (т.е. rkX=m), то матрица будет обратимой , получаем -оценка по МНК.

Геометрическая интерпретация:

– i-я строка матрицы X’, то .

.

- столбец. -расстояние между элементами Y и X’b.

Вывод: решение существует.

45. Функции параметра, допускающие несмещенную оценку (ДНО). Теорема Гаусса-Маркова.

Определение: линейная функция параметра называется ДНО - функцией, если существует такая матрица А – матрица оценки, т.ч. .

Лемма: Сβ – ДНО матрица S: С=SX’

Док-во: Сβ – ДНО , . Ч.т.д.

Теорема (Гаусса-Маркова): Пусть - ДНО – функция. Тогда несмещенная оценка . , т.ч. С=AX’ (т.е. столбцы С – элементы Vm). Данная оценка – оценка по МНК. Пусть - другая лин. несм.оценка, тогда (т.е. - НРМД оценка в классе линейных оценок).

3