- •1. Теорема умножения вероятностей.
- •[Править]Проверка ограничений на параметры регрессии
- •[Править]Замечание
- •[Править]Проверка значимости линейной регрессии
- •[Править]Пример
- •2. Теорема сложения вероятностей.
- •3. Вероятность наступления хотя бы одного из нескольких попарно независимых событий.
- •Примеры f-тестов
- •Две выборки
- •Замечание
- •Проверка значимости линейной регрессии
[Править]Проверка ограничений на параметры регрессии
Статистика теста для проверки линейных ограничений на параметры классической нормальной линейной регрессии определяется по формуле:
где
-количество
ограничений, n-объем выборки, k-количество
параметров модели, ESS-сумма квадратов
остатков модели,
-коэффициент
детерминации, индексы S и L относятся
соответственно к короткой и длинной
модели (модели с ограничениями и модели
без ограничений).
[Править]Замечание
Описанный выше F-тест является точным в случае нормального распределения случайных ошибок модели. Однако F-тест можно применить и в более общем случае. В этом случае он является асимптотическим. Соответствующую F-статистику можно рассчитать на основе статистик других асимптотических тестов - теста Вальда (W), теста множителей Лагранжа(LM) и теста отношения правдоподобия (LR) - следующим образом:
Все эти статистики асимптотически имеют распределение F(q,n-k), несмотря на то, что их значения на малых выборках могут различаться.
[Править]Проверка значимости линейной регрессии
Данный тест очень важен в регрессионном анализе и по существу является частным случаем проверки ограничений. В данном случае нулевая гипотеза - об одновременном равенстве нулю всех коэффициентов при факторах регрессионной модели (то есть всего ограничений k-1). В данном случае короткая модель - это просто константа в качестве фактора, то есть коэффициент детерминации короткой модели равен нулю. Статистика теста равна:
Соответственно, если значение этой статистики больше критического значения при данном уровне значимости, то нулевая гипотеза отвергается, что означает статистическую значимость регрессии. В противном случае модель признается незначимой.
[Править]Пример
Пусть
оценивается линейная регрессия доли
расходов на питание в общей сумме
расходов на константу, логарифм совокупных
расходов, количество взрослых членов
семьи и количество детей до 11 лет. То
есть всего в модели 4 оцениваемых
параметра (k=4). Пусть по результатам
оценки регрессии получен коэффициент
детерминации
.
По вышеприведенной формуле рассчитаем
значение F-статистики в случае, если
регрессия оценена по данным 34 наблюдений
и по данным 64 наблюдений:
Критическое
значение статистики при 1% уровне
значимости (в Excel функция FРАСПОБР) в
первом случае равно
,
а во втором случае
.
В обоих случаях регрессия признается
значимой при заданном уровне значимости.
В первом случае P-значение равно 0,1%, а
во втором - 0,00005%. Таким образом, во втором
случае уверенность в значимости регрессии
существенно выше (существенно меньше
вероятность ошибки в случае признания
модели значимой).
Событие В происходит после события А, при этом условия меняются- общее количество шаров уменьшилось и стало равно 8, поэтому события А и В зависимые и речь идет об условной вероятности события В: РА(В)=4/8=1/2. Событие С происходит после событий А и В , поэтому вероятность его тоже условная РАВ(С)=2/7. Вероятность же их совместного появления :
