
- •1. Генеральная совокупность и выборка, вариационный ряд, полигон частот, гистограмма, эмпирическая функция распределения.
- •2. Числовые характеристики выборочного распределения.
- •3. Понятие об оценке параметров. Характеристики оценок.
- •4. Методы нахождения оценок: метод моментов, метод максимального правдоподобия, метод наименьших квадратов.
- •5. Понятие об интервальной оценке параметров. Доверительная вероятность и доверительный интервал.
- •6. Понятие и общая схема проверки статистической гипотезы.
- •7. Проверка гипотез о равенстве средних двух совокупностей.
- •8. Проверка гипотез об однородности выборок.
- •9. Линейная парная регрессия. Коэффициент корреляции.
- •10. Проверка гипотез о зависимости переменных.
- •11. Однофакторный дисперсионный анализ.
10. Проверка гипотез о зависимости переменных.
Ответ:
Проверить значимость уравнения регрессии — значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольким для описания зависимой переменной.
Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.
В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике). Табличное значение определяется в зависимости от уровня значимости () и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости .
Для параметра b критерий проверки имеет вид:
,
где
-
оценка коэффициента регрессии, полученная
по наблюдаемым данным;
– стандартная ошибка коэффициента
регрессии.
Для линейного парного уравнения регрессии стандартная ошибка коэффициента вычисляется по формуле:
.
Для параметра a критерий проверки гипотезы о незначимом отличии его от нуля имеет вид:
,
где
-
оценка параметра регрессии, полученная
по наблюдаемым данным;
–
стандартная ошибка параметра a.
Для линейного парного уравнения регрессии:
.
Для проверки гипотезы о незначимом отличии от нуля коэффициента линейной парной корреляции в генеральной совокупности используют следующий критерий:
,
где ryx - оценка коэффициента корреляции, полученная по наблюдаемым данным; r – стандартная ошибка коэффициента корреляции ryx.
Для линейного парного уравнения регрессии:
.
В парной линейной регрессии между наблюдаемыми значениями критериев существует взаимосвязь:
t(b=0)=t(r=0).
11. Однофакторный дисперсионный анализ.
Ответ:
Дисперсионный анализ - статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.
В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные), а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.
Сущность дисперсионного анализа заключается в расчленении общей дисперсии изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Сравнивая компоненты дисперсии друг с другом посредством F — критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.
Исходным материалом для дисперсионного анализа служат данные исследования трех и более выборок, которые могут быть как равными, так и неравными по численности, как связными, так и несвязными. По количеству выявляемых регулируемых факторов дисперсионный анализ может быть однофакторным (при этом изучается влияние одного фактора на результаты эксперимента), двухфакторным (при изучении влияния двух факторов) и многофакторным (позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие).
Однофакторная дисперсионная модель имеет вид:
где
- значение исследуемой переменной на
i-м уровне фактора (i=1…m)
с j-м порядковым номером
(j=1...n)
- эффект, обусловленный влиянием i-го
фактора
- случайная компонента (возмущение),
вызванное влиянием неконтролируемых
факторов
Основные предпосылки дисперсионного анализа
1. М( ) = 0
2. взаимно независимы
3.
4.
распределено по нормальному закону
Влияние уровней фактора может быть фиксированным (модель 1) или случайным (модель 2).
Схему дисперсионного анализа представим в виде таблицы.
Компоненты |
Межгрупповая |
Внутригрупповая |
Общая |
Сумма квадратов |
|
|
|
Число степеней свободы |
m – 1 |
mn – m |
mn – 1 |
Средний квадрат |
|
|
- |
Матожидание среднего квадрата |
|
|
- |
Гипотеза Н0 примет вид
,
т.е. влияние всех уровней фактора
одинаково. В случае справедливости этой
гипотезы
.
Гипотеза Н0 отвергается, если фактическое вычисленное значение статистики
больше критического
,
определенного на уровне значимости
при числе степеней свободы
и
по таблице для распределения
Фишера-Снедекора.
Если
,
то гипотеза Н0 принимается.