
- •1. Распределения, связанные с суммой случайных величин
- •1.1 Распределение Стьюдента
- •1.2 Распределение Фишера
- •2. Проверка гипотез
- •3. Отсев грубых измерений
- •3.1 Общие положения
- •3.2 Отсев грубых измерений по малым выборкам
- •3.3 Исключение грубых погрешностей
- •4. Свободные от распределения методы
- •4.1 Критерий об однородности двух выборок
- •4.2 Проверка гипотезы о некоррелированности
- •5. Регрессионный анализ
- •5.1 Модель регрессии
- •5.2 Анализ ошибок
- •5.3 Дисперсия оценок параметров регрессии
- •5.4 Коэффициент корреляции
- •5.5 Доверительный интервал
- •5.6 Проверка значимости коэффициента корреляции
- •5.7 Значимость коэффициента детерминации
- •5.8 Значимость оценок параметров регрессии
5.6 Проверка значимости коэффициента корреляции
Для простой линейной
модели регрессии
п
осле
проведения эксперимента необходимо
проверить существует ли статистическая
связь между независимой переменной
и зависимой переменной
.
Для этого производят оценку коэффициента
корреляции
(5.34) и проверяют значимость величины
коэффициента корреляции
.
Положим, коэффициент корреляции
генеральной совокупности равен
.
Если между переменным
и
отсутствует статистическая связь, то
= 0. Тогда следует ожидать, что и
будет близок к нулю. Если величина
незначимо отклоняется от нуля, то
следует, что
= 0; если величина
значима, то
0.
В результате возникает задача проверки гипотезы H0 о том, что = 0 против сложной гипотезы H1 о том, что 0. Решение об истинности той или иной гипотезы принимается на основе анализа оценки коэффициента корреляции .
Плотность распределения вероятностей оценки имеет сложный вид [4, стр.50]. Однако, если случайные величины х и у распределены по нормальному закону и не коррелированы ( = 0), то случайная величина
(5.40)
распределена по закону Стьюдента с степенью свободы.
Для проверки гипотезы H0 , проводятся следующие вычисления.
ищется порог
,
который определяет критическую область
{(-
,
-
)
, (
,
)},
удовлетворяющую равенству, (Рис. 5.2):
,
(5.41)
2. Вычисляется статистика , затем вычисляется статистика T.
3. Производится сравнение статистики T с порогом .
Если
| T
| > |
|, тогда гипотеза H0
отвергается. При этом допускается ошибка
в
100
случаях из 100 экспериментов. Если | T
| <
,
гипотеза H0
не отвергается. При
0 применяется преобразование Фишера. В
этом случае из физических соображений
выбирается величина
и проверяется гипотеза H0
о том, что
,
против односторонней альтернативной
гипотезы H1
о том, что
.
Для проверки гипотезы H0
против альтернативной гипотезы H1
применяется статистика [9, стр.195]
,
которая имеет t – распределение с n-2 степенями свободы.
Критическое
значение
по требуемому уровню значимости
ищется как решение уравнения``
где
–
плотность вероятности t
– распределения.
Затем
вычисляется статистика Т и сравнивается
с порогом
.
Если Т >
,
гипотеза H0
отвергается.
При
n
20 статистика
(5.42)
распределена
по нормальному закону с математическим
ожиданием
и дисперсией
,
[4, стр. 50].
Порог ищется как решение уравнения
.
5.7 Значимость коэффициента детерминации
Ранее
был введен коэффициент детерминации
=
,
определяющий относительный вклад
дисперсии оценки зависимой переменной
в оценку общей дисперсии. Оценки
и
являются случайными величинами. Отношение
этих величин будет также случайной
величиной.
Проверим
гипотезу Н0
о том, что все параметры
(j=0,…,m).
Это значит, ни одна из функций
не оказывает влияния на зависимую
переменную y.
Альтернативной
гипотезой Н1
будет утверждение, что хотя бы один
параметр
оказывает влияние на зависимую переменную
y.
В этом случае проводится односторонняя
процедура проверки гипотезы Н0
против альтернативной гипотезы Н1.
Для проверки
значимости коэффициента детерминации
используется статистика [3]
(5.43)
которая
распределена по закону Фишера (F
– распределение) с числом степеней
свободы
и
,
- количество учитываемых объясняющих
переменных.
По
уровню значимости
и таблицам F
– распределения определяется порог
и критическая область отклонения
гипотезы Н0,
в то время, как она верна. Если вычисленная
величина
,
гипотеза Н0
отвергается. Условие
означает, что коэффициент детерминации
значимо отличается от нуля, т.е. вклад
хотя бы одного параметра
в построение линии регрессии значителен.