
- •1. Распределения, связанные с суммой случайных величин
- •1.1 Распределение Стьюдента
- •1.2 Распределение Фишера
- •2. Проверка гипотез
- •3. Отсев грубых измерений
- •3.1 Общие положения
- •3.2 Отсев грубых измерений по малым выборкам
- •3.3 Исключение грубых погрешностей
- •4. Свободные от распределения методы
- •4.1 Критерий об однородности двух выборок
- •4.2 Проверка гипотезы о некоррелированности
- •5. Регрессионный анализ
- •5.1 Модель регрессии
- •5.2 Анализ ошибок
- •5.3 Дисперсия оценок параметров регрессии
- •5.4 Коэффициент корреляции
- •5.5 Доверительный интервал
- •5.6 Проверка значимости коэффициента корреляции
- •5.7 Значимость коэффициента детерминации
- •5.8 Значимость оценок параметров регрессии
5.2 Анализ ошибок
1. Перепишем
выражение
в виде
(5.13)
На случайную
величину
накладываются условия:
случайные величины распределены по нормальному закону с математическими ожиданиями и ковариационными моментами, равными
(5.14)
На матрицу
накладывается ограничение. Матрица
- невырожденная матрица, т.е. существует обратная матрица
. Это условие в свою очередь приводит к требованию: ранг матрицы должен быть равен . Из этого мы получаем ограничение на число экспериментов:
, т.е. число параметров должно быть меньше числа испытаний.
3. Функции
и случайные величины
не коррелированы.
При выполнении этих условий оценки по методу наименьших квадратов (МНК) будут несмещенными, состоятельными и эффективными [2].
Как следствие, будем иметь
,
.
(5.15)
Дисперсия
составляющих вектора
равна диагональным элементам матрицы
.
Обычно дисперсия
неизвестна. Поэтому пользуются её
оценкой.
Из выражения (5.13)
имеем
,
где
предсказание
величины
по экспериментальным данным с помощью
оценок
.
Из выражения (5.12) можно получить
.
Тогда оценка дисперсии шума будет равна
.
(5.16)
Рассмотрим оценку дисперсии
,
(5.17)
где
,
- результат измерений.
Выборочная дисперсия
может быть представлена в виде суммы
оценки дисперсии шума
и оценки дисперсии значений регрессии
.
Распишем сумму в (5.17)
,
(5.18)
где
.
Последний член в (5.18) можно представить как
.
(5.19)
Как видно из (5.19)
последний член в (5.18) представляет собой
разность среднего значения произведения
и среднего значения шума. В силу того,
что
и
независимы при большом числе экспериментов,
среднее значение произведения будет
равно нулю. Так как
,
то и среднее значение шума будет равно
нулю. Отсюда следует, что последний член
в (5.18) равен нулю. Запишем (5.17) в виде
(5.20)
или
,
(5.21)
где,
,
.
(5.22)
Ввиду того, что
,
оценка
будет иметь
степень свободы. При оценке дисперсии
используется
независимых объясняющих переменных
(модель (5.6)). Поэтому оценка дисперсии
имеет
степеней свободы (
).
Число степеней свободы оценки дисперсии
равно разности
.
Дисперсия зависит от случайных неучтенных факторов во время эксперимента и называется остаточной дисперсией (или необъясненной дисперсией).
Дисперсия
зависит от значений независимых
переменных
и определяется также правильностью
выбора функции
.
Поэтому дисперсию
называют дисперсией,
обусловленной регрессией, или объясненной
регрессией
[9]. Соотношение между дисперсиями
и
показывает,
какой вклад в общую оценку дисперсии
вносит случайность и функциональная
зависимость
.
Чем больше
,
тем теснее связь между переменными y
и x.
Мерой влияния переменной x
на y
выбрана функция
,
(5.23)
показывающая долю
участия независимой переменной x
в формировании зависимой переменной
и называется коэффициентом
детерминации
[9]. Из формулы (5.21) очевидно, что
(5.24)
Чем ближе
к 1, тем « более точно » экспериментальные
значения отражают суть исследуемого
явления. При
соотношение между y
и x
будет строго линейным (
)
в смысле формулы (5.5) относительно
параметров
.
Если
,
т.е.
,
то статистическая связь между переменными
y
и x
отсутствует.
Относительное влияние случайностей на регрессию учитывается соотношением
(5.25)
Величина
может служить мерой неопределенности
при построении модели регрессии. Чем
больше
,
тем неопределеннее становится связь
между y
и x.
Исходя из определений
и
,
получим связь
.
(5.26)
Формула (5.26) может быть применена для проверки правильности вычислений.
При вычислении
оценок дисперсий
использовался один и тот же множитель
-
.
В результате оценки
и
будут смещенными оценками. Введем
коэффициент детерминации
,
вычисленный по
несмещенным оценкам остаточной дисперсии
и выборочной дисперсии. Коэффициент
детерминации
используется при сравнении двух линий
регрессии с разным количеством объясняющих
переменных
и
.
Предпочтение отдается той линии
регрессии, для которой коэффициент
детерминации
больше [9].