- •Глава 6. Основные принципы построения регрессионных моделей
- •6.1 Парная корреляция и регрессия
- •6.2 Определение параметров выборочного уравнения прямой линии
- •6.3 Оценка тесноты линейной корреляционной связи переменных х и y
- •6.4 Оценка точности определения значений зависимой переменной по уравнению регрессии
- •6.5 Коэффициент детерминации
- •6.6 Проверка адекватности уравнения регрессии и ошибки предсказаний
- •6.7 Три показателя корреляции и регрессии, их значение и применение
- •6.8 Множественный корреляционно-регрессионный анализ
- •То есть,
- •6.9 Нелинейная парная регрессия и криволинейная корреляция
- •Функции и линеаризующие преобразования
- •Пример синтеза линейной регрессионной модели
- •4 5 6 7Рис 6.1. Исходные данные зависимости плотности прессовок от давления прессования р
- •Исходные данные и вспомогательные расчеты
- •Данные вспомогательных расчетов для вычисления Fрасч.
- •6.11 Пример выбора функциональной зависимости для описания парной нелинейной корреляционной связи переменных
- •Давления прессования р
- •Рассматриваемые функциональные зависимости и их параметры
- •6.12 Вопросы для самоконтроля
6.2 Определение параметров выборочного уравнения прямой линии
Предположим, что проведено п независимых опытов, в результате которых получены п пар чисел:
, … … ,
где у1, у2, … уn – математические ожидания ординат функции.
Можно рассчитать средние арифметические наблюдаемых значений переменных Х и Y по уравнениям:
; (6.2)
. (6.3)
и их стандартные отклонения по уравнениям:
; (6.4)
. (6.5)
Здесь i – порядковый номер аргумента xi и соответствующего ему математического ожидания ординаты функции уi;
– знак, обозначающий сумму всех n значений xi и yi.
Поскольку наблюдаемые пары чисел можно рассматривать как случайную выборку из генеральной совокупности всех возможных значений случайных величин Х и Y, то величины и уравнения, найденные по этим данным, называют выборочными.
Будем искать выборочное уравнение прямой линии регрессии Y на Х:
(6.6)
Угловой коэффициент прямой линии регрессии Y на X – b1 принято называть выборочным коэффициентом регрессии Y на Х. Часто применяют обозначение коэффициента регрессии .
Способ определения параметров уравнения регрессии – метод наименьших квадратов. При этом методе принимается, что сумма квадратов отклонений значений уi от вычисленных по уравнению регрессии значений для соответствующих значенийхi, т.е. от искомой линии регрессии должна быть минимальной:
(6.7)
Значения параметров уравнения регрессии могут быть найдены по формулам:
; (6.8)
. (6.9)
Необходимо проверить гипотезу о статистической значимости коэффициентов регрессии, иными словами, проверить, существенно ли их величина отличается от 0.
Оценку статистической значимости коэффициентов регрессии устанавливают на основе t-критерия Стьюдента. Расчётное значение t-критерия определяют для каждого коэффициента регрессии из соотношения:
, (6.10)
где – стандартная ошибка коэффициента bi, величина которой в общем случае может быть определена по формуле:
(6.11)
Если выполняется соотношение:
, (6.12)
то коэффициент регрессии bi признаётся статистически значимым при выбранном уровне значимости α. Если же это соотношение не выполняется, то коэффициент b1 признаётся незначимым. Следовательно, можно соответствующее слагаемое исключить из уравнения регрессии.
Если при каждом из n значений аргумента было выполнено одинаковое количество m параллельных измерений ординат функцииY, то с помощью критерия Кохрена проверяют воспроизводимость эксперимента. Расчётное значение критерия Кохрена определяют по формуле:
, i = 1 … n. (6.13)
где – максимальная из п дисперсий ординат при всех значениях , а дисперсия ординат , соответствующих значениям аргументов , величину которой вычисляют по формуле:
; j = 1 … m. (6.14)
Если выполняется соотношение:
Gрасч. ≤ Gтабл. α, n(m – 1), (6.15)
то эксперимент признают воспроизводимым. При этом ошибку опытов оценивают как среднеквадратичную ошибку при определении средних значений из измерений, выполненных при значениях , по формуле:
. (6.16)