
- •Тема 2. Корреляционный и регрессионный анализ
- •2.1. Корреляция
- •2.2. Парная линейная регрессия. Метод наименьших квадратов
- •2.3. Множественная линейная регрессия
- •2.4. Проверка значимости (адекватности) уравнения регрессии в целом
- •2.5. Проверка значимости коэффициентов регрессии
- •2.6. Выбор оптимального уравнения парной регрессии
2.6. Выбор оптимального уравнения парной регрессии
Парная регрессия – это когда уравнением описывается зависимость функции от одного фактора . При определении вида аналитического выражения связи между и в первую очередь следует учитывать физическую сущность изученного явления. Если исследователь такой информацией не располагает, то единственным подходом является последовательный перебор основных видов уравнений: 1) линейной; 2) логарифмическое; 3) экспоненциальное; 4) степенное; 5) полином второго порядка; 6) полином третьего порядка.
1)
; (1)
2)
; (2)
3)
; (3)
4)
; (4)
5)
; (5)
6)
. (6)
Программа «Регрессия» рассчитывает коэффициенты регрессии только линейной регрессии вида (1). Однако по виду нелинейные уравнения (2) - (6) можно линеаризовать, т.е. привести к линейному виду.
Например, рассмотрим степенную модель (4). Прологарифмируем левую и правую части:
. (7)
Введем новые переменные:
;
;
;
.
Тогда (7) можно записать так:
. (8)
Теперь (8) – линейная модель. К ней можно
применять МНК. В программу в качестве
исходных массивов нужно ввести
;
.
Здесь
- экспериментальные данные.
В результате расчетов получим значения
и
.
Затем выполним обратное преобразование,
заключающееся в определении
и
по
и
.
В рассматриваемом примере
;
.
Таким образом, для определения оптимального вида уравнения регрессии по массивам исходных данных и необходимо получить все 6 видов уравнения. Лучшим будет то, у которого больше « -квадрат» (коэффициент детерминации); (расчетное значение коэффициента Фишера) и меньше «Значимость » ( , соответствующее ).
Пример. Предприятие «Импульс»
за месяц произвело 2000 приборов. Это
генеральная совокупность. Из нее сделали
выборку в объеме 11 приборов (
).
Выборка из генеральной совокупности,
объемом 2000 приборов, выполнена с
использованием генератора случайных
чисел (каждый прибор имеет № от 1 до
2000). Для них путем замеров (стендовых
испытаний) определены технические
характеристики.
№ п/п |
Чувствительность прибора, мкВ/м
|
Частота распознаваемого сигнала, мГц
|
1 |
90 |
10,07 |
2 |
96 |
9,73 |
3 |
92 |
10,04 |
4 |
98 |
9,82 |
5 |
86 |
10,57 |
6 |
88 |
10,02 |
7 |
98 |
9,67 |
8 |
90 |
9,98 |
9 |
86 |
10,51 |
10 |
92 |
9,92 |
11 |
90 |
9,93 |
На основе выборочного обследования необходимо сделать заключение о степени и характере зависимости предельной частоты распознаваемого прибором сигнала от его чувствительности. Для этого необходимо построить все уравнения регрессии (№ (1) – (6)) и выбрать лучшее уравнение.
Замечание: для получения уравнения
(5) необходимо организовать и указать
два массива (
и
);
для получения уравнения (6) - три массива
(
,
и
).