
- •200106 «Информационно-измерительная техника и технологии»
- •Введение
- •1.2. Сигналы
- •1.3. Преобразование измерительных сигналов
- •1.4. Спектр периодических сигналов
- •1.5. Модуляция
- •1.5.1. Амплитудная модуляция
- •1.5.2. Частотная модуляция
- •1.5.3. Фазовая модуляция
- •1.5.4. Двукратные виды модуляции
- •1.6. Квантование
- •1.6.1. Квантование по уровню
- •1.6.2. Квантование по времени
- •1.6.3. Квантование по уровню и времени
- •1.7. Кодирование
- •1.7.1. Цифровые коды
- •1.7.2. Помехи
- •1.8. Модель канала
- •Раздел 2 измерительные каналы и их разделение
- •2.1. Канал связи и его характеристики
- •2.2. Согласование канала с источником информации
- •2.3. Линии связи для передачи измерительной информации
- •2.4. Структуры линий связи
- •2.5. Многоканальные системы для передачи измерительной информации
- •2.6. Погрешность систем с частотным разделением каналов
- •2.7. Погрешности систем с временным разделением каналов
- •Раздел 3 принципы обработки данных
- •3.1. Виды погрешностей
- •3.2. Обработка результатов измерений. Оценки измеряемой величины
- •3.3. Обработка результатов прямых равноточных измерений
- •3.4. Обработка результатов косвенных измерений
- •3.5. Обработка результатов совместных измерений
- •3.6. Обработка результатов неравноточных измерений
- •3.7. Проверка статистических гипотез
- •3.7.1. Проверка соответствия гипотезы и экспериментальных данных
- •3.7.2. Исключение резко отклоняющихся значений
- •3.8. Построение эмпирических распределений
- •3.9. Критерии согласия
- •3.9.1. Критерий согласия Пирсона
- •3.9.2. Критерий согласия Колмогорова
- •Раздел 4 планирование многофакторного эксперимента
- •4.1. Задачи планирования эксперимента
- •4.2. Пассивные эксперименты
- •4.3. Дисперсионный анализ
- •4.4. Регрессионный анализ
- •4.5. Активный эксперимент
- •4.6. Полный факторный эксперимент
- •4.7. Дробный факторный эксперимент
- •4.8. Устранение влияния временного дрейфа
- •4.9. Проведение факторного эксперимента и обработка его результатов
- •4.10. Оптимизация
- •4.11. Рандомизация
- •Раздел 5 введение в алгоритмическую теорию измерений
- •5.1. Вводные замечания
- •5.2. Развитие понятий числа и измерения величин
- •5.3. Теория шкал и алгоритмические измерения
- •5.4. Алгоритмы измерения в номинальной шкале, аддитивной и порядка
- •5.5. Моделирование цифровых алгоритмических измерений
- •5.6. Эквивалентность между фильтрацией и алгоритмическим измерением
- •5.7. Моделирование сигналов. Дискретизация
- •5.7.1. Модели дискретизации аналогового сигнала
- •5.7.2. Дискретизация с усреднением
- •5.7.3. Дискретизация сигналов конечной длительности
- •5.8. Цифровое представление информации
- •5.9. Системы счисления с иррациональными основаниями
- •5.9.1. Золотая пропорция
- •5.9.2. Числа Фибоначчи
- •5.9.4. Код золотой p-пропорции
- •5.10. Общий алгоритм метрологического кодирования
- •5.10.1. Алгоритм Стахова
- •5.10.2.Фибоначчиевы алгоритмы цифрового метрологического кодирования
- •Раздел 6 введение в информационную теорию измерений
- •6.1. Основные положения теории информации
- •6.1.1. Энтропия
- •6.1.2. Единицы измерения энтропии
- •6.1.3. Условная энтропия (энтропия помехи)
- •6.1.4. Суммирование нескольких погрешностей
- •6.1.5. Явление «краевой эффект». Приближенность информационных оценок каналов передачи информации
- •6.1.6. Основные положения теории информации для характеристики процесса измерения
- •6.2. Сущность измерения
- •6.2.1. Понятие натурального ряда однородных величин
- •6.2.2. Понятие шкалы реперов измеряемой величины
- •6.2.3. Измерение как сужение интервала неопределенности
- •6.3. Измерительные преобразования, функциональные шкалы, единицы измеряемой величины
- •6.3.1. Функциональная шкала измеряемой величины
- •6.3.2. Понятие единицы измерения
- •6.3.3. Метод построения измерительных устройств
- •6.4. Измерительные преобразования и преобразователи
- •6.5. Энтропийное значение погрешности
- •6.5.1. Математическое определение энтропийного значения погрешности
- •6.5.2. Эффективное значение погрешности
- •6.6. Сравнение энтропийного и среднеквадратического значений погрешности для плавных симметричных одномодальных законов распределения погрешностей
- •6.7. Энтропийное значение погрешности – основной критерий точности приборов и измерений
- •6.8. Определение энтропийного значения погрешности на практике
- •6.9. Суммирование погрешностей измерительных устройств
- •6.10. Статистическое суммирование погрешностей при наличии корреляции
- •6.11. Энтропийное значение результирующей погрешности
- •6.12. Суммирование погрешностей с равномерными законами распределения вероятностей
- •6.13. Суммирование погрешностей при равномерном и нормальном законах распределения составляющих результирующей погрешности
- •6.14. Суммирование погрешностей при произвольной степени корреляции и произвольных законах распределения вероятностей составляющих результирующей погрешности
- •И объемов (n) выборок
- •Интервала
- •Оглавление
4.4. Регрессионный анализ
Регрессионный анализ служит для нахождения по результатам эксперимента связи выходной характеристики устройства (процесса) с факторами, которые влияют на эту характеристику.
В качестве модели регрессии используются прямая линия или различные математические кривые: участки параболы, гиперболы, экспоненты и т.п. Экспериментальные данные могут быть аппроксимированы с требуемой точностью функциями различного вида, поэтому выбор вида функции не может быть формализован. Его осуществляет экспериментатор, руководствуясь следующими соображениями: регрессионная модель должна быть простой, удобной для дальнейшего использования и адекватной. Под адекватностью модели понимают ее способность предсказывать с требуемой точностью значения у в некоторой области значений х. Вид модели выбирают таким образом, чтобы при обязательном соблюдении адекватности она была наиболее простой и удобной.
На практике во многих случаях приближенно («на глаз») графически проводят линию, описывающую зависимость среднего значения у от х, и, исходя из ее вида, выбирают регрессионную модель.
Очень часто зависимость y от x можно принять линейной (линейная модель):
(4.4.1)
Для упрощения способов нахождения коэффициентов регрессии важно принять следующие допущения:
1. результаты наблюдений у1, у2, ..., уi, ..., уп (где п – число наблюдений над величиной y) представляют собой независимые, нормально распределенные случайные величины;
2. дисперсии D(yi) равны друг другу, или пропорциональны какой-то известной функции Ф(y);
3. переменные х1, x2, ..., xk являются независимыми и измеряются с пренебрежимо малой погрешностью по сравнению с величиной [yi].
Методы вычисления коэффициентов регрессии базируются обычно на аппарате матричного исчисления; при этом в наиболее громоздких случаях используются стандартные программы на ЭВМ.
Результаты эксперимента записываются в виде матрицы наблюдавшихся значений:
(4.4.2)
По этим данным можно найти точечные оценки коэффициентов регрессии. Для этого, используя метод наименьших квадратов, составляют n несовместных уравнений:
(4.4.3)
Из этой системы уравнений можно определить (k + 1) коэффициентов регрессии. Решение делают в матричной форме. Всю систему уравнений записывают в матричной форме в виде ХA = Y, где:
(4.4.4)
Матрицу
при этом
определяют из уравнения
(4.4.5)
где
– транспонированная матрица A;
– обратная матрица произведения
С = ХТХ,
равная
= (ХТХ)-1.
В
соответствии
с
этим уравнением для получения матрицы
A
(а
значит, и всех оценок коэффициентов
регрессии) необходимо произвести ряд
преобразований, которые хотя и
являются стандартными в матричном
исчислении, но в общем виде не наглядны,
поэтому ход таких вычислений
представлен ниже на конкретном числовом
примере.
Пример 4.4.1. Результаты эксперимента представлены в таблице.
N |
x1 |
x2 |
y |
N |
x1 |
x2 |
y |
N |
x1 |
x2 |
y |
1 |
0 |
0 |
10 |
4 |
1 |
0 |
14 |
7 |
2 |
2 |
40 |
2 |
0 |
1 |
17 |
5 |
2 |
0 |
18 |
8 |
0 |
-1 |
3 |
3 |
0 |
2 |
20 |
6 |
1 |
1 |
24 |
9 |
-1 |
-1 |
3 |
Число факторов k = 2. Количество опытов п = 9.
Необходимо провести регрессионный анализ, определив значения коэффициентов регрессии.
Решение. Пусть полином для функции у (модель) линейный:
Составим матрицу X и транспонированную матрицу:
Найдем произведение
,
складывая почленно произведения
элементов строк
и столбцов X:
Для вычисления обратной матрицы (ХТХ)–1 найдем сначала определитель матрицы ХТХ:
= 9 (11 12 – 6 6) – 5 (5 12 – 4 6) + 4 (5 6 – 4 11) = 628.
Матрицу (ХТХ)–1 составим из определителя и дополнений матрицы ХТХ:
Далее запишем матрицу Y и найдем произведение ХТY:
Далее
Таким образом: a0 = 10,65; a1 = 5,2; a2= 6,8, и уравнение регрессии получает следующий конкретный вид:
y = 10,65 + 5,2 х1 + 6,8 х2.
Далее необходимо проихвести проверку адекватности полученного уравнения опытным данным. Это необходимо, так как вид зависимости был заранее неизвестен и выбирался наиболее простой.
Адекватность проверяют обычно по критерию Фишера F:
. (4.4.6)
Оценку
дисперсий
и
производят по формулам
, (4.4.7)
где
– измеренное значение величины y,
–
расчетное значение величины y,
вычисленное
по полученному уравнению регрессии
при подстановке в него опытных значений
xj;
k
– количество
коэффициентов в уравнении регрессии;
п
– количество опытов;
п
–
k
=
f
–
число степеней свободы,
(4.4.8)
Критерий F
(таблица П. 4.
«Значения
(верхние значения) и
(нижние значения) для различных степеней
свободы f1
и f2»)
позволяет
сравнить общий разброс относительно
линии регрессии с разбросом в точке.
Задавая уровень значимости q
(обычно q
выбирают равным
0,05), по таблице Фишера для (п
– k)
степеней
свободы находят значение критерия
F.
Если оно больше
вычисленного выше, то полученная в виде
уравнения регрессии модель адекватна
результатам эксперимента, если же нет
– то требуется выбрать другой, более
сложный вид уравнения. Однако здесь
необходимо соблюдать условие, чтобы
число опытов было не меньше числа
оцениваемых коэффициентов.
Если число опытов в каждой точке (т.е. при каждом сочетании значений факторов) больше единицы и различно, то находят по формуле:
(4.4.9)
где
nj
–
число параллельных (повторных) опытов
в j-й
строке матрицы;
–
среднее
арифметическое из nj
параллельных
опытов. Из этой формулы видно, что
различие между экспериментальным и
расчетным значениями имеет тем большее
значение, чем больше число повторных
опытов.
Следующий этап анализа состоит в проверке значимости коэффициентов. Его можно осуществлять двумя равноценными способами: проверкой по t-критерию Стьюдента или построением доверительного интервала. Если опытные данные получены в результате полного факторного эксперимента или регулярных дробных реплик, то доверительные интервалы для всех коэффициентов (в том числе и эффектов взаимодействия) равны друг другу.
На этом этапе найдем сначала дисперсию коэффициента регрессии s2 (aj) по формуле:
(4.4.10)
Дисперсии всех коэффициентов равны друг другу, так как они зависят только от погрешности измерений и числа опытов. Доверительный интервал для j-го коэффициента определяется по формуле
(4.4.11)
Здесь
– квантиль распределения Стьюдента
при числе степеней свободы, с которыми
определялась дисперсия для вероятности,
равной выбранному уровню значимости.
Коэффициент значим, если его абсолютная величина больше доверительного интервала, т.е. если его среднее влияние на у больше, чем разбросы за счет неточности модели и «мешающих» факторов.
Очень часто в качестве модели используют степенной полином вида
(4.4.12)
где а1, а2, ..., ат – параметры модели.
Такая модель при правильном выборе степени полинома позволяет с любой необходимой точностью аппроксимировать любую истинную регрессионную зависимость. Достоинством модели является также то, что функция линейна относительно неизвестных параметров a0, а1, а2, ..., аm, что упрощает обработку наблюдений. В данном случае вопрос выбора вида модели сводится к выбору порядка m полинома.
После выбора вида регрессионной модели вычисляют ее параметры. Для модели (4.4.12) необходимо получить оценки параметров a0, а1, а2, ..., аm, что можно сделать на основе метода, рассмотренного в § 3.5.
Предположим,
что yi
(i
= 1, 2, ..., п)
– это значения
выходного параметра объекта, определяемые
регрессионной зависимостью от xi,
а li
– соответствующие результаты измерений
выходного параметра. Разность
в общем
случае отлична от нуля из-за наличия
погрешностей измерения и возмущающих
воздействий на объект исследования.
Здесь и далее считаем, что отклонение аддитивно (не зависит от значения у) и распределено нормально с нулевым математическим ожиданием.
Для регрессионной модели (4.4.12) запишем систему нормальных уравнений:
(4.4.13)
Преобразовав (4.4.13) к стандартному виду, получим:
(4.4.15)
В результате решения системы уравнений (4.4.15), линейных относительно искомых параметров a0, а1, а2, ..., аm, получим их оценки
,
где
Бывает так, что модель нелинейной регрессионной зависимости целесообразно искать в виде функции, отличной от степенного полинома (4.4.12), например, в виде
(4.4.16)
который содержит два неизвестных параметра а и b. Применение полинома (4.4.12) при той же точности модели может потребовать более высокого порядка полинома, что повышает трудоемкость вычислений.
Однако
использование таких нелинейных
(относительно параметров) функций
осложняет вычисление их параметров. В
некоторых частных случаях решение
задачи упрощается, если искусственно
преобразовать нелинейную модель в
линейную. Например, для функции (4.3.16)
необходимо сделать замену переменной
вида
Тогда получим линейную модель
(4.4.17)
где
.
При
этом необходимо соответственно
преобразовать исходные экспериментальные
данные – вычислить совокупность
значений z.
Затем методом наименьших квадратов
находят оценки
и
параметров линейной модели (4.4.17) и
осуществляют обратный переход к
нелинейной модели (4.4.16).