- •200106 «Информационно-измерительная техника и технологии»
- •Введение
- •1.2. Сигналы
- •1.3. Преобразование измерительных сигналов
- •1.4. Спектр периодических сигналов
- •1.5. Модуляция
- •1.5.1. Амплитудная модуляция
- •1.5.2. Частотная модуляция
- •1.5.3. Фазовая модуляция
- •1.5.4. Двукратные виды модуляции
- •1.6. Квантование
- •1.6.1. Квантование по уровню
- •1.6.2. Квантование по времени
- •1.6.3. Квантование по уровню и времени
- •1.7. Кодирование
- •1.7.1. Цифровые коды
- •1.7.2. Помехи
- •1.8. Модель канала
- •Раздел 2 измерительные каналы и их разделение
- •2.1. Канал связи и его характеристики
- •2.2. Согласование канала с источником информации
- •2.3. Линии связи для передачи измерительной информации
- •2.4. Структуры линий связи
- •2.5. Многоканальные системы для передачи измерительной информации
- •2.6. Погрешность систем с частотным разделением каналов
- •2.7. Погрешности систем с временным разделением каналов
- •Раздел 3 принципы обработки данных
- •3.1. Виды погрешностей
- •3.2. Обработка результатов измерений. Оценки измеряемой величины
- •3.3. Обработка результатов прямых равноточных измерений
- •3.4. Обработка результатов косвенных измерений
- •3.5. Обработка результатов совместных измерений
- •3.6. Обработка результатов неравноточных измерений
- •3.7. Проверка статистических гипотез
- •3.7.1. Проверка соответствия гипотезы и экспериментальных данных
- •3.7.2. Исключение резко отклоняющихся значений
- •3.8. Построение эмпирических распределений
- •3.9. Критерии согласия
- •3.9.1. Критерий согласия Пирсона
- •3.9.2. Критерий согласия Колмогорова
- •Раздел 4 планирование многофакторного эксперимента
- •4.1. Задачи планирования эксперимента
- •4.2. Пассивные эксперименты
- •4.3. Дисперсионный анализ
- •4.4. Регрессионный анализ
- •4.5. Активный эксперимент
- •4.6. Полный факторный эксперимент
- •4.7. Дробный факторный эксперимент
- •4.8. Устранение влияния временного дрейфа
- •4.9. Проведение факторного эксперимента и обработка его результатов
- •4.10. Оптимизация
- •4.11. Рандомизация
- •Раздел 5 введение в алгоритмическую теорию измерений
- •5.1. Вводные замечания
- •5.2. Развитие понятий числа и измерения величин
- •5.3. Теория шкал и алгоритмические измерения
- •5.4. Алгоритмы измерения в номинальной шкале, аддитивной и порядка
- •5.5. Моделирование цифровых алгоритмических измерений
- •5.6. Эквивалентность между фильтрацией и алгоритмическим измерением
- •5.7. Моделирование сигналов. Дискретизация
- •5.7.1. Модели дискретизации аналогового сигнала
- •5.7.2. Дискретизация с усреднением
- •5.7.3. Дискретизация сигналов конечной длительности
- •5.8. Цифровое представление информации
- •5.9. Системы счисления с иррациональными основаниями
- •5.9.1. Золотая пропорция
- •5.9.2. Числа Фибоначчи
- •5.9.4. Код золотой p-пропорции
- •5.10. Общий алгоритм метрологического кодирования
- •5.10.1. Алгоритм Стахова
- •5.10.2.Фибоначчиевы алгоритмы цифрового метрологического кодирования
- •Раздел 6 введение в информационную теорию измерений
- •6.1. Основные положения теории информации
- •6.1.1. Энтропия
- •6.1.2. Единицы измерения энтропии
- •6.1.3. Условная энтропия (энтропия помехи)
- •6.1.4. Суммирование нескольких погрешностей
- •6.1.5. Явление «краевой эффект». Приближенность информационных оценок каналов передачи информации
- •6.1.6. Основные положения теории информации для характеристики процесса измерения
- •6.2. Сущность измерения
- •6.2.1. Понятие натурального ряда однородных величин
- •6.2.2. Понятие шкалы реперов измеряемой величины
- •6.2.3. Измерение как сужение интервала неопределенности
- •6.3. Измерительные преобразования, функциональные шкалы, единицы измеряемой величины
- •6.3.1. Функциональная шкала измеряемой величины
- •6.3.2. Понятие единицы измерения
- •6.3.3. Метод построения измерительных устройств
- •6.4. Измерительные преобразования и преобразователи
- •6.5. Энтропийное значение погрешности
- •6.5.1. Математическое определение энтропийного значения погрешности
- •6.5.2. Эффективное значение погрешности
- •6.6. Сравнение энтропийного и среднеквадратического значений погрешности для плавных симметричных одномодальных законов распределения погрешностей
- •6.7. Энтропийное значение погрешности – основной критерий точности приборов и измерений
- •6.8. Определение энтропийного значения погрешности на практике
- •6.9. Суммирование погрешностей измерительных устройств
- •6.10. Статистическое суммирование погрешностей при наличии корреляции
- •6.11. Энтропийное значение результирующей погрешности
- •6.12. Суммирование погрешностей с равномерными законами распределения вероятностей
- •6.13. Суммирование погрешностей при равномерном и нормальном законах распределения составляющих результирующей погрешности
- •6.14. Суммирование погрешностей при произвольной степени корреляции и произвольных законах распределения вероятностей составляющих результирующей погрешности
- •И объемов (n) выборок
- •Интервала
- •Оглавление
4.4. Регрессионный анализ
Регрессионный анализ служит для нахождения по результатам эксперимента связи выходной характеристики устройства (процесса) с факторами, которые влияют на эту характеристику.
В качестве модели регрессии используются прямая линия или различные математические кривые: участки параболы, гиперболы, экспоненты и т.п. Экспериментальные данные могут быть аппроксимированы с требуемой точностью функциями различного вида, поэтому выбор вида функции не может быть формализован. Его осуществляет экспериментатор, руководствуясь следующими соображениями: регрессионная модель должна быть простой, удобной для дальнейшего использования и адекватной. Под адекватностью модели понимают ее способность предсказывать с требуемой точностью значения у в некоторой области значений х. Вид модели выбирают таким образом, чтобы при обязательном соблюдении адекватности она была наиболее простой и удобной.
На практике во многих случаях приближенно («на глаз») графически проводят линию, описывающую зависимость среднего значения у от х, и, исходя из ее вида, выбирают регрессионную модель.
Очень часто зависимость y от x можно принять линейной (линейная модель):
(4.4.1)
Для упрощения способов нахождения коэффициентов регрессии важно принять следующие допущения:
1. результаты наблюдений у1, у2, ..., уi, ..., уп (где п – число наблюдений над величиной y) представляют собой независимые, нормально распределенные случайные величины;
2. дисперсии D(yi) равны друг другу, или пропорциональны какой-то известной функции Ф(y);
3. переменные х1, x2, ..., xk являются независимыми и измеряются с пренебрежимо малой погрешностью по сравнению с величиной [yi].
Методы вычисления коэффициентов регрессии базируются обычно на аппарате матричного исчисления; при этом в наиболее громоздких случаях используются стандартные программы на ЭВМ.
Результаты эксперимента записываются в виде матрицы наблюдавшихся значений:
(4.4.2)
По этим данным можно найти точечные оценки коэффициентов регрессии. Для этого, используя метод наименьших квадратов, составляют n несовместных уравнений:
(4.4.3)
Из этой системы уравнений можно определить (k + 1) коэффициентов регрессии. Решение делают в матричной форме. Всю систему уравнений записывают в матричной форме в виде ХA = Y, где:
(4.4.4)
Матрицу при этом определяют из уравнения
(4.4.5)
где – транспонированная матрица A; – обратная матрица произведения С = ХТХ, равная = (ХТХ)-1. В соответствии с этим уравнением для получения матрицы A (а значит, и всех оценок коэффициентов регрессии) необходимо произвести ряд преобразований, которые хотя и являются стандартными в матричном исчислении, но в общем виде не наглядны, поэтому ход таких вычислений представлен ниже на конкретном числовом примере.
Пример 4.4.1. Результаты эксперимента представлены в таблице.
N |
x1 |
x2 |
y |
N |
x1 |
x2 |
y |
N |
x1 |
x2 |
y |
1 |
0 |
0 |
10 |
4 |
1 |
0 |
14 |
7 |
2 |
2 |
40 |
2 |
0 |
1 |
17 |
5 |
2 |
0 |
18 |
8 |
0 |
-1 |
3 |
3 |
0 |
2 |
20 |
6 |
1 |
1 |
24 |
9 |
-1 |
-1 |
3 |
Число факторов k = 2. Количество опытов п = 9.
Необходимо провести регрессионный анализ, определив значения коэффициентов регрессии.
Решение. Пусть полином для функции у (модель) линейный:
Составим матрицу X и транспонированную матрицу:
Найдем произведение , складывая почленно произведения элементов строк и столбцов X:
Для вычисления обратной матрицы (ХТХ)–1 найдем сначала определитель матрицы ХТХ:
= 9 (11 12 – 6 6) – 5 (5 12 – 4 6) + 4 (5 6 – 4 11) = 628.
Матрицу (ХТХ)–1 составим из определителя и дополнений матрицы ХТХ:
Далее запишем матрицу Y и найдем произведение ХТY:
Далее
Таким образом: a0 = 10,65; a1 = 5,2; a2= 6,8, и уравнение регрессии получает следующий конкретный вид:
y = 10,65 + 5,2 х1 + 6,8 х2.
Далее необходимо проихвести проверку адекватности полученного уравнения опытным данным. Это необходимо, так как вид зависимости был заранее неизвестен и выбирался наиболее простой.
Адекватность проверяют обычно по критерию Фишера F:
. (4.4.6)
Оценку дисперсий и производят по формулам
, (4.4.7)
где – измеренное значение величины y, – расчетное значение величины y, вычисленное по полученному уравнению регрессии при подстановке в него опытных значений xj; k – количество коэффициентов в уравнении регрессии; п – количество опытов; п – k = f – число степеней свободы,
(4.4.8)
Критерий F (таблица П. 4. «Значения (верхние значения) и (нижние значения) для различных степеней свободы f1 и f2») позволяет сравнить общий разброс относительно линии регрессии с разбросом в точке. Задавая уровень значимости q (обычно q выбирают равным 0,05), по таблице Фишера для (п – k) степеней свободы находят значение критерия F. Если оно больше вычисленного выше, то полученная в виде уравнения регрессии модель адекватна результатам эксперимента, если же нет – то требуется выбрать другой, более сложный вид уравнения. Однако здесь необходимо соблюдать условие, чтобы число опытов было не меньше числа оцениваемых коэффициентов.
Если число опытов в каждой точке (т.е. при каждом сочетании значений факторов) больше единицы и различно, то находят по формуле:
(4.4.9)
где nj – число параллельных (повторных) опытов в j-й строке матрицы; – среднее арифметическое из nj параллельных опытов. Из этой формулы видно, что различие между экспериментальным и расчетным значениями имеет тем большее значение, чем больше число повторных опытов.
Следующий этап анализа состоит в проверке значимости коэффициентов. Его можно осуществлять двумя равноценными способами: проверкой по t-критерию Стьюдента или построением доверительного интервала. Если опытные данные получены в результате полного факторного эксперимента или регулярных дробных реплик, то доверительные интервалы для всех коэффициентов (в том числе и эффектов взаимодействия) равны друг другу.
На этом этапе найдем сначала дисперсию коэффициента регрессии s2 (aj) по формуле:
(4.4.10)
Дисперсии всех коэффициентов равны друг другу, так как они зависят только от погрешности измерений и числа опытов. Доверительный интервал для j-го коэффициента определяется по формуле
(4.4.11)
Здесь – квантиль распределения Стьюдента при числе степеней свободы, с которыми определялась дисперсия для вероятности, равной выбранному уровню значимости.
Коэффициент значим, если его абсолютная величина больше доверительного интервала, т.е. если его среднее влияние на у больше, чем разбросы за счет неточности модели и «мешающих» факторов.
Очень часто в качестве модели используют степенной полином вида
(4.4.12)
где а1, а2, ..., ат – параметры модели.
Такая модель при правильном выборе степени полинома позволяет с любой необходимой точностью аппроксимировать любую истинную регрессионную зависимость. Достоинством модели является также то, что функция линейна относительно неизвестных параметров a0, а1, а2, ..., аm, что упрощает обработку наблюдений. В данном случае вопрос выбора вида модели сводится к выбору порядка m полинома.
После выбора вида регрессионной модели вычисляют ее параметры. Для модели (4.4.12) необходимо получить оценки параметров a0, а1, а2, ..., аm, что можно сделать на основе метода, рассмотренного в § 3.5.
Предположим, что yi (i = 1, 2, ..., п) – это значения выходного параметра объекта, определяемые регрессионной зависимостью от xi, а li – соответствующие результаты измерений выходного параметра. Разность в общем случае отлична от нуля из-за наличия погрешностей измерения и возмущающих воздействий на объект исследования.
Здесь и далее считаем, что отклонение аддитивно (не зависит от значения у) и распределено нормально с нулевым математическим ожиданием.
Для регрессионной модели (4.4.12) запишем систему нормальных уравнений:
(4.4.13)
Преобразовав (4.4.13) к стандартному виду, получим:
(4.4.15)
В результате решения системы уравнений (4.4.15), линейных относительно искомых параметров a0, а1, а2, ..., аm, получим их оценки
,
где
Бывает так, что модель нелинейной регрессионной зависимости целесообразно искать в виде функции, отличной от степенного полинома (4.4.12), например, в виде
(4.4.16)
который содержит два неизвестных параметра а и b. Применение полинома (4.4.12) при той же точности модели может потребовать более высокого порядка полинома, что повышает трудоемкость вычислений.
Однако использование таких нелинейных (относительно параметров) функций осложняет вычисление их параметров. В некоторых частных случаях решение задачи упрощается, если искусственно преобразовать нелинейную модель в линейную. Например, для функции (4.3.16) необходимо сделать замену переменной вида Тогда получим линейную модель
(4.4.17)
где .
При этом необходимо соответственно преобразовать исходные экспериментальные данные – вычислить совокупность значений z. Затем методом наименьших квадратов находят оценки и параметров линейной модели (4.4.17) и осуществляют обратный переход к нелинейной модели (4.4.16).