
Министерство образования и науки Российской Федерации
Федеральное агентство по образованию
Саратовский государственный технический университет
Балаковский институт техники, технологии и управления
Построение одномерных моделей методом наименьших квадратов
Методические указания
к выполнению лабораторных работ
по курсу “Идентификация и диагностика систем”
для студентов специальности 210100
дневной, вечерней и заочной форм обучения
Одобрено
редакционно-издательским советом
Балаковского института техники,
технологии и управления
Балаково 2009
Лабораторная работа № 1
Построение линейной одномерной модели методом наименьших квадратов
Цель работы - освоение алгоритма метода наименьших квадратов. Освоение основных приемов работы в электронных таблицах EXCEL.
ОСНОВНЫЕ ПОНЯТИЯ
При проведении исследований часто приходится отыскивать и изучать связи между различными процессами и их характеристиками.
Если некоторая
величина
однозначно связана с некоторой величиной
,
то такая связь называется функциональной
.
На практике между двумя случайными величинами может существовать стохастическая связь, проявляющаяся в изменении закона распределения этих величин, обнаруживать эту связь удается, как правило, только в результате многочисленных измерений и последующей статической обработки полученных результатов.
Для установления вида зависимости, при стохастической связи величины, т.е. для идентификации этой зависимости используется регрессионный анализ.
При этом различают положительную линейную и нелинейную, отрицательную и неотрицательную регрессии.
Функция регрессии определяется в виде соответствующего математического уравнения того или иного типа.
С помощью функции регрессии можно установить значение зависимой величины внутри интервала, заданные значения независимой переменной или же оценить в течение процесса внезапного интервала.
Под этой зависимостью понимают одностороннюю стохастическую связь.
(1)
Неизвестные
параметры регрессии
и
вычисляются
с помощью наименьших квадратов по
уравнению:
(2)
Помимо простой линейной регрессии может использоваться множественно линейная регрессия вида:
(3)
В этом случае,
переменные
оказывают соответственное влияние на
зависимую переменную
.
Задачами регрессионного анализа являются: установление формы зависимости между переменными, оценка функций регрессии, оценка неизвестных значений зависимой переменной (прогноз).
Односторонняя зависимость случайной зависимой переменной Y от одной или нескольких независимых переменных X называется объясняющей регрессией. Такая зависимость может возникать тогда, когда при каждом фиксированном значении X, соответствующее значение Y подвержено случайному разбросу неконтролируемых факторов. Такая зависимость Y(X) называется регрессионной. Она может быть представлена в виде модельного уравнения регрессии:
,
(4)
где
- случайная переменная, характеризующая
отклонение от функции регрессии.
Линейный регрессионный анализ - это анализ, для которого функция f(X) линейна относительно оцениваемых факторов.
Регрессионный анализ включает в себя две основные компоненты:
оценка вектора коэффициентов с помощью метода наименьших квадратов;
дисперсионный анализ – для оценки адекватности модели.
Для того чтобы провести регрессионный анализ необходимо:
чтобы количество экспериментальных данных было больше либо равно 30 на один вход;
распределение выходной величины должно быть нормальным;
в процессе эксперимента дисперсия выходной величины Y не меняется:
;
переменная X изменяется с пренебрежительно малыми ошибками, то есть является детерминированной;
выходные переменные X1, X2, … Xn стахостически независимы между собой:
;
дискретность проведения экспериментов во времени
берется таким образом, чтобы последовательно взятые значения Y1, Y2, Y3 были стахостически независимыми, то есть
больше времени затухания автокорреляционной функции;
учет динамики в регрессионном анализе производится в виде транспортного запаздывания, которое определяется как время нахождения максимума взаимно корреляционной функции X и Y.
На основании этих предпосылок получают уравнение регрессионной модели методом наименьших квадратов.
Алгоритм расчета уравнения линейной регрессии МНК
Проводим эксперимент, задаем не менее 30 значений X,
,
.
Значения xi и yi и сводим их в таблицу в столбцы 2 и 3.
Находим квадрат входной величины
.
Находим произведение входной и выходной величин
.
Находим сумму входной и выходной величин
.
Находим квадрат суммы входной и выходной величины
.
Находим сумму входных величин
.
Находим
.
Находим сумму квадратов входных величин
.
Находим сумму произведений входной и выходной величин
.
Находим сумму входной и выходной величин
Находим сумму квадрата сумм и выходной величин
(5)
По формуле линейной
регрессии находим расчетные значения
выходных величин: .
Находим отклонение расчетного значения от фактического значения выходной величины:
.
Находим квадрат отклонения:
.
Находим сумму квадратов отклонений:
18. Рассчитываем 95% ошибку аппроксимации:
(6)
,
где
-
экспериментальное и расчетное значения
выходной переменной; N,
m
- соответственно, количество экспериментов
и коэффициентов регрессионного уравнения
(без учета b0).
ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТ
Подготовить в электронных таблицах EXCEL программу для решения поставленной задачи:
Ввести наименование работы, фамилию студента, номер варианта работы. Подготовить таблицу, включающую:
номера точек по порядку;
значения входной переменной;
значения выходной переменной;
столбцы для промежуточных результатов вычислений;
ввести формулы для расчета промежуточных переменных.
Внизу таблицы в двух ячейках ввести формулы для расчета коэффициентов уравнения (5).
В последних столбцах таблицы произвести расчет:
,
Рассчитать 95% ошибку аппроксимации
,
где
-
экспериментальное и расчетное значения
выходной переменной; N,
m
- соответственно, количество экспериментов
и коэффициентов регрессионного уравнения
(без учета b0).
Построить графики зависимости экспериментальных и рассчитанных значений выходной переменной от входной переменной.
Провести анализ адекватности полученного уравнения.
Построить линию тренда и показать уравнение и R2 на диаграмме.
Отформатировать все элементы таблицы и графики.
Скопировать исходные данные на второй лист вашей книги.
На 2 листе не пользуясь формулами для нахождения коэффициентов b0 и b1, подобрать их по критерий
. Используйте команду Поиск решения.
Распечатать работу.
ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ
Задан линейный статический объект с 1 входом и 1 выходом.
Имеется выборка пассивного эксперимента объемом 21 точка, содержащая значения входной и выходной переменных.
Период выборки обеспечивает отсутствие автокорреляции Х, Y.
Необходимо найти
оценки коэффициентов регрессионного
уравнения вида
и оценку величины ошибки аппроксимации.
Пример лабораторной работы представлен на рисунке 1.
СОДЕРЖАНИЕ И ОФОРМЛЕНИЕ ОТЧЕТА
Отчет оформляется в текстовом редакторе Word на бумаге формата А4 ГОСТ 6656-76 (210х297 мм) и содержит:
Название лабораторной работы.
Цель работы.
Задание.
Результаты вычисления.
Рис. 1. Построение линейной модели методом наименьших квадратов
ВАРИАНТЫ
ЗАДАНИЙ
Вариант задания выбрать по номеру в журнале.
ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ
Задачи регрессионного анализа.
Что называют объясняющей регрессией?
Какая зависимость называется регрессионной?
Предпосылки регрессионного анализа.
Вид модального уравнения регрессии.
Что такое линейный регрессионный анализ?
Компоненты регрессионного анализа.
Как рассчитываются коэффициенты одномерной линейной регрессионной модели.
Как рассчитать 95% ошибку аппроксимации.
ВРЕМЯ, ОТВЕДЕННОЕ НА ВЫПОЛНЕНИЕ РАБОТЫ
Подготовка к работе – 0,5 акад. часа.
Выполнение работы – 0,5 акад. часа.
Расчеты на ЭВМ – 0,5 акад. часа.
Оформление работы – 0,5 акад. часа.
ЛитЕратура
Идентификация объектов управления: учеб. пособие. / А. Д. Семенов, Д. В. Артамонов, А. В. Брюхачев. - Пенза: ПГУ, 2005. - 211 с.
Основы теории идентификации объектов управления: учеб. пособие. / А.А. Игнатьев, С.А. Игнатьев. - Саратов: СГТУ, 2008. - 44 с.
Теория вероятности и математическая статистика в примерах и задачах с применением EXCEL. / Г.В. Горелова, И.А. Кацко. - Ростов н/Д: Феникс, 2006.- 475 с.
Лабораторная работа № 2