Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВЫБОР ОПТИМАЛЬНОЙ СТРУКТУРЫ МОДЕЛИ.doc
Скачиваний:
7
Добавлен:
01.05.2014
Размер:
576 Кб
Скачать

Содержание

1.Постановка задачи……………………………………………………………………………….…… ..3

2.Теоретические сведения………………………………………………………………………….…….4

2.1.Основные определения………………………………………………………………...……..4

2.2. Нормальная система…………………………………………………………..……………...5

2.3 Выбор структуры модели и анализ ошибок моделирования………………………...…….6

2.4. Критерии оптимальности структуры модели………...……………….……….……….......6

3.Практическая часть………………………………………………………………….……………….....8

4.Выводы…………………………………………………………………………….……………………12

5.Используемая литература………………………………………………….……………………….....13

1. Постановка задачи

Проведены 23 наблюдения переменных x1 и Y=ln(x3). Необходимо выбрать оптимальную модель Ym(x1) линейного вида с использованием заданных тригонометрических базисных функций и найти коэффициенты модели. Включение и исключение модели определяется F-критерием. Используется шаговый метод отбора.

Исходные данные:

Данные 1 группы.

Матрица наблюдений параметров: Х1-размер пузырька мм, Х2-концентрация ОПСБ мг/л, Х3-скорость всплытия пузырька см/с.

Моя базисная функция:

ТРИГОНОМЕТРИЧЕСКИЕ ФУНКЦИИ: ХХ(2к+1)=sin(2kx/L), ХХ(2к)=cos(2kx/L), , к=0..Kmax.

Модель:Y(X1),Y=ln(X3)

2. Теоретические сведения

2.1 Постановка задачи. Основные определения

Имеются Nнаблюдений некоторых переменных процесса (объекта наблюдения). Одна из переменных считается выходом процесса, в дальнейшем обозначаемая какy, и рассматривается как функция других переменных, называемых входными переменными процесса, и обозначаемые какzj,j=1..m. Значенияmвходных переменных вNнаблюдениях образуют матрицу наблюдений входных переменныхZ, аNзначений переменнойyобразуют вектор наблюдений выходной переменнойY:

(1)

Задача аппроксимации функции (АФ) состоит в том, чтобы по данным наблюдения выходной и входных переменных подобрать «хорошую» функцию от входных переменных, аппроксимирующую исходные данные или аппроксимирующую неизвестную нам функцию. В качестве аппроксимирующих функций рассмотрим класс линейных модельных функций вида:

, (2)

где Xi,i=0..k- есть функции входных переменныхzj,j=1..m. ПеременнуюXiможно считатьi-й обобщенной входной переменной, а модельную функцию рассматривать как линейную функцию отk+1обобщенных переменных. Обычно в качествеX0рассматривают тождественную единицу:X0=1. Поэтому этой переменной-константе и выделяют номер ноль, и, для удобства расчетов считают или не считают за переменную, т.е. рассматривают всегоkпеременных. Рассчитав значения данных базисных функций в каждом наблюдении, т.е. определив значения (k+1)(илиk) обобщенных входных переменных вNнаблюдениях, получим матрицу наблюдений обобщенных входных переменныхK:

(3)

Ясно, что (X0)i=1 для всех наблюденийi=1,..,N. При этомj-й столбец матрицыKможно интерпретировать какN наблюденийj-й обобщенной переменной:j=0..k. В качестве критерия отбора наилучшей модели вида (2) для метода наименьших квадратов используется критерий среднего квадрата отклонения значений модельной функции от наблюдаемых значений:

min(4)

или

min. (4’)

Анализ критерия (4’) показывает геометрическую интерпретацию задачи о НК, как определения проекции вектора наблюдений Yна линейную оболочку векторов наблюдений обобщенных переменныхXj,j=0..k. В этом случае вектора наблюдений обобщенных переменныхXj можно считать базисными векторами, а вектор коэффициентов моделиaесть вектор коэффициентов разложения проекции вектораYпо системе базисных векторов.

В качестве примера задачи построения модели можно рассмотреть определение взаимосвязи между тремя параметрами процесса всплытия пузырька воздуха: скоростью подъема одиночного пузырька Vb, диаметром пузырькаDbи концентрацией реагентаCp. Так как нас интересует оценка скорости пузырька, то в качестве выходной переменнойyбудем считать скорость пузырька, а в качестве входных переменных - диаметрz1и концентрацию z2. Сделав несколько наблюдений, мы получим значения этих переменных и из них составим матрицу наблюденийZи вектор наблюденийY(см.(1)). Если в качестве расчетной модели скорости всплытия пузырька мы рассмотрим модель вида:

,

то получим 4 обобщенные переменные:

X0:= 1;X1:= z1;X2:= z2;X4:= z1z2.

Если мы теперь посчитаем значения этих обобщенных переменных во всех наблюдениях (считать придется только X4- значенияX1и X2совпадают со значениями исходных переменных, а значенияX0равны единице во всех наблюдениях), то получим матрицуК. Задача заключается в том, чтобы подобрать коэффициенты модели так, чтобы расчетные по модели значения выходного параметра были бы близки к его наблюдаемым значениям.

Если имеем только одну входную переменную, то получаем задачу полиномиальной аппроксимации функции одной переменной по известным значениям (измерениям) y1,y2,..,yNнеизвестной нам функцииf(x) в узловых точкахx1,x2,..,xN. Необходимо подыскать лучшее, в смысле критерия среднеквадратического отклонения, приближение или модельную функциюfм(x) из класса многочленов вида:

, (5)

где k- степень многочлена,j,j=0,k- заданные базисные функции,aj,j=0,k- коэффициенты полинома (коэффициенты разложения по данным базисным функциям). В данном случае обобщенные переменные совпадают непосредственно с базисными функциями.

В качестве базисных функций можно рассматривать степени х :

j=xj,j=0,..,k; (6)

и тогда модельная функция будет алгебраическим полиномом степени k. Можно в качестве базисных функций рассмотреть тригонометрические функции:

,j=1,..,k; (7)

и тогда модельная функция будет тригонометрическим полиномом степени k. Тригонометрические функции обладают свойством ортогональности на интервале, кратном2Lи поэтому их удобнее использовать для расчета коэффициентов модельного полинома.

По этой же причине вместо (10) в качестве базисных функций jрассматривают различного вида ортогональные на интересующем нас отрезке (или на исходном множестве точекx1,x2,..,xN) полиномы степениj. Модельный алгебраический полином будет все тот же полиномk-й степени, но расчет его коэффициентов будет вычислительно проще и надежнее защищен от ошибок округления.

Обозначив через j=y(xj)-yм(xj) отклонение значения модельной функции от наблюдаемого значения, задачу минимизации нормы вектора отклонения (4) можно переписать в виде:

min. (8)

Отклонение значения модельной функции от наблюдаемого значения j=y(xj)-yм(xj) называют также ошибками моделирования или остатками модели. Задача о НК, таким образом, можно сформулировать и как задачу выбора модели вида (2), обеспечивающей минимум (квадрата) нормы вектора ошибки моделирования. Таким образом, для решения задачи АФ необходимо провести наблюдения параметров процесса, определить список обобщенных переменных, входящих в модель вида (2) (определить структуру модели) и найти коэффициенты модели, воспользовавшись МНК. Такая задача - построения модели по данным наблюдения - еще называетсязадачей регрессионного анализа данных. А построенная в результате модель или аппроксимирующая функция называетсярегрессионной моделью.