
МатМод экология / Лекция №3
.pdf
Лекция №3.
Построение аналитической модели по данным экспериментов.
Моделирование на стадии эксперимента происходит при попытке выявления зависимостей результата от наиболее существенных факторов.
Это позволяет обобщить результат экспериментирования в виде некоторой математической формулы, т.е. аналитической модели.
Например, для свободно падающих тел Галилеем был установлен факт независимости скорости свободного падения тел в вакууме вблизи поверхности земли от их массы, плотности, размеров. Это обстоятельство может быть проверено путем измерения зависимости скорости свободного падения от времени для контрольной группы тел. Если нанести результаты измерений на график V(t) , то через совокупность экспериментальных точек с учетом погрешностей измерений для каждого тела легко может быть проведена прямая (см. рис. 3.1),
Рис. 3.1. Зависимость V от t
что позволяет выполнить аппроксимацию по формуле (уравнение
прямой): |
|
V(t) =V0 + g t |
(3.1) |

С помощью статистической обработки с некоторой погрешностью может быть найден тангенс угла наклона данной прямой, то есть величина g ,
являющаяся по смыслу ускорением свободного падения. Сопоставление величины ускорения для разных тел позволяет повторить вывод Галилея.
Таким образом, мы устанавливаем некоторый “закон”, выражаемый математической моделью (формулой) (3.1).
Заметим принципиальный момент: нам так и осталась непонятной природа этого явления, но, имея формулу (3.1), мы обладаем инструментом прогнозирования. Здесь мы сталкиваемся c широко известной информационной технологией “черного ящика”, получившей широкое распространение в кибернетике. “Черный ящик”, соответствующий формуле
(3.1), схематично можно изобразить так, как это показано на рис. 3.2.
Рис. 3.2. Модель “черный ящик” Этим способом удаѐтся установить также и довольно сложные
зависимости, например степенные. Так, по экспериментальным данным Шарлем Кулоном в 1785 был открыт закон Кулона. Проведя большое количество опытов с металлическими шариками, Шарль Кулон дал такую формулировку закона:
Модуль силы взаимодействия двух точечных зарядов в вакууме прямо пропорционален произведению модулей этих зарядов и обратно пропорционален квадрату расстояния между ними.
F (r) k |
q1 q2 |
(3.2) |
|
r 2 |
|||
|
|
Так исторически возникало большинство физических законов. Закон – это на самом деле результат абсолютизации математической зависимости,
найдя которую редко удается понять природу явления. Абсолютизация, как показывает исторический опыт, никогда не является достаточно правомерной.
Например, достоверно известно, что закон Кулона справедлив вплоть до атомных размеров, но нарушается на расстояниях, сопоставимых с межнуклонными размерами внутри атомного ядра (т.е. 10 –14м).
Таким образом, все известные естественнонаучные законы на самом деле всего лишь аналитические модели реальных явлений.
Аппроксимация экспериментальных данных.
Пусть проведено некоторое количество экспериментов, в результате которых для каждого заданного начального значения исходных данных получен численный ответ системы (например, проведено 10 экспериментов по бросанию тел с разной высоты, измерено время падения и скорость в момент падения). В результате получится таблица, описывающая неизвестную пока аналитическую модель (функцию):
|
Таблица 3.1 |
|
|
Время полета (с) |
Скорость в момент падения (м/с) |
1 |
14 |
3 |
23 |
… |
… |
13 |
123 |
Всегда следует помнить, что измерения проводятся с некоторой погрешностью.
Под аппроксимацией будем понимать описание таблично заданной функции некоторой математической зависимостью – аналитической моделью.
Исходными данными для решения задачи является таблица наблюдений
– набор значений независимых переменных и соответствующие им значения

функции отклика. Число строк (узлов) таблично заданной функции m
называют объемом выборки.
Так как заранее вид функции аналитической модели неизвестен, то построение аналитической модели производится в два этапа: сначала выясняется общий вид функции (линейная, квадратичная,
тригонометрическая…), а затем определяются ее наилучшие параметры.
Задача выбора вида функции – задача не формализуемая, поскольку один и тот же набор экспериментальных данных примерно с одинаковой точностью может быть аппроксимирован самыми разными аналитическими моделями. Исходя из этого, при выборе вида функции модели во главу угла ставят удобство ее последующего использования. Другое важное требование
– это содержательность или интерпретируемость предлагаемого аналитического описания. Это требование удовлетворяется путем придания определенного физического смысла параметрам или функциям, входящим в предлагаемую математическую модель.
Например, построенная согласно таблице 3.1 зависимость имеет вид:
Рис. 3.1
Можно предположить, что эту зависимость достаточно хорошо будет описывать уравнение прямой:

Рис. 3.2.
После того, как выбран общий вид функции, необходимо лишь рассчитать наилучшие значения коэффициентов этого уравнения. Очевидно,
что коэффициенты уравнения следует подбирать так, чтобы рассчитываемые по уравнению значения функции отклика максимально близко совпадали с заданными в исходной таблице наблюдений.
Так, для нашего примера: уравнение прямой имеет общий вид: f(x)=a1+a2*x
Следовательно, необходимо определить значения коэффициентов a1 и a2.
Определение коэффициентов аналитической модели по методу наименьших квадратов (МНК).
Пусть между величинами x и y существует функциональная
зависимость, заданная таблицей пар значений:
|
x |
x1 |
x2 |
|
|
xi |
|
|
xn |
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
y1 |
y2 |
|
|
yi |
|
|
yn |
|
|
|
|
|
|
|
|
|
|
||
но ее аналитический вид неизвестен. Возникает задача - найти |
||||||||||
эмпирическую формулу: |
|
|
|
|
|
|
|
|
||
|
|
|
|
y f (x; a1 , a2 ,...,am ), |
|
(3.3) |
(где a1 , a2 ,...,am - параметры), значения которой при |
x xi возможно мало |
отличались бы от опытных значений yi (i 1,2,...,n) . |
Важно, что здесь не |
ставится задача полного равенства значений функции и экспериментальных данных в точках xi, а лишь минимального отличия их значений.
Если в эмпирическую формулу (3.3) подставить исходные точки xi , то получим теоретические значения:
|
|
|
|
yT f (x ; a , a |
,...,a ) , где i 1,2,...,n . |
(3.4) |
|||
|
|
|
|
i |
i |
1 |
2 |
m |
|
|
Разности yT y |
i |
называются |
отклонениями и представляют |
собой |
||||
|
|
i |
|
|
|
|
|
|
|
расстояния по вертикали от точек M i |
|
до графика эмпирической функции. |
|||||||
|
Согласно методу наименьших квадратов наилучшими коэффициентами |
||||||||
a1 , a2 |
,...,am |
считаются те, |
для |
которых сумма квадратов отклонений |
|||||
|
|
найденной эмпирической функции от заданных значений функции будет минимальной.
|
n |
n |
2 |
|
|
|
|
|
|
||
S(a1 , a2 ,...,am ) yiT yi 2 f (xi ; a1 , a2 ,...,am ) yi |
min |
(3.5) |
|||
|
i 1 |
i 1 |
|
|
|
Для того, чтобы |
найти набор коэффициентов a1 , a2 ,...,am , |
которые |
|||
доставляют минимум функции S , определяемой формулой (3.5), используем |
|||||
необходимое условие |
экстремума |
функции нескольких |
переменных - |
равенство нулю градиента функции (вектора частных производных). В
результате получим систему уравнений для определения коэффициентов
ai (i 1,2,...,m) : |
|
|
|
|
|
|
S |
|
0; |
||
|
a |
|
|
||
|
|
|
|
|
|
1 |
|
|
|
||
|
S |
|
0; |
||
|
a2 |
||||
|
(3.6) |
||||
....; |
|
|
|
|
|
|
S |
|
0. |
||
|
a |
m |
|
||
|
|
|
|||
|
|
|
|
Таким образом, нахождение коэффициентов ai сводится к решению системы (3.6). Конкретный вид системы зависит от выбранного вида аппроксимирующей функции f (x;a1 ,a2 ,...,am ) .
Так, если эмпирическая формула (3.3) линейна относительно
параметров ai , тогда система (3.5) |
будет линейной. |
||||
Например, в случае линейной зависимости: |
|
||||
|
y a1 |
a2 x |
|
|
|
система (3.5) примет вид: |
|
|
|
|
|
|
|
n |
n |
|
|
|
a1n a2 xi |
yi |
, |
||
n |
n |
n |
(3.6) |
||
|
|||||
|
|
i 1 |
i 1 |
|
|
a1 xi a2 xi2 xi yi . |
|||||
|
i 1 |
i 1 |
i 1 |
|
Эта линейная система может быть решена любым известным методом
(методом Гаусса, простых итераций, формулами Крамера и др.).
В случае квадратичной зависимости:
|
|
y a |
a |
x a x2 |
|
|
|||||
|
|
|
|
1 |
2 |
|
|
3 |
|
|
|
система (3.5) примет вид: |
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
n |
|
|
n |
, |
|
|
|
a1n a2 xi |
a3 xi |
yi |
|
|
||||||
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
i 1 |
2 |
|
i 1 |
3 |
|
i 1 |
|
|
|
|
n |
n |
|
n |
|
n |
|
|
|
||
a1 xi |
a2 xi |
a3 xi |
|
xi |
yi , |
(3.7) |
|||||
|
i 1 |
i 1 |
|
|
i 1 |
|
|
i 1 |
|
|
|
n |
n |
|
|
n |
|
|
n |
|
|
|
|
a1 |
xi2 |
a2 xi3 |
a3 xi4 |
xi2 yi . |
|
||||||
|
i 1 |
i 1 |
|
|
i 1 |
|
|
i 1 |
|
|
|
Методом наименьших квадратов удается рассчитать коэффициенты и более сложных аппроксимирующих функций, однако для этого приходится применять дополнительные преобразования. Так, например, МНК применяется для расчета коэффициентов экспоненциальной функции:
|
y a ea2 x , |
|
(3.8) |
|
|
|
1 |
|
|
где a1 и a2 |
неопределенные коэффициенты. |
|
||
Расчет |
проводится |
путем |
преобразования |
нелинейной |
экспоненциальной функции в линейную относительно коэффициентов a1 и a2
-линеаризации. Линеаризация достигается путем логарифмирования равенства (3.8), после чего получаем соотношение
ln y ln a1 a2 x |
(3.9) |
Переобозначим ln(y) и ln(a1) соответственно через t и c, тогда |
|
зависимость (3.9) может быть записана в виде: |
|
t с a2 x , |
|
что позволяет применить формулы (3.6) с заменой a1 на с и yi |
на ti . |
Построенная на основе выбранной эмпирической функции модель также называется моделью регрессии, а вычисленные по методу МНК коэффициенты – коэффициентами регрессии.
Оценка адекватности построенной аналитической модели.
После того, как аналитическая модель построена (определены коэффициенты выбранной эмпирической функции) необходимо оценить,
насколько точно выбранная модель отражает реальную зависимость y от x.
Для проверки согласия построенной модели регрессии с результатами эксперимента обычно вычисляют следующие числовые характеристики:
среднеквадратическая ошибка, коэффициент корреляции (линейная
зависимость), и коэффициент детерминации.
Среднеквадратическая ошибка напрямую показывает суммарное отклонение экспериментальных и теоретически предсказанных данных, и
определяется так же, как и в методе наименьших квадратов:
|
n |
|
2 |
|
|
|
|
Е |
f (xi |
) yi |
|
|
i 1 |
|
|
Здесь yi- экспериментальные |
значения |
в точках xi, а f (xi ) - |
рассчитанные при помощи построенной по МНК функции. Чем меньше значение ошибки Е, тем лучше функция описывает эксперимент. Однако такая оценка адекватности модели не всегда объективна, так как функция может хорошо отражать значения в узлах xi, но плохо отражать общую закономерность процесса:

Рис.3.1.
Функция, нарисованная красным, даст практически нулевую квадратичную ошибку, но синий график гораздо лучше отражает процесс.
Коэффициент корреляции - более объективная оценка адекватности,
однако применять ее целесообразно лишь для линейных моделей. Он является мерой линейной связи между переменными и показывает, насколько хорошо в среднем может быть представлена одна из величин в виде линейной функции от другой.
Коэффициент корреляции вычисляется по формуле:
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(xi x)( yi y) |
||||||||||||||||
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
(3.10) |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
n |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
(xi |
x)2 |
|
( yi |
y)2 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
||
|
|
|
n |
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
xi |
|
|
|
yi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где |
x |
i 1 |
, |
y |
i 1 |
|
среднее арифметическое экспериментальных |
||||||||||||||||||
n |
n |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
значений x и y.

Коэффициент корреляции между случайными величинами по абсолютной величине не превосходит 1. Чем ближе к 1, тем теснее
линейная связь между x и y.
Чтобы выяснить, насколько точно построенная модель отражает эмпирические данные нелинейной системы (в общем случае - произвольной),
вводится еще одна характеристика коэффициент детерминации. Он показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными
системы.
Для его описания рассмотрим следующие величины:
n |
|
|
|
|
|
Sполн ( yi y)2 |
- полная |
сумма |
квадратов, где y |
- среднее |
|
i 1 |
|
|
|
|
|
арифметическое значений yi . |
|
|
|
|
|
Можно доказать следующее равенство: |
|
||||
n |
n |
|
n |
|
|
( yi |
y)2 ( yi yiT )2 |
( yiT y)2 . |
|
||
i 1 |
i 1 |
|
i 1 |
|
|
Здесь yi – измеренное значение в точке xi, yiT – теоретическое значение, |
|||||
рассчитанное в точке xi согласно модели. |
|
|
|
||
|
n |
|
|
|
|
Первое слагаемое |
Sост ( yi |
yiT )2 |
называется остаточной суммой |
||
|
i 1 |
|
|
|
|
квадратов. Оно характеризует отклонение экспериментальных данных от теоретических.
n |
|
Второе слагаемое равно Sрегр ( yiT y)2 |
и называется регрессионной |
i 1 |
|
суммой квадратов. Оно характеризует разброс теоретических данных вокруг среднего значения.
Очевидно, что справедливо следующее равенство |
Sполн Sост Sрегр . |
||
Коэффициент детерминации определяется по формуле: |
|||
r 2 1 |
Sост |
. |
(3.11) |
|
|||
|
Sполн |
|