
Лекции_по_дисциплине
.pdf
Компьютерное моделирование
Об оптимальном плане пошивочной мастерской.
О рациональном использовании сырья.
7.3.4. Аппроксимация экспериментальных данных Одна независимая переменная
На практике часто приходится сталкиваться с задачей о сглаживании экспериментальных зависимостей или задачей аппроксимации. Аппроксимацией называется процесс подбора эмпирической формулы φ(x) для установленной из опыта функциональной зависимости y=f(x). Эмпирические формулы служат для аналитического представления опытных данных.
Обычно задача аппроксимации распадается на две части. Сначала устанавливают вид зависимости у =f(x) и, соответственно, вид эмпирической формулы, то есть решают, является ли она линейной, квадратичной, логарифмической или какой-либо другой. После этого определяются численные значения неизвестных параметров выбранной эмпирической формулы, для которых приближение к заданной функции оказывается наилучшим. Если нет каких-либо теоретических соображений для подбора вида формулы, обычно выбирают функциональную зависимость из числа наиболее простых, сравнивая их графики с графиком заданной функции.
После выбора вида формулы определяют ее параметры. Для наилучшего выбора параметров задают меру близости аппроксимации экспериментальных данных. Во многих случаях, в особенности, если функция f(x) задана графиком или таблицей (на дискретном множестве точек), для оценки степени приближения рассматривают разности f(xi) - φ(xi) для точек x0, x1,..., xn. Существуют различные меры близости и, соответственно, способы решения этой задачи. Некоторые из них очень просты, быстро приводят к результату, но результат этот является сильно приближенным. Другие более точные, но и более сложные. Обычно определение параметров при известном виде зависимости осуществляют по методу наименьших квадратов. При этом функция φ(x) считается наилучшим приближением к f(x), если для нее сумма квадратов невязок δi или отклонений «теоретических»
121

Тарова Инна Николаевна
значений φ(xi), найденных по эмпирической формуле, от соответствующих опытных значений yn
n |
|
|
Z f (xi ) (xi ) 2 |
min |
(7.13) |
i 0
имеет наименьшее значение по сравнению с другими функциями, из числа которых выбирается искомое приближение.
Используя методы дифференциального исчисления, метод наименьших квадратов формулирует аналитические условия достижения суммой квадратов отклонений (7.13) своего наименьшего значения. Так, если функция φ(x) вполне определяется своими параметрами k, l, т,..., то наилучшие (в указанном смысле (7.13)) значения этих параметров находятся из решения системы уравнений. Например, в простейшем случае, когда функция φ(x) представлена линейным уравнением у = ах + b, система имеет вид:
|
n |
2 |
|
n |
n |
|
a * xi |
|
b * xi |
xi * yi , |
|
||
|
i 1 |
|
|
i 1 |
i 1 |
(7.14) |
|
|
|
||||
|
n |
|
|
n |
||
|
a * xi |
b * n yi |
|
|||
|
|
|||||
|
|
i 1 |
|
i 1 |
|
В простейшем случае задача аппроксимации экспериментальных данных выглядит следующим образом.
Пусть есть какие-то данные, полученные практическим путем (в ходе эксперимента или наблюдения), которые можно представить парами чисел (x, у). Зависимость между ними отражает таблица:
X |
X1 |
… |
Xn |
Y |
Y1 |
… |
Yn |
На основе этих, данных требуется подобрать функцию у = φ(x), которая наилучшим образом сглаживала бы экспериментальную зависимость между переменными и по возможности точно отражала общую тенденцию зависимости между х и у, исключая погрешности измерений и случайные отклонения. Это значит, что отклонения yi yi (xi ) в каком-то смысле были бы наименьшими. Например, в
смысле (7.13).
122

Компьютерное моделирование
Выяснить вид функции можно либо из теоретических соображений, либо анализируя расположение точек (хn; уn) на координатной плоскости.
Например, пусть точки расположены так, как показано на рис. 7.1 Учитывая то, что практические данные получены с некоторой по-
грешностью, обусловленной неточностью измерений, необходимостью округления результатов и т. п., естественно предположить, что здесь имеет место линейная зависимость у = ах + b.
о
Рис. 7.1 Возможный вариант расположения экспериментальных точек
Чтобы функция приняла конкретный вид, необходимо каким-то образом вычислить а и b. Для этого можно решить систему (7.14).
Расположение экспериментальных точек в виде кривой на рис. 7.2 наводит на мысль, что зависимость обратно пропорциональна и функцию φ(x) нужно подбирать в виде у - а + b/х. Здесь также необходимо вычислить параметры а и b.
Рис. 7.2 Другой вариант расположения экспериментальных точек
Таким образом, расположение экспериментальных точек может иметь самый различный вид, и каждому соответствует конкретный тип функции.
Построение эмпирической функции сводится к вычислению входящих в нее параметров, так чтобы из всех функций такого вида выбрать ту, которая лучше других описывает зависимость между изу-
123

Тарова Инна Николаевна
чаемыми величинами. То есть сумма квадратов разности между табличными значениями функции в некоторых точках и значениями, вычисленными по полученной формуле, должна быть минимальна.
В MS Excel аппроксимация экспериментальных данных осуществляется путем построения их графика (х — отвлеченные величины) или точечного графика (х — имеет конкретные значения) с последующим подбором подходящей аппроксимирующей функции (линии тренда). Возможны следующие варианты функций:
1.Линейная у=ах + b. Обычно применяется в простейших случаях, когда экспериментальные данные возрастают или убывают с постоянной скоростью.
2.Полиномиальная — у = а0 + а1 х + а2х2 +... + аn хn, где до шесто-
го порядка включительно (п < 6), аi — константы. Используется для описания экспериментальных данных, попеременно возрастающих и убывающих. Степень полинома определяется количеством экстремумов (максимумов или минимумов) кривой. Полином второй степени может описать только один максимум или минимум, полином третьей степени может иметь один или два экстремума, четвертой степени — не более трех экстремумов и т. д.
3.Логарифмическая —у=aLnx + b, где а и b — константы, Ln —
функция натурального логарифма. Функция применяется для описания экспериментальных данных, которые вначале быстро растут или убывают, а затем постепенно стабилизируются.
4.Степенная — у = bхn, где а и b — константы. Аппроксимация степенной функцией используется для экспериментальных данных с постоянно увеличивающейся (или убывающей) скоростью роста. Данные не должны иметь нулевых или отрицательных значений.
5.Экспоненциальная — у = beax, где а и b — константы, е — осно-
вание натурального логарифма. Применяется для описания экспериментальных данных, которые быстро растут или убывают, а затем постепенно стабилизируются. Часто ее использование вытекает из теоретических соображений.
Степень близости аппроксимации экспериментальных данных выбранной функцией оценивается коэффициентом детерминации (R2).
124

Компьютерное моделирование
Таким образом, если есть несколько подходящих вариантов типов аппроксимирующих функций, можно выбрать функцию с большим коэффициентом детерминации (стремящимся к 1).
Для осуществления аппроксимации на диаграмме экспериментальных данных необходимо щелчком правой кнопки мыши вызвать выплывающее контекстное меню и выбрать пункт Добавить линию тренда. В появившемся диалоговом окне Линия тренда на вкладке Тип выбирается вид аппроксимирующей функции, а на вкладке Параметры задаются дополнительные параметры, влияющие на отображение аппроксимирующей кривой.
7.3.5. Аппроксимация экспериментальных данных Несколько независимых переменных
В тех случаях, когда аппроксимируемая переменная у зависит от нескольких независимых переменных х1,х2,...,хп,
у=f(х1, х2,…,хп),
подход с построением линии тренда не дает решения. Здесь могут быть использованы следующие специальные функции MS Excel:
ЛИНЕЙН и ТЕНДЕНЦИЯ для аппроксимации линейных функ-
ций вида: |
|
у = а0 + a1xl + а2х2 +... + апхn, |
(7.16) |
ЛГРФПРИБЛ и РОСТ для аппроксимации показательных функций вида:
у = а0 а1x1 а2 x2...аn Xn |
(7.17) |
Функции ЛИНЕЙН и ЛГРФПРИБЛ служат для вычисления неизвестных коэффициентов а0,a1,...,an в выражениях (7.16) и (7.17) соответственно, а также коэффициентов детерминации (R2), значений критерия Фишера, стандартных ошибок коэффициентов ai, и ряда других показателей.
Обе функции имеют одинаковые параметры:
ЛИНЕЙН (известные_значения_у; известные_значения_х; конст; статистика)
ЛГРФПРИБЛ (известные_значения_у; известные_зпачения_х; конст; статистика)
125

Тарова Инна Николаевна
Здесь:
известные_значения_у — множество наблюдаемых значений у из выражений (7.16), (7.17);
известные_значения_х — множество наблюдаемых значений xv x2, ..., хn. Причем, если массив известные_значешя_у имеет один столбец, то каждый столбец массива известные_значения_х интерпретируется как отдельная переменная, а если массив известные_значения_у имеет одну строку, то тогда каждая строка массива известные_значения_х интерпретируется как отдельная переменная;
конст — логическое значение, которое указывает, требуется ли,
чтобы константа а0 была равна 0 (для функции ЛИНЕЙН) или 1 (для функции ЛГРФПРИБЛ). При этом, если конст имеет значе-
ние ИСТИНА или опущено, то а0 вычисляется обычным образом, а если конст имеет значение ЛОЖЬ, то а0 полагается равным 0 или 1;
статистика — логическое значение, которое указывает, требуется ли вычислять дополнительную статистику по регрессии, если введено значение ИСТИНА, то дополнительные параметры вычисляются, если ЛОЖЬ, то — нет.
Функции ТЕНДЕНЦИЯ и РОСТ позволяют находить точки, лежащие на аппроксимирующих кривых (7.16) и (7.17), соответственно, для значений коэффициентов а0, а1, ...,ат, найденных функциями ЛИНЕЙН и ЛГРФПРИБЛ.
Обе функции имеют одинаковые аргументы:
ТЕНДЕЦИЯ (известные_значения_у; известные_значения_х; но- вые_значе-ния_х; конст).
РОСТ (известные_значения_у; известные_значения_х; новые_значения_х; конст).
Здесь:
известные_значения_у — множество значений у,
известные_значения_х — множество значений х
новые_значения_х — те значения х, для которых необходимо определить соответствующие аппроксимирующие или предсказан-
126

Компьютерное моделирование
ные значения у. Новые_значения_х должны содержать столбец (или строку) для каждой независимой переменной, как и извест-
ные_значения_х. Если аргумент новые_значения_х опущен, то предполагается, что он совпадает с аргументом извест-
ные_значения_х
конст — логическое значение, которое указывает, требуется ли,
чтобы константа а0 была равна 0 (для функции ТЕНДЕНЦИЯ) или 1 (для функции РОСТ). При этом, если конст имеет значение
ИСТИНА или опущено, то а0 вычисляется обычным образом, а если конст имеет значение ЛОЖЬ, то а0 полагается = 0 или 1.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1.Приведите примеры задач, приводящих к общей постановке задачи линейного программирования.
2.Сформулируйте задачу линейного программирования.
3.Сколько решений может иметь задача линейного программирования?
4.По каким причинам может отсутствовать решение задачи линейного программирования?
5.Каким образом из неравенства из системы ограничений можно заменить уравнением?
6.Как задачу отыскания максимума линейной формы свести к задаче отыскания минимума?
7.как найти начальный базис?
8.Сформулируйте алгоритм симплекс-метода.
9.Сформулируйте условие задачи оптимизации.
10.Что называют допустимым решением (планом) задачи линейного программирования? оптимальным решением?
11.Из каких этапов состоит процесс решения задачи линейного программирования?
12.Приведите типовые примеры задач линейного программирования.
13.Что называется аппроксимацией?
14.Сформулируйте задачу аппроксимации в простейшем случае.
15.Как осуществляется аппроксимация экспериментальных данных в MS Excel. Какие варианты функций при этом возможны?
16.Какие специальные функции MS Excel могут быть использованы в том случае, когда аппроксимируемая переменная у зависит от нескольких независимых переменных х1,х2,...,хп?
127

ЛЕКЦИИ по дисциплине: «Компьютерное моделирование» Физико-математический факультет, 10 семестр, всего 33 часа
ЛЕКЦИЯ 8. МОДЕЛИРОВАНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН
8.1. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Переменная величина, принимающая различные числовые значения в зависимости от случая, называется случайной величиной. Допустим, некоторая величина Х может принимать значения: x1, x2, x3,…,xk (8.1)
Каждый раз, как выполняется некоторое сочетание условий, величина X принимает одно из значений (8.1). Пусть при этом вероятности для X принять то или иное из значений (8.1) соответственно
равны: p1, p2, ...,pk |
(8.2) |
|
|
n |
|
Очевидно, должно выполняться равенство: pi |
1 (8.3) |
i 1
поскольку (8.2) — полная группа событий.
Если вероятности (8.3) известны, то говорят, что распределение случайной величины X известно и что случайная величина X задана. Можно сказать, что задается полная система событий, и события состоят в том, что случайная величина принимает то или иное из значений (8.1) с вероятностями (8.2).
8.1.1.Случайная величина с дискретным распределением
В практических задачах обычно используются два вида случайных величин — дискретные и непрерывные. Рассмотрим сначала дискретные случайные величины. Случайная величина называется дискретной, если значения, которые она может принять, можно пронумеровать. Число этих значений может быть и неограниченным, нужно лишь, чтобы мог быть указан метод нумерации, при котором не будет пропущено ни одного возможного значения случайной величины. Иначе говоря, дискретной случайной величиной называется такая случайная величина, которая может принимать значения, образующие счетные множества. Примером дискретной случайной величины может, например, быть число солнечных пятен с площадью, большей некоторого заданного значения 5, наблюдаемых в течение дня на солнечном диске.

Компьютерное моделирование
Случайной величиной является также число лепестков в цветке сирени. Как известно, вероятность того, что у случайно выбранного цветка сирени имеется четыре лепестка, близка к единице, вероятности наличия трех и пяти лепестков малы, а вероятности наблюдения других значений числа лепестков ничтожно малы.
Законом распределения случайной величины X называется соответ-
ствие между значениями случайной величины (8.1) и вероятностями их реализации (8.2). Закон распределения может быть задан в виде таблицы, формулы или графика. Распределение дискретной случай-
ной величины называется дискретным распределением. Интегральным законом распределения или интегральной функцией распреде-
ления случайной величины X называется функция F(x), равная вероятности Р(Х < х), то есть вероятность того, что случайная величина X
примет значение, меньшее х: F(x) = P(X<x). |
(8.4) |
Очевидно, что F (x) pi где суммирование ведется по всем x,
xi x
для которых xi < х.
Функция F(x) является монотонно возрастающей функцией, так как при возрастании х к правой части (8.4) могут только добавиться положительные члены — вероятности событий. То есть если а > b, то F(a)> F(b). При изменении х от - до + функция F(x) растет от 0 до +1 и для дискретных случайных величин имеет ступенчатый вид, как, например, это показано на рис.8.1.
Рис.8.1. Интегральная функция распределения дискретной случайной величины
Если возможные значения X ограничены снизу величиной M1 то F(M1)= 0. Если возможные значения X ограничены сверху величиной М2, то F(M2+Δ)=1, где — положительная величина.
129

Тарова Инна Николаевна
Если а < b, то на основании теоремы сложения вероятностей справедливо равенство:
Р(Х <а) + Р(а<=Х<b) = Р(Х < b), откуда на основании (8.4) следует:
F(b)-F(a) = P(a<=x<b), то есть вероятность для случайной переменной принять значение, лежащее между а и b, равна разности интегральных функций распределения для значений b и а.
В качестве примера построения интегрального закона распределения возьмем электролампу, которая многократно включается и выключается. Вероятность перегорания лампы при одном включении и выключении равна р. Необходимо рассмотреть случайную величину
— порядковый номер включения и выключения, при которых лампа перегорит, и найти ее распределение.
Эта случайная переменная имеет, очевидно, бесконечно большое число возможных значений. Вероятность того, что лампа перегорит при k-м включении и выключении, равна произведению вероятности того, что она не перегорит при k-1 первых включениях и выключениях, на вероятность того, что при k-м включении и выключении она перегорит: (1-p)k-1p, k=i,2,....
Следовательно, возможные значения случайной переменной: 1,2,...,k, ... имеют соответственно вероятности: p,(1 -p)p,...,(1 –р)k-1
р,....
Вероятность того, что лампа не перегорит после k включений и выключений равна (1 - р)k, поэтому интегральный закон распределения:
F(k)=1-(1-р)k, k=1,2..... что можно получить и суммированием вероятностей значений случайной переменной до k- 1.
8.1.2. Непрерывная случайная величина
Непрерывной называется случайная величина, возможные значения которой непрерывно заполняют какой либо интервал (например, температура воздуха на улице). Допустим, что возможными значениями случайной величины X являются любые значения из некото-
рого промежутка [а,b]. Назовем интегральным законом распределе-
130