Обработка данных / [SHashkov_V.B.]_Obrabotka_yeksperimentalnueh_dannu(BookFi.org)
.pdf
2 Лекция 2. Точность и погрешности вычислений, способы их оценки и уменьшения погрешностей
2.1 Понятие приближенного числа и погрешности
Анализ точности результата вычислений является важной составной частью вычислительного процесса. В свое время Гаусс отмечал: “Недостатки математического образования с наибольшей отчетливостью проявляются в чрезмерной точности численных расчетов.” Реальная оценка практически достижимого уровня точности способствует не только экономии сил и средств, но часто связана с вопросами надежности достигнутых результатов и безопасности их прикладного использования. Это тем более существенно для процесса обработки экспериментальных данных, когда к обычным источникам ошибок входных величин и вычислений добавляется случайный характер основной экспериментальной величины - опытного значения изучаемой функции в виде отклика объекта исследования.
Анализ точности результата вычислений осуществляется на основе понятия погрешности. Пусть х1 -истинное значение некоторой величины, а xr - то значение, которое мы присваиваем ей в ходе эксперимента или экспертной оценки. Перечисленным процессам всегда присущи некоторые неизбежные ошибки (даже если не брать во внимание факторы случайности - влияние шума при определении отклика объекта исследования). Известно, например, что результат любого измерения в силу самой своей природы содержит ошибку. Поэтому значение xr называют приближенным значением изучаемой величины или просто приближенным числом.
Абсолютная погрешность ∆x любого приближенного числа есть абсолютная величина разности между истинным значением величины х1 и ее данным приближенным значением xr, т.е. ∆x = x1 − xr .
Истинное значение величины часто неизвестно и поэтому под оценкой абсолютной погрешности принимают установление неравенства вида
x1−xr |
|
≤∆x p, |
(1) |
|
|||
|
|
где ∆xp - предельная абсолютная погрешность.
Понятие предельной абсолютной погрешности означает число, которое не меньшее любого возможного значения абсолютной погрешности (причем при наименовании ∆x p термин “предельная” обычно опускают).
Существует принятый характер записи приближенных чисел, при котором абсолютная погрешность равна половине единицы последнего разряда, записываемого при обозначении данного числа. Это означает, что контекст записанных чисел 3,14 и 3,1416 требует разной точности указанных величин, а именно 0,005 в первом и 0,00005 - во втором случае. Если же обозна-
11
чение числа имеет большее количество цифр, чем это требуется по установленной точности, их следует округлить. Правила округления общеизвестны; отметим только, что если требуется отбросить цифру пять, то четная последняя оставшаяся в записи цифра сохраняется, а нечетная - увеличивается на единицу.
Такие правила записи чисел действуют при записи экспериментальных данных и в математических таблицах. В этой форме записи все цифры,
означающие данное число, являются верными.
В окончательных результатах расчета принято записывать числа, сохраняя одну недостоверную цифру за последней верной, причем предельную абсолютную погрешность указывают за этим результатом после знака “±”. Пусть, например, при расчете получено число 271,734 с предельной абсолютной погрешностью 0,043. Тогда последняя верная цифра - 7 после запятой, а последняя записываемая цифра - 3 после 7 и, согласно правилам, результат должен быть записан как 271,73 ± 0,05.
Но абсолютная погрешность характеризует точность приближенного числа явно недостаточно. Действительно, что такое абсолютная погрешность в 0,5 метра? Она недопустимо велика для отмеривания куска ткани в магазине и недопустимо мала для измерения расстояния между двумя городами. Таким образом, пригодность абсолютной погрешности выявляется только при сопоставлении с практическим значением данной переменной. При сопоставлении этих величин устанавливается значение так называемой относительной погрешности.
Относительная погрешность dx определяется как отношение абсолют-
ной погрешности ∆x (или∆x p ) |
к модулю истинного значения x1, т.е. |
|
|
dx= |
∆x |
. |
(2) |
|
x1 |
|
|
При оценке относительной погрешности обычно пользуются понятием предельной относительной погрешности dx p , которое удовлетворяет нера-
венству |
|
dx ≤dxp . |
(3) |
Это отношение иногда выражают в процентах умножением на 100 (процентная погрешность).
Погрешности в силу разных источников их происхождения классифи -
цируют как инструментальные, методические и неустранимые или на-
следственные.
Инструментальные погрешности связаны с конечной точностью представления исходной информации. Они вызываются, например, округлением значений входных величин или точностью их измерений.
12
Методические погрешности обусловлены тем, что многие задачи решаются приближенно с использованием специальных численных методов. Это, в частности, относится к тригонометрическим, логарифмическим, показательным и др. функциям.
Наследственные погрешности - это погрешности результата вычислений, вызванные распространением или трансформацией погрешностей исходных данных при прохождении их по вычислительному алгоритму через ряд промежуточных результатов. Именно неустранимые погрешности являются объектом нашего изучения.
2.2 Оценка погрешностей вычислительного процесса
В связи с изложеным возникают практические задачи, имеющие важное значение. Такими задачами, в частности, являются следующие.
Независимая переменная х известна с некоторой точностью. С какой точностью при этом можно найти значение функции y = f (x) по конкретной
математической зависимости?
Аналогично формируется и обратная задача : если необходимо рассчитать значение функции y с определенной точностью, то какова должна быть точность определения входного значения переменной х ?
В большинстве технических расчетов удовлетворительным считается такой уровень точности результата, при котором его максимальная относительная погрешность составляет от 0,1 до 5 % . Так, например, при переходе от старых единиц к Международной системе единиц (СИ) перевод килограмма силы в ньютоны можно осуществить введением множителя 10 вместо более точного множителя 9,81. Ошибка при этом составит
10 − 9,81 = 2 %,
9,81
что в большинстве случаев вполне допустимо.
Однако, такой уровень точности бывает и неприемлемым. Так, например, при запуске искусственных спутников Луны с околоземной орбиты вторую космическую скорость (около 11200 м/с) требуется выдержать с ошибкой, не превышающей 0,0002%. В противном случае запускаемый аппарат станет спутником не Луны, а Солнца.
Трансформация наследственных погрешностей при осуществлении вычислительного процесса осуществляется по определенным закономерностям. Наиболее важные случаи распространения ошибок приведены в табл. 4. Они, в частности, отвечают следующим правилам:
- при сложении ( вычитании) величин, содержащих ошибку, абсолютная погрешность их суммы (разности) равна сумме абсолютных погрешностей слагаемых (или уменьшаемого и вычитаемого);
- при умножении (или делении) относительная ошибка произведения (частного) равна сумме относительных ошибок сомножителей (делимого и делителя);
13
- предельная относительная погрешность степени равна предельной погрешности основания, умноженной на абсолютную величину показателя степени.
Таблица 4 - Распространение ошибок при вычислительных операциях
Операция вы- |
Вид |
Абсолютная ошибка |
Относительная ошибка |
||||||||||||||||||||||
числения |
функции |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Сложение |
х1+x2 |
|
|
∆ |
x1 + |
∆ |
x2 |
|
|
|
(∆ |
x1+ |
∆ |
|
|
|
|
||||||||
Вычитание |
x1-x2 |
|
|
|
|
|
|
|
|
|
|
|
x2)/ x1+x2 |
|
|||||||||||
∆ |
|
∆x1 + ∆ x2 |
|
|
|
(∆x1+∆x2)/ x1-x2 |
|||||||||||||||||||
Умножение |
x1 |
× |
x2 |
x1 |
× |
|
∆ |
x2 |
× |
x1 |
∆ |
|
|
|
|
∆ |
|
|
|
||||||
Деление |
|
/ |
|
|
x2 + |
|
|
|
∆ |
x1/ x1 + x2/ x2 |
|
||||||||||||||
x1 |
x2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∆ |
|
|
||||||
|
|
(∆x1× x2 +∆x2× x1 )/ х22 |
|
x1/ x1 + |
|
x2/ x2 |
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
Возведение в |
x |
n |
|
∆x × n × x |
n-1 |
|
|
|
|
n |
|
x/ x |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
× ∆ |
|
|
|
|
||||||
степень*
*Показатель степени n может принимать произвольные значения. Если n правильная дробь, то ошибка уменьшается.
Рассмотрим некоторые примеры применения этих положений. Пример 1. Диаметр круга D определен с некоторой погрешностью.
Как определить погрешность величины площади круга S, вычисленной по формуле
S =π |
D |
2 |
? |
|
|
|
|||
4 |
||||
|
|
|||
В нашем распоряжении мерная линейка и круг, вырезанный ножницами из жести по предварительно нанесенному контуру. Измеренный диаметр D составил 5 см, абсолютную погрешность для данных условий изготовления круга и измерения его диаметра оценивают как ± 2 мм. Тогда предельная от-
носительная погрешность равна 05,2 100 = 4 % и поскольку в вычислении за-
ложена операция умножения D×D, то согласно правилу 2, относительная погрешность вычисленной площади S круга составит
∆S/S = ∆D/D + ∆D/D = 4 + 4 = 8 %.
Тогда абсолютная погрешность площади круга
∆S = 0,08 ×S = 0,08 ×19,625 = 1,57 см2.
Пример 2. Известно, что площадь квадрата равна 12,34 см2.С какой погрешностью должна быть измерена сторона квадрата, чтобы расчет площади квадрата по ней обеспечил указанную точность?
14
Из выражения площади следует, что она дана с предельной абсолютной погрешностью 0,005 см 2, тогда относительная погрешность составит
(0,005/12,34) ×100 = 0,04 %.
Так как длина стороны квадрата L есть S в степени 0,5, то согласно третьему правилу распространения ошибок
∆L/L×100=|0,5|×0,04=0,02%,
откуда абсолютная погрешность измерения стороны квадрата составит
∆L= 
S ×0,02/100=0,0007 см.
Измерение стороны квадрата с такой малой погрешностью потребует специальных методов.
2.3 Рекомендации по уменьшению погрешностей вычислений
Анализ закономерностей формирования наследственных погрешностей результатов вычислений позволяет сделать следующие выводы относительно способов уменьшения значения этих погрешностей:
-при сложении и вычитании длинной последовательности чисел следует сначала оперировать с наименьшими по модулю числами;
-следует избегать вычитания близких по значению чисел, предпочи -
тая формулы вида
S =π(2r +h)h,
где S-площадь кругового кольца, r – внутренний радиус;
h – толщина кольца. алгебраически равноценным формулам вида
S=π[(r +h)2 −r2 ;
-нужно избегать сложения чисел, отличающихся на несколько порядков, преобразуя вычисления соответствующим образом ;
-при сложении длинной последовательности чисел целесообразно разделение ее на группы. Сложение ведут сначала внутри групп, а затем между группами с учетом требований предыдущего пункта .
-для уменьшения погрешностей округления чисел промежуточные
действия рекомендуется производить, сохраняя после запятой на 1-2 знака больше, чем требуется в окончательном результате.
15
3 Лекция 3. Математическая модель объекта исследования
ввиде алгебраического степенного полинома
3.1Основные задачи исследования и назначение математической
модели
Термин «исследование» - более широкое понятие, чем «эксперимент», т.к. включает в себя и его предварительную подготовку (сбор, анализ и обработку исходных данных) и проведение самого эксперимента и, наконец, обработку выходных данных.
С этой точки зрения основными составляющими исследования являются следующие задачи.
Статистический анализ (точечное и интервальное оценивание, проверка статистических гипотез) вовлекаемых в эксперимент факторов, а впоследствии и откликов объекта исследования. Следствием этой работы является отсеивание не существенных по влиянию на объект факторов и выделение факторов, определяющих отклик.
В разделе 1.1 лекции 1 приведен упрощенный пример планирования эксперимента в отношении диапазона значений факторов. Но реально дело обстоит гораздо серьезнее. В начале двадцатого века английский статистик Фишер начал разработку теории оптимального планирования эксперимента. В 1935 году вышла его монография на эту тему и этот год считается годом рождения новой математической дисциплины – теории планирования эксперимента. По необходимому количеству опытов, точности и достоверности результатов, объему информации и т.п. показателям научное планирование эксперимента позволяет повысить его эффективность в 3-10 раз. В связи с этим при практическом планировании эксперимента решается задача оптимизации – нахождения опытной комбинации уровней управляемых факторов,
которая отвечает экстремуму функции отклика.
Табличная функция у= f (X1, X 2, X 3, X 4,......) отражает какую-то неизвестную нам аналитическую зависимость , которую для упрощения обозна-
чим как ϕ(x) . В настоящее время нет методов, позволяющих найти точный
вид такой функции. Однако, известно, что любая функциональная зависимость может быть с любой степенью точности отражена алгебраическим степенным полином, причем точность отражения зависит от степени (длины) полинома. Поэтому следующей задачей исследования является идентифика-
ция функции отклика ϕ(x) - т.е. установление тождественности ϕ(x) своему образу-идентификатору в виде алгебраического степенного полинома
η(x,β) , где β - идеальные коэффициенты регрессии функции, которую мы будем называть идеальной математической моделью функции отклика ϕ(x) .
16
Такие модели могут быть линейно или нелинейно параметризованными по
параметру β . Мы будем работать с линейными функциями η(x,β) , кото-
рые имеют вид
n
η(x,β)= ∑β j f j (x), (4) j=0
где β =(β0,β1,β2,...,βj,...,βk )
Каждый βj при j функции f j (x), которые все вместе образуют век-
тор базисных функций. Элементы этого вектора могут содержать различные сочетания и степени факторов х. Таким образом, по базисным функциям математическая модель является не линейной.
Получение математической модели объекта исследования позволяет: - раскрыть наиболее существенные соотношения между факторами
(т.е. условиями работы объекта) и его откликами на них; - предсказать значение отклика для заданных комбинаций уровней
факторов, решая задачи как интерполяции, так и экстраполяции (последнее –
вопределенных пределах ;
-находить координаты точек минимумов и максимумов найденной математической модели;
-уточнять гипотетические и теоретические положения, существующие относительно объекта исследования;
-выдвигать новые гипотезы об объекте; уточнять теоретические положения о процессах, в нем протекающих.
3.2 Алгебраический степенной полином регрессии как математическая модель объекта исследования
Метод регрессионного анализа использует описание объекта исследования в виде полинома (5) – отрезка ряда Тейлора, в который разлагается не-
|
и факторов, т.е. функция ϕ( |
|
) |
|||||||||||||||||
известное уравнение связи отклика у |
x |
|||||||||||||||||||
M{y}=ϕ(x1, x2,..., xk ) =β0 + |
k |
|
|
|
|
k |
βij xi x j + |
|||||||||||||
∑ βi xi |
+ |
|
∑ |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
i=1 |
|
|
i=1; j>i |
|
(5) |
||||||
|
k |
|
|
|
|
|
|
|
|
k |
|
|
|
|
k |
|
|
|||
+ |
β |
|
x x |
|
x |
|
+... |
+ |
β |
|
x2 |
+ |
β |
|
x3 +... |
|||||
∑ |
ijq |
j |
q |
∑ |
ii |
∑ |
iii |
|||||||||||||
|
i=1; j>i;q> j |
|
i |
|
|
|
i=1 |
|
i |
|
i=1 |
|
i |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
где β - коэффициенты регрессии идеальной математической модели, при которой отклик приобретает значение своего математического ожидания.
17
При этом рекомендуется /1/ такая форма полинома, которая в качестве
базисных функций f j (x) содержит все возможные сочетания факторов х в
первой степени (единичные, парные, тройные и т.д.), а при степени больше единицы – только их единичные индивидуальные комбинации . Тогда в развернутом виде полином и принимает форму (5).
Существует ряд причин, в силу которых мы не можем найти полином, расчет по которому давал бы указанный результат. Во-первых, состояние любого сложного реального объекта определяется практически бесчисленным количеством факторов, и любая логическая модель объекта принципи - ально не может быть полной, а только приближенной. Во-вторых, точный
вид полинома, адекватный функции ϕ(x) , нам не известен также, как и сама
функция ϕ(x) .
Поэтому та зависимость, которую мы находим по таблице экспериментальных данных, не дает точной связи между уg и факторами, включенными в математическую модель, и по результатам эксперимента находится не идеальное уравнение (2), а только его статистическая оценка в виде эмпирического уравнения
yg =b |
+k∑1b x |
+ |
k∑2 |
b |
x x |
j |
+...+k∑3b |
x3+... |
(6) |
0 |
i=1 i i |
|
i=1, j>i |
ij |
i |
i=1 iii |
i |
|
где b – «выборочные» эмпирические коэффициенты регрессии. Последние, таким образом, являются лишь оценками для теоретических
коэффициентов β, а отклик объекта уg - оценкой для математического ожидания M{yg}.
18
4 Лекция 4. Полиномы регрессии – приближенное отражение идеальной математической модели объекта исследования
Все изложенное выше позволяет представить идентификацию функции отклика объекта исследования в виде схемы
ϕ(x) =η(x,β) ≈η(x,b) =ϕ)(x) =η)(x,β) ,
где три последних функции есть статистические оценки ϕ(x), а фун-
кции η(x,β) и η(x,b) − сокращенными записями уравнений (5) и (6) соот-
ветственно. Вид полинома η(x,b), адекватный идеальной модели η(x,β),
нам не известен, и если относительно него нет каких-либо теоретических или профессиональных соображений, то приходится прибегать к выработанным практикой рекомендациям.
Практика обработки экспериментальных данных показала, что результаты эксперимента в виде табличной функции в большинстве случаев с достаточным приближением отражаются полным кубическим полиномом по форме уравнения (6). Часто третья степень полинома не только достаточна, но и избыточна, т.е. степень и количество членов полинома можно и уменьшить без существенной потери точности. Поэтому при построении и выборе аппроксимирующего уравнения строят систему альтернативных уравнений из полного кубического полинома и его отдельных степенных кусков. Сравнивая характеристики точности отражения таблицы экспериментальных данных этими уравнениями, выбирают наиболее приемлемое.
Вкачестве примера такого подхода рассмотрим кубическое уравнение для 5-ти факторной задачи регрессии.
Всоответствии с формой (6) полный кубический пятифакторный полином будет иметь следующий вид
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5+b12x1x2+b13x1x3+b14x1x4 + |
|
+b15x1x5+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+ b123x1x2x3+ |
|
+b124x1x2x4+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5+ |
|
+b1234x1x2x3x4++b1235x1x2x3x5+b1345x1x3x4x5++b2345x2x3x4x5+ |
|
+b12345x1x2x3x4x5++b11x12+b22x22+b33x32+b44x42+b55x52+b111x13+ |
|
b222x23 +b333x33+b444x43 +b555x53, |
(7) |
который содержит все возможные сочетания факторов х1,х2,х3 и т.д. в первой степени и члены полинома с единичными факторами в степени более единицы.
19
Полином (7) и будет первым альтернативным уравнением регрессии. Далее приведем все альтернативные уравнения в виде отдельных степенных кусков.
Линейное уравнение (как первый степенной кусок)
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5.
Неполное квадратичное уравнение, содержащее линейную часть и парные сочетания факторов
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5.
Неполное кубическое уравнение, содержащее линейную часть, парные и тройные сочетания факторов
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+ +b123x1x2x3+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5.
Неполное уравнение четвертой степени, содержащее линейную часть, парные, тройные и четверные сочетания факторов
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+
+b123x1x2x3+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5+ +b1234x1x2x3x4+…+b1345x1x3x4x5++b2345x2x3x4x5.
Следующий степенной кусок по аналогии, с добавлением к предыду-
щему уравнению члена из сочетания «по пять из пяти»: +b12345x1x2x3x4x5. Это будет уже шестое альтернативное уравнение, на котором комбинации
факторов х в первой степени кончаются.
Седьмое и последнее уравнение – полный полином второй степени
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+
+b123x1x2x3+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5+ +b1234x1x2x3x4+…+b2345x2x3x4x5+ b12345x1x2x3x4x5+
+b11x12+b22x22+b33x32+b44x42+b55x52.
20
