Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Koch_Mathematik fur das Ingenieurstudium.pdf
Скачиваний:
107
Добавлен:
21.02.2016
Размер:
17.74 Mб
Скачать

10.4 Ausgleichsrechnung

409

10.4 Ausgleichsrechnung

Bei der Ausgleichsrechnung besteht die Aufgabe darin, eine Anzahl von Messpunkten durch eine Modellfunktion anzunähern. Dabei sollen die Abweichungen zwischen den Messpunkten und dem Modell ausgeglichen werden. Gute Verfahren minimieren diese Abweichungen. Wir nehmen an, es liegen n Messpunkte (x1, y1), . . . , (xn, yn) vor. Eine geeignete Modellfunktion f soll diese Punkte möglichst gut annähern. Hat die Modellfunktion genügend freie Parameter, so kann man die Messpunkte exakt durchlaufen. Dann spricht man von Interpolation. Eine einfache Variante der Interpolation haben wir in Abschnitt 5.9.1 kennengelernt. Hat die Modellfunktion jedoch weniger freie Parameter als Messpunkte vorliegen, so kann man die Messpunkte in der Regel nur näherungsweise erreichen. In diesem Fall spricht man von Approximation oder Ausgleichsrechnung.

10.4.1 Methode der kleinsten Fehlerquadrate

Wir machen für diesen Abschnitt einen gedanklichen Sprung. Waren bislang die Funktionen mit mehreren Variablen mit f(x1, . . . , xn) bezeichnet, so betrachten wir nun Funktionen f(c1, . . . , cm). Zu gegebenen Messpunkten (x1, y1), . . . , (xn, yn) und einer ausgewählten Modellfunktion f bestehen die Abweichungen

di = f(xi) − yi, i = 1, . . . , n.

Es stellt sich die Frage, wie diese Abweichungen möglichst klein werden können. Ein möglicher Ansatz ist, die Abweichungen aufzusummieren und diese Summe zu minimieren:

nn

d = Qdi = Q(f(xi) − yi) → min .

i=1 i=1

Ein wesentlicher Nachteil dieses Ansatzes ist, dass sich positive und negative Abweichungen gegenseitig aufheben. Dadurch ist keine hohe Approximationsgüte zu erwarten. In einem zweiten Ansatz könnte man die Beträge der Abweichungen aufsummieren und über die Modellparameter minimieren:

nn

d = QSdiS = QSf(xi) − yiS → min .

i=1 i=1

Dadurch werden alle Abweichungen berücksichtigt. Allerdings ist die Minimierung dieser Summe nicht ganz einfach, da sie Beträge enthält. Terme mit Beträgen ziehen in der Regel Fallunterscheidungen nach sich. Dieses Vorgehen ist also nicht elegant. In einem dritten Ansatz nehmen wir die Quadrate der Abweichungen:

nn

d = Qd2i = Q(f(xi) − yi)2 → min .

i=1 i=1

Dadurch werden wieder alle Abweichungen gleichermaßen berücksichtigt, und die Summe enthält keine störenden Beträge mehr. Dieses Vorgehen nennt man die Methode der kleinsten Fehlerquadrate. Sie geht auf Johann Carl Friedrich Gauß zurück.

410

10 Funktionen mit mehreren Variablen

Definition 10.16 (Methode der kleinsten Fehlerquadrate)

Bei der Gaußschen Methode der kleinsten Fehlerquadrate minimiert man die Summe der Quadrate der Di erenzen zwischen den Messwerten yi und den Funktionswerten an den Messstellen f(xi) für i = 1, 2, . . . , n:

nn

d = Qd2i = Q(f(xi) − yi)2 → min .

i=1 i=1

y

 

 

f(x)

yn

 

 

 

dn

 

 

 

 

 

 

di

 

yi

 

 

 

y1

d1

 

 

 

x1

xi xn

x

Die Minimierung bei der Methode der kleinsten Fehlerquadrate läuft dabei über die Modellparameter c1, . . . , cm der Funktion f(x) = f(x, c1, . . . , cm). Wir werden in den folgenden Abschnitten unterschiedliche Typen von Modellfunktionen im Detail betrachten.

10.4.2 Ausgleichsrechnung mit Polynomen

Wir lösen in diesem Abschnitt Ausgleichsprobleme durch einen polynomialen Ansatz. Wir nehmen an, es liegen n Messpunkte (x1, y1), . . . , (xn, yn) vor. Oftmals ist es aus der Erfahrung heraus möglich, einen groben Zusammenhang zwischen den Messwerten yi und den Messstellen xi anzugeben. In vielen Fällen ist dieser Zusammenhang linear oder quadratisch, aber auch ein Zusammenhang in Form eines Polynoms höheren Grades ist möglich.

Definition 10.17 (Ausgleichspolynom)

Ein Ausgleichspolynom ist ein Polynom vom Grad m, welches die Modellparameter c0 bis cm enthält:

f(x, c0, c1, . . . , cm) = c0 + c1 x + c2 x2 + . . . + cmxm.

Beispiel 10.23 (Ausgleichsgerade)

Wir suchen eine Gerade f(x) = c0 + c1 x, die möglichst gut zu den Punkten

(0 S 0), (1 S 1), (2 S 4)

passt. Zunächst müssen wir einen Weg finden, das Problem mathematisch zu formulieren. Dazu betrachten wir die Abweichungen zwischen der Geraden und den gewünschten Funktionswerten

d0 = f(0)−0, d1 = f(1)−1, d2 = f(2)−4.

y

4

3

2f (x) = c0 + c1 x

1

−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

1

2

3

4

5

 

Natürlich könnten wir die Gerade so bestimmen, dass jeweils zwei dieser Fehler null werden,

10.4 Ausgleichsrechnung

411

allerdings wird dadurch der Fehler am dritten Punkt relativ groß. Bei der Methode der kleinsten Fehlerquadrate bestimmt man die Gerade so, dass die Summe der Fehlerquadrate

d = d20 + d21 + d22 → min

minimal wird. Die Gesamtabweichung d ist eine Funktion, die nur noch von c0 und c1 abhängt:

d(c0, c1) = c20 + (c0 + c1 − 1)2 + (c0 + 2 c1 − 4)2.

Mit den partiellen Ableitungen nach c0 und c1 ergeben sich die Bedingungen

 

dc0

 

c0, c1

 

2 c0

2 c0

c1

1 2 c0

2 c1

4

0

Diese

dc1

(c0, c1) =

 

+ 2(c0

+ c1

1) +

4(c0

+ 2 c1

4) =

0

 

(

 

) =

 

(

+

) +

(

+

) =

 

 

notwendigen Bedingungen für ein Minimum bilden das lineares Gleichungssystem

 

6 c0

+

6 c1

=

10

 

 

 

 

 

 

 

 

 

6 c0

10 c1

18

 

 

 

 

 

 

 

 

das die

Lösung c0

 

1

und c1

 

2 hat. Die gesuchte Gerade ist f x

 

1

 

2x.

 

+

= −

3

=

=

(

) = −

3

+

 

Ì

 

 

 

 

 

 

Die Vorgehensweise aus Beispiel 10.23 lässt sich auf Polynome vom Grad m

f(x) = c0 + c1 x + c2 x2 + . . . + cm xm

verallgemeinern. Zu den Daten

(x1, y1), (x2, y2), . . . , (xn, yn)

bestimmen wir das Polynom so, dass die Summe der Fehlerquadrate

d(c0, c1, . . . , cm) = (f(x1) − y1)2 + (f(x2) − y2)2 + . . . + (f(xn) − yn)2

minimal wird. Die einzelnen Abweichungen lassen sich in einem Gleichungssystem sehr

elegant darstellen:

d1 “ ’ 1 x1

d2 — – 1 x2

— = –

— –

dn • ” 1 xn

. . . x1m

“ ’

c0

“ ’

y1

.

. . . x2m

c1

y2

m

— –

cm

yn

. . . xn

— –

− –

 

— –

 

 

 

• ”

 

 

´¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¶ ´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶´¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¶ ´¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¶

d

A

c

y

Die dabei auftretende Matrix A ist die sogenannte Vandermondesche Matrix, benannt nach Alexandre-Théophile Vandermonde.

Definition 10.18 (Vandermondesche Matrix)

Die Vandermondesche Matrix zu gegebenen Werten x1, . . . , xn und zu gegebenem Grad m besteht aus Potenzen dieser Werte:

1

x

 

x2

 

xm

1

x2

x22

x2m

 

 

1

1

 

1

 

 

 

 

 

 

 

 

 

 

 

1

x

 

x2

 

xm

n

n

n

 

 

 

 

 

 

 

 

 

 

 

412

10 Funktionen mit mehreren Variablen

Die Summe der Fehlerquadrate lässt sich auch in Form eines Skalarproduktes darstellen:

d21 + d22 + . . . + d2n = dTd.

Dabei bezeichnet dT den transponierten Vektor von d. Die freien Parameter c0 bis cm können wir in einem Vektor c zusammenfassen. Insgesamt ergibt sich somit die Darstellung

d(c) = dTd = (Ac y)T (Ac y) = ‰cTAT yTŽ (Ac y) .

Durch Ausmultiplizieren der Klammern erhalten wir

d(c) = cTATAc cTATy yTAc + yTy = cTATAc − 2 yTAc + yTy.

In dieser Form lassen sich die partiellen Ableitungen berechnen:

∂d(c) = 2 cTATA − 2 yTA. c

Ohne weiter auf die Details einzugehen, haben wir dabei Di erenziationsregeln für vektorwertige Funktionen verwendet. Nach den notwendigen Bedingungen für ein Minimum müssen die partiellen Ableitungen null sein. Das führt nach Bildung der Transponierten auf die sogenannten Normalengleichungen

∂d c

2 cTATA = 2 yTA Ô ATAc = ATy.

(c ) = 0 Ô

Man erkennt, dass die Matrix ATA quadratisch und symmetrisch ist. In der Praxis werden die Normalengleichungen oft mit dem Algorithmus von Gauß gelöst. Allerdings ist bei größeren Systemen oder ungünstigen Messdaten Vorsicht geboten. Numerisch stabilere Ergebnisse erhält man mit der sogenannten QR-Zerlegung, siehe [Golub].

Definition 10.19 (Normalengleichungen für Ausgleichspolynome)

Die Normalengleichungen der Methode der kleinsten Fehlerquadrate zu den Messpunkten (xi, yi) mit i = 1, 2, . . . , n für ein Ausgleichspolynom mit Koe zientenvektor c lauten

ATAc = ATy.

Dabei ist A die Vandermondesche Matrix der Messstellen xi und y der Vektor mit den Messwerten yi.

Bei oberflächlicher Betrachtung der Normalengleichungen könnte man in Versuchung geraten, mit der Matrix AT kürzen zu wollen. Dies ist in aller Regel jedoch nicht möglich, denn bei Matrizen kann aus AB1 = AB2 nicht auf B1 = B2 geschlossen werden. In der Praxis ist für die Berechnung einer Ausgleichsgeraden oder einer Ausgleichsparabel auch folgendes Schema hilfreich:

10.4 Ausgleichsrechnung

413

Bestimmung der Normalengleichungen für Ausgleichspolynome

Zur Bestimmung der Normalengleichungen trägt man die Messpunkte (xi, yi) für i = 1, 2, . . . , n spaltenweise in die Tabelle ein und ergänzt die restlichen Einträge:

 

 

 

 

 

 

xi

 

yi

 

 

xi2

 

xiyi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

x1

 

y1

 

 

x12

 

x1y1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

xn

 

yn

 

 

 

2

 

xnyn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

yi

 

 

 

xi

 

 

xiyi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

A und A

T

y:

Die letzte Zeile der Tabelle enthält dann die Elemente von A

 

 

 

 

T

 

 

n

 

xi

 

xi2

 

 

 

T

 

 

yi

 

 

 

 

 

 

 

xi

 

xi2

 

xi3

 

 

 

xiyi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A A

 

x2

 

x3

 

x4

 

 

, A y

x2yi

.

 

 

 

 

 

 

 

 

i

 

 

i

 

i

 

 

 

 

i

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Beispiel 10.24 (Normalengleichgungen einer Ausgleichsgerade)

Wir betrachten nochmals die Problemstellung aus Beispiel 10.23. Das überbestimmte lineare Gleichungssystem der Ausgleichsgerade f(x) = c0 + c1 x, die möglichst gut zu den Punkten

0 0

,

(1 S 1)

,

 

(2 S 4)

 

 

 

 

 

 

 

 

passt, lautet( S )

 

 

 

 

 

 

 

 

 

 

 

1

0

 

c1

 

0

.

 

 

 

 

 

 

1

1

 

 

1

 

 

 

 

 

 

1

2

— Œ

c0

‘ = –

4

 

 

 

 

 

 

 

A

 

c

 

y

 

 

 

 

 

 

 

 

 

´¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¶

´¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¶

 

 

 

 

 

 

 

´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶

 

 

 

 

 

 

 

 

 

 

 

 

Wir multiplizieren dieses System mit AT

 

 

 

 

 

 

0 1 2

 

1

0

 

c1

 

0 1 2

 

0

 

 

1 1

 

 

 

1

Œ

1

1

1

‘ –

1 2

Œ

c0

‘ = Œ

1 1 1

4

 

AT

 

 

 

 

A

 

c

 

AT

 

y

´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶

 

 

 

 

´¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¶ ´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶

´¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¶

 

 

 

 

 

 

´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶

 

 

 

 

 

und erhalten dasselbe lineare Gleichungssystem

 

 

 

 

Œ

3

3

‘ Œ

c0

‘ = Œ

5

 

 

 

 

 

 

 

3 5

c1

9

 

 

 

 

 

 

 

´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶ ´¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¶

´¹¹¹¹¹¹¸¹¹¹¹¹¶

 

 

 

 

 

 

 

 

ATA

 

 

c

 

 

ATy

 

 

 

 

 

 

 

wie in Beispiel 10.23.

 

 

 

 

 

 

 

 

 

 

 

 

Ì

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]