Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

Der erste Schritt beim wissenschaftlichen Rechnen vom Problem zur Lösung ist das Modellieren des zu lösenden Problems, also das Formulieren des Problems in der Sprache der Mathematik. Hier gibt es viel Spielraum. Sehr einfache Modelle lassen sich leichter algorithmisch Lösen, geben die Realität unter Umständen aber zu ungenau wieder. Komplexe Modelle hingegen liefern deutlich besser verwertbare Ergebnisse, so man sie algorithmisch überhaupt umgesetzt bekommt. Schon beim Modellieren müssen die algorithmischen Möglichkeiten mitgedacht werden!

2.1Anforderungen an ein gutes Modell

Als grundlegende Anforderungen an ein Modell können die sogenannten Hadamard-Bedingungen gelten:

Ein Modell, das keine Lösung besitzt, ist offensichtlich wertlos. Die Forderung nach Eindeutigkeit ist weniger wesentlich. Manchmal lässt der modellierte Sachverhalt keine eindeutige Lösung zu, z.B. weil zu wenig Messdaten vorhanden sind. In solch einem Fall sollte bei der Modellierung allerdings geprüft werden, ob Eindeutigkeit der Lösung durch sachlich begründbare Zusatzannahmen erreicht werden kann. Nicht-Eindeutigkeit führt oft zu Problemen bei der algorithmischen Umsetzung.

Die Forderung nach Stetigkeit entspricht dem Begriff der Kondition in der numerischen Mathematik. Hängt die Lösung nicht stetig von den Eingaben ab, so ist das Modell unbrauchbar. Schon kleine, unvermeidbare Rundungsfehler führen zu völlig anderen Ergebnissen als die exakten Werte. Praktisch werden die Eingaben oft Messwerte sein und damit ohnehin einen großen Fehler aufweisen. Verletzt ein ansonsten plausibles Modell die Stetigkeitsforderung, so können allgemeine anwendbare Techniken eingesetzt werden, um daraus ein stetiges Modell abzuleiten. Als Beispiel für diese Problematik diskutieren wir später die Computertomografie im Detail.

Die Forderungen von Hadamard stammen aus den 1930er Jahren, wurden also noch vor dem Beginn des Computerzeitalters formuliert. Heute müssen wir noch eine vierte Forderung formulieren:

Negativbeispiele sind hier vorallem nichtglatte nichtlineare Optimierungsprobleme, die oft als naheliegendes, einfach zu formulierendes Modell auftreten, aber mangels geeigneter Algorithmen praktisch nicht lösbar sind.

2.2Klassische Modelle

Als klassische Modelle verstehen wir alle Modelle, die folgenden Kriterien genügen:

Meist wird der Zusammenhang zwischen Ein- und Ausgaben über (partielle) Ableitungen und/oder Integrale von Funktionen dargestellt. Diese werden dann in Gleichungssystemen oder Optimierungsproblemen zu einander in Beziehung gesetzt.

Typische Beispiele sind Modelle aus der klassischen Mechanik, die aus dem Newton’schen Gesetz “F=maF=m\,a” gewonnen wurden, und Modelle die aus Erhaltungssätzen (Erhaltung von Masse, Energie, Trägheitsmoment,...) entstanden sind.

Gegenbeispiel sind quantentheoretische Modelle, die für die Formulierung meist lineare Abbildungen zwischen unendlichdimensionalen Vektorräumen benötigen, sowie statistische und datenbasierte Modelle (siehe unten).

2.3Beispiele

2.3.1Momentangeschwindigkeit

Zu festen Zeitpunkten t1,,tnt_1,\ldots,t_n wird der bis zum jeweiligen Zeitpunkt zurückgelegte Weg s1,,sns_1,\ldots,s_n gemessen. Gesucht sind die Momentangeschwindigkeiten v1,,vnv_1,\ldots,v_n zu jedem Messzeitpunkt.

Ein mögliches Modell zur Berechnung der Momentangeschwindigkeit ergibt sich direkt aus der Definition:

Für den praktischen Einsatz des Modells werden wir dieses diskretisieren müssen. Die Eingabefunktion ss werden wir durch eine auf den Messwerten s1,,sns_1,\ldots,s_n basierenden Näherung ersetzen müssen. Die Ausgabe besteht nur aus einer Zahl, sodass hier keine Diskretisierung nötig ist. In Abhängigkeit von der Diskretisierung ist dann noch zu klären, wie ss' ausgewertet werden kann.

Ein anderes, in gewisser Hinsicht leichter handhabbares Modell ergibt sich aus dem Hauptsatz der Differential- und Integralrechnung:

s(t)=s(0)+0ts(τ)dτ.s(t)=s(0)+\int_0^t s'(\tau)\diff\tau.

Nehmen wir s(0)=0s(0)=0 an und bezeichnen wir für beliebige Funktionen g:[0,T]g:[0,T] mit F(g)F(g) die Funktion

(F(g))(t):=0tg(τ)dτ,t[0,T],\bigl(F(g)\bigr)(t):=\int_0^t g(\tau)\diff\tau, \quad t\in[0, T],

so ist die Momentangeschwindigkeit vv (zu jedem Zeitpunkt) die Lösung der Integralgleichung

F(v)=s.F(v)=s.

Entsprechend folgt dann v=v(t)v^\ast=v(t^\ast). Diskretisieren der Gleichung wird auf ein lineares Gleichungssystem führen.

Wir haben also zwei recht unterschiedliche Modelle (Ableitung vs. Integralgleichung) für ein und das selbe Problem gefunden. Später werden wir uns genauer mit deren Diskretisierung, sowie Vor- und Nachteilen befassen.

2.3.2Brachistochrone

Hatten schon kurz ein Modell für das Brachistochronen-Problem erwähnt. Leiten dieses nun aus elementaren physikalischen Gegebenheiten her.

Vereinfachen durch geeignete Wahl des Koordinatenursprungs die Notation etwas: Die Kugel starte im Punkt (0,0)(0,0) zur Zeit t=0t=0 komme am Endpunkt (xˉ,yˉ)(\bar{x},\bar{y}) zur Zeit T>0T>0 an. Die Bahn werde durch eine Funktion h:[0,xˉ]Rh:[0,\bar{x}]\to\bbR beschrieben. Alternativ ist auch die Schreibweise (x(t),y(t))(x(t),y(t)) für die Position der Kugel zum Zeitpunkt tt nützlich. Zu berechnen ist die benötigte Zeit TT in Abhängigkeit von der Bahn hh. Benötigte physikalische Größen und Gesetze führen zum Ziel:

Daraus erhält man die Formel

T(h)=12g0xˉ1+h(x)2h(x)dxT(h)=\frac{1}{\sqrt{2\,g}}\,\int_0^{\bar{x}}\sqrt{\frac{1+h'(x)^2}{-h(x)}}\diff x

(IDVID 210). Die schnellste Bahn ist somit die Lösung des Minimierungsproblems

T(h)minhH,T(h)\to\min_{h\in H},

wobei HH die Menge aller auf [0,xˉ][0,\bar{x}] stetig differenzierbaren Funktionen ist.

Die Polstelle im Integrand bei x=0x=0 (also h(x)=0h(x)=0) ist unkritisch, da die minimierende Funktion hh endliches Integral besitzen wird, sofern mindestens ein hh in HH diese Eigenschaft hat (z.B. h(x)=(x)h(x)=-\sqrt(x)).

Das gefundene Minimierungsproblem als Modell für die Berechnung der Brachistochrone lässt sich sogar analytisch lösen, muss also nicht zwingend numerisch gelöst werden. Das Problem gehört aber zu einer allgemeineren Klasse von Problemen, die sich nicht immer analytisch lösen lassen:

x1x2F(h(x),h(x),x)dxminhH\int_{x_1}^{x_2}F\bigl(h(x),h'(x),x\bigr)\diff x\to\min_{h\in H}

mit einer das konkrete Problem definierenden Funktion F:R3RF:\bbR^3\to\bbR, wobei h(x1)h(x_1) und h(x2)h(x_2) gegeben sind.

2.3.3Pendel

Die Bewegung eines Fadenpendels kann als Funktion φ:[0,)[π2,π2]\varphi:[0,\infty)\to[-\frac{\pi}{2},\frac{\pi}{2}] beschrieben werden, die zu jedem Zeitpunkt tt die Auslenkung des Pendels als Winkel relativ zur Ruheposition angibt. Sind φ(0)\varphi(0) (Anfangsauslenkung) und φ(0)\varphi'(0) (Anfangswinkelgeschwindigkeit) vorgegeben, so ist der Bewegungsablauf durch das Newton’sche Gesetz

F(t,x(t),y(t))=m[x(t)y(t)],t>0,F(t,x(t),y(t))=m\,\begin{bmatrix}x''(t)\\y''(t)\end{bmatrix},\quad t>0,

eindeutig vorherbestimmt. Dabei geben x(t)x(t) und y(t)y(t) die Koordinaten der Pendelmasse mm zur Zeit tt an und FF ist die auf die Pendelmasse wirkende Kraft. Diese kann prinzipiell von der Position (und somit indirekt von der Zeit) und auch direkt von der Zeit abhängen (Pendel befindet sich z.B. in einer zeitlich und räumlich veränderlichen Luftströmung). Wirkt nur die Schwerkraft, so erhält man aus dem Newton’schen Gesetz Gleichung

φ(t)+glsinφ(t)=0\varphi''(t)+\frac{g}{l}\,\sin\varphi(t)=0

zur Beschreibung der Pendelbewegung (IDVID 230). Diese ist eine nichtlineare gewöhnliche Differentialgleichung zweiter Ordnung, die sich nur sehr mühsam analytisch lösen lässt.

Für kleine Auslenkungen kann man die Näherung

sinφ(t)φ(t)\sin\varphi(t)\approx\varphi(t)

verwenden um einen einfacher zu lösende linear gewöhnliche Differentialgleichung zu erhalten:

φ(t)+glφ(t)=0.\varphi''(t)+\frac{g}{l}\,\varphi(t)=0.

Der dabei entstehende Modellfehler ist um so größer je größer die Auslenkung des Pendels ist. Ob die Situation diese Vereinfachung rechtfertigt, muss im Einzelfall entschieden werden. Zu bedenken ist, dass auch das nichtlineare Modell schon Fehler enthält, z.B.:

2.3.4Zerfalls- und Wachstumsprozesse

Zerfallsprozesse und Wachstumsprozesse können durch gewöhnliche Differentialgleichungen beschrieben werden. Betrachten hier beispielhaft einen konkreten Zerfallsprozess: Eine zum Zeitpunkt t=0t=0 vorhandene Masse m0m_0 eines Materials unterliege dem radioaktiven Zerfall. Zu jedem Zeitpunkt t0t\geq 0 ist die Masse m(t)m(t) des noch nicht zerfallenen Materials gesucht. Die Funktion m:[0,)Rm:[0,\infty)\to\bbR soll durch eine gewöhnliche Differentialgleichung mit Anfangsbedingung beschrieben werden.

Dazu zunächst zwei Beobachtungen:

Daraus erhält man die Beziehung

m=cmm'=c\,m

(IDVID 250). Dies ist eine homogene lineare Differentialgleichung erster Ordnung mit konstanten Koeffizienten. Sie drückt aus, dass die Änderung mm' der Materialmenge stets proportional zur vorhandenen Materialmenge mm ist.

Die Anfangsbedingung ist

m(0)=m0.m(0)=m_0.

Für c>0c>0 sind die Lösungen offensichtlich monoton wachsend, sonst monoton fallend. Die allgemeine Lösung ist

m(t)=aectm(t)=a\,\rme^{c\,t}

mit aRa\in\bbR. Einsetzen des Anfangswertes liefert

m(t)=m0ect.m(t)=m_0\,\rme^{c\,t}.

2.4Statistische Modelle

Sind Eingabe und/oder Ausgaben statistische Größen (Zufallsgrößen, Verteilungsfunktionen, Dichtefunktionen,...) so spricht man von statistischen Modellen. Diese Unterscheiden sich sowohl in der Herleitung als auch in der algorithmischen Behandlung wesentlich von den klassischen Modellen.

Statistische Modelle treten in allen Wissenschaftsgebieten auf, in denen Systeme als Zusammenspiel sehr vieler gleichartiger Einzelsysteme untersucht werden. Die Spannbreite reicht von den Sozialwissenschaften über die Wirtschaftswissenschaften bis zur Physik.

In der Physik gibt es das Teilgebiet der statistischen Physik, welche statistische Modelle nutzt um insbesondere eine Vielzahl thermodynamischer Zusammenhänge zu formulieren. Statt eine extrem große Anzahl von interagierenden Teilchen durch teilchenbasierte Einzelmodelle zu beschreiben (was die verfügbare Rechenleistung von Computern gar nicht erlaubt), werden nur die statistischen Eigenschaften des Gesamtsystems untersucht.

2.5Datenbasierte Modelle

Möchte man einen komplexen Vorgang modellieren, zu dessen Abbildungsverhalten schon sehr viele Messwerte vorliegen (welche Eingabe liefert welche Ausgabe?), so kann man automatisiert aus diesen Messwerten ein Modell generieren, welchen dieses Abbildungsverhalten auf die Menger aller möglichen Eingaben verallgemeinert. Dieser Form des Modellierens wird als datenbasiertes Modellieren oder als maschinelles Lernen bezeichnet.

Seien (x1,y1),,(xn,yn)(x_1,y_1),\ldots,(x_n,y_n) Paare von Eingaben (Vektoren in Rm\bbR^m) und zugehörigen Ausgaben (reelle Zahlen), die sogennanten Trainingsdaten, und sei f:RmRf:\bbR^m\to\bbR eine von reellen Parametern w1,,wpw_1,\ldots,w_p abhängige Funktion. Dann ist das Minimierungsproblem

l=1n(f(xl)yl)2minParameter in f\sum_{l=1}^n\bigl(f(x_l)-y_l\bigr)^2\to\min_{\text{Parameter in $f$}}

zu lösen. Die daraus erhaltenen Parameter liefern ein konkretes ff als Modell für den Zusammenhang zwischen beobachteten Ein- und Ausgaben, welches auch bisher nicht beobachtete Eingaben verarbeiten kann.

Typische Wahlen für ff sind Linearkombinationen einfacher Ansatzfunktionen (z.B. Monome, Hütchenfunktionen) oder speziell strukturierte, rekursiv definierte Verschachtelungen sehr einfacher Grundfunktionen (z.B. nichtlinear transformiertes Skalarprodukt aus Eingabevektor und Parametervektor). In ersterem Fall spricht man von linearer Regression, im zweiten Fall von künstlichen neuronalen Netzen.

Vorteile gegenüber klassischen Modellen:

Nachteile: