Der erste Schritt beim wissenschaftlichen Rechnen vom Problem zur Lösung ist das Modellieren des zu lösenden Problems, also das Formulieren des Problems in der Sprache der Mathematik. Hier gibt es viel Spielraum. Sehr einfache Modelle lassen sich leichter algorithmisch Lösen, geben die Realität unter Umständen aber zu ungenau wieder. Komplexe Modelle hingegen liefern deutlich besser verwertbare Ergebnisse, so man sie algorithmisch überhaupt umgesetzt bekommt. Schon beim Modellieren müssen die algorithmischen Möglichkeiten mitgedacht werden!
2.1Anforderungen an ein gutes Modell¶
Als grundlegende Anforderungen an ein Modell können die sogenannten Hadamard-Bedingungen gelten:
Existenz: Das Modell besitzt eine Lösung.
Eindeutigkeit: Das Modell besitzt genau eine Lösung.
Stetigkeit: Die Lösung hängt stetig von den Eingaben ab, kleine Änderungen in den Eingaben resultieren also auch nur in kleinen Änderungen bei der Lösung.
Ein Modell, das keine Lösung besitzt, ist offensichtlich wertlos. Die Forderung nach Eindeutigkeit ist weniger wesentlich. Manchmal lässt der modellierte Sachverhalt keine eindeutige Lösung zu, z.B. weil zu wenig Messdaten vorhanden sind. In solch einem Fall sollte bei der Modellierung allerdings geprüft werden, ob Eindeutigkeit der Lösung durch sachlich begründbare Zusatzannahmen erreicht werden kann. Nicht-Eindeutigkeit führt oft zu Problemen bei der algorithmischen Umsetzung.
Die Forderung nach Stetigkeit entspricht dem Begriff der Kondition in der numerischen Mathematik. Hängt die Lösung nicht stetig von den Eingaben ab, so ist das Modell unbrauchbar. Schon kleine, unvermeidbare Rundungsfehler führen zu völlig anderen Ergebnissen als die exakten Werte. Praktisch werden die Eingaben oft Messwerte sein und damit ohnehin einen großen Fehler aufweisen. Verletzt ein ansonsten plausibles Modell die Stetigkeitsforderung, so können allgemeine anwendbare Techniken eingesetzt werden, um daraus ein stetiges Modell abzuleiten. Als Beispiel für diese Problematik diskutieren wir später die Computertomografie im Detail.
Die Forderungen von Hadamard stammen aus den 1930er Jahren, wurden also noch vor dem Beginn des Computerzeitalters formuliert. Heute müssen wir noch eine vierte Forderung formulieren:
algorithmische Lösbarkeit: Das Modell muss mit dem Computer lösbar sein, es muss also ein Algorithmus existieren, der die Lösung wenigstens Näherungsweise liefert.
Negativbeispiele sind hier vorallem nichtglatte nichtlineare Optimierungsprobleme, die oft als naheliegendes, einfach zu formulierendes Modell auftreten, aber mangels geeigneter Algorithmen praktisch nicht lösbar sind.
2.2Klassische Modelle¶
Als klassische Modelle verstehen wir alle Modelle, die folgenden Kriterien genügen:
Die Eingaben sind Zahlen oder Funktionen.
Die Ausgaben sind Zahlen oder Funktionen.
Der Zusammenhang lässt sich mit einfachen mathematischen Werkzeugen in wenigen Formeln darstellen.
Meist wird der Zusammenhang zwischen Ein- und Ausgaben über (partielle) Ableitungen und/oder Integrale von Funktionen dargestellt. Diese werden dann in Gleichungssystemen oder Optimierungsproblemen zu einander in Beziehung gesetzt.
Typische Beispiele sind Modelle aus der klassischen Mechanik, die aus dem Newton’schen Gesetz “” gewonnen wurden, und Modelle die aus Erhaltungssätzen (Erhaltung von Masse, Energie, Trägheitsmoment,...) entstanden sind.
Gegenbeispiel sind quantentheoretische Modelle, die für die Formulierung meist lineare Abbildungen zwischen unendlichdimensionalen Vektorräumen benötigen, sowie statistische und datenbasierte Modelle (siehe unten).
2.3Beispiele¶
2.3.1Momentangeschwindigkeit¶
Zu festen Zeitpunkten wird der bis zum jeweiligen Zeitpunkt zurückgelegte Weg gemessen. Gesucht sind die Momentangeschwindigkeiten zu jedem Messzeitpunkt.
Ein mögliches Modell zur Berechnung der Momentangeschwindigkeit ergibt sich direkt aus der Definition:
Eingaben: Weg-Zeit-Zusammenhang und Zeitpunkt .
Ausgabe: Momentangeschwindigkeit zur Zeit .
Zusammenhang: .
Für den praktischen Einsatz des Modells werden wir dieses diskretisieren müssen. Die Eingabefunktion werden wir durch eine auf den Messwerten basierenden Näherung ersetzen müssen. Die Ausgabe besteht nur aus einer Zahl, sodass hier keine Diskretisierung nötig ist. In Abhängigkeit von der Diskretisierung ist dann noch zu klären, wie ausgewertet werden kann.
Ein anderes, in gewisser Hinsicht leichter handhabbares Modell ergibt sich aus dem Hauptsatz der Differential- und Integralrechnung:
Nehmen wir an und bezeichnen wir für beliebige Funktionen mit die Funktion
so ist die Momentangeschwindigkeit (zu jedem Zeitpunkt) die Lösung der Integralgleichung
Entsprechend folgt dann . Diskretisieren der Gleichung wird auf ein lineares Gleichungssystem führen.
Wir haben also zwei recht unterschiedliche Modelle (Ableitung vs. Integralgleichung) für ein und das selbe Problem gefunden. Später werden wir uns genauer mit deren Diskretisierung, sowie Vor- und Nachteilen befassen.
2.3.2Brachistochrone¶
Hatten schon kurz ein Modell für das Brachistochronen-Problem erwähnt. Leiten dieses nun aus elementaren physikalischen Gegebenheiten her.
Vereinfachen durch geeignete Wahl des Koordinatenursprungs die Notation etwas: Die Kugel starte im Punkt zur Zeit komme am Endpunkt zur Zeit an. Die Bahn werde durch eine Funktion beschrieben. Alternativ ist auch die Schreibweise für die Position der Kugel zum Zeitpunkt nützlich. Zu berechnen ist die benötigte Zeit in Abhängigkeit von der Bahn . Benötigte physikalische Größen und Gesetze führen zum Ziel:
(potentielle Energie der Kugel zur Zeit relativ zum Startpunkt; ist Masse der Kugel; ist die Fallbeschleunigung),
(kinetische Energie der Kugel zur Zeit ; ist der Betrag der Geschwindigkeit zur Zeit ),
zu jeder Zeit (bei klar; anschließend gilt Energieerhaltung).
Daraus erhält man die Formel
(IDVID 210). Die schnellste Bahn ist somit die Lösung des Minimierungsproblems
wobei die Menge aller auf stetig differenzierbaren Funktionen ist.
Die Polstelle im Integrand bei (also ) ist unkritisch, da die minimierende Funktion endliches Integral besitzen wird, sofern mindestens ein in diese Eigenschaft hat (z.B. ).
Das gefundene Minimierungsproblem als Modell für die Berechnung der Brachistochrone lässt sich sogar analytisch lösen, muss also nicht zwingend numerisch gelöst werden. Das Problem gehört aber zu einer allgemeineren Klasse von Problemen, die sich nicht immer analytisch lösen lassen:
mit einer das konkrete Problem definierenden Funktion , wobei und gegeben sind.
2.3.3Pendel¶
Die Bewegung eines Fadenpendels kann als Funktion beschrieben werden, die zu jedem Zeitpunkt die Auslenkung des Pendels als Winkel relativ zur Ruheposition angibt. Sind (Anfangsauslenkung) und (Anfangswinkelgeschwindigkeit) vorgegeben, so ist der Bewegungsablauf durch das Newton’sche Gesetz
eindeutig vorherbestimmt. Dabei geben und die Koordinaten der Pendelmasse zur Zeit an und ist die auf die Pendelmasse wirkende Kraft. Diese kann prinzipiell von der Position (und somit indirekt von der Zeit) und auch direkt von der Zeit abhängen (Pendel befindet sich z.B. in einer zeitlich und räumlich veränderlichen Luftströmung). Wirkt nur die Schwerkraft, so erhält man aus dem Newton’schen Gesetz Gleichung
zur Beschreibung der Pendelbewegung (IDVID 230). Diese ist eine nichtlineare gewöhnliche Differentialgleichung zweiter Ordnung, die sich nur sehr mühsam analytisch lösen lässt.
Für kleine Auslenkungen kann man die Näherung
verwenden um einen einfacher zu lösende linear gewöhnliche Differentialgleichung zu erhalten:
Der dabei entstehende Modellfehler ist um so größer je größer die Auslenkung des Pendels ist. Ob die Situation diese Vereinfachung rechtfertigt, muss im Einzelfall entschieden werden. Zu bedenken ist, dass auch das nichtlineare Modell schon Fehler enthält, z.B.:
Vernachlässigung der Reibung,
Idealisierung von Seil und schwingendem Objekt als Massepunkt,
Vernachlässigung der Dehnung des Seils durch Zugkraft.
2.3.4Zerfalls- und Wachstumsprozesse¶
Zerfallsprozesse und Wachstumsprozesse können durch gewöhnliche Differentialgleichungen beschrieben werden. Betrachten hier beispielhaft einen konkreten Zerfallsprozess: Eine zum Zeitpunkt vorhandene Masse eines Materials unterliege dem radioaktiven Zerfall. Zu jedem Zeitpunkt ist die Masse des noch nicht zerfallenen Materials gesucht. Die Funktion soll durch eine gewöhnliche Differentialgleichung mit Anfangsbedingung beschrieben werden.
Dazu zunächst zwei Beobachtungen:
Da Zerfallsprozesse je nach Material und Umgebung unterschiedlich schnell verlaufen können, muss die gesuchte Differentialgleichung einen Parameter enthalten, in den die Zerfallsgeschwindigkeit eingeht.
Aus der Beobachtung von Zerfallsprozessen ist bekannt, dass der in einem Zeitintervall zerfallende Massenanteil nicht von der am Intervallanfang vorhandenen Masse abhängt, sondern nur von der Länge des Intervalls.
Daraus erhält man die Beziehung
(IDVID 250). Dies ist eine homogene lineare Differentialgleichung erster Ordnung mit konstanten Koeffizienten. Sie drückt aus, dass die Änderung der Materialmenge stets proportional zur vorhandenen Materialmenge ist.
Die Anfangsbedingung ist
Für sind die Lösungen offensichtlich monoton wachsend, sonst monoton fallend. Die allgemeine Lösung ist
mit . Einsetzen des Anfangswertes liefert
2.4Statistische Modelle¶
Sind Eingabe und/oder Ausgaben statistische Größen (Zufallsgrößen, Verteilungsfunktionen, Dichtefunktionen,...) so spricht man von statistischen Modellen. Diese Unterscheiden sich sowohl in der Herleitung als auch in der algorithmischen Behandlung wesentlich von den klassischen Modellen.
Statistische Modelle treten in allen Wissenschaftsgebieten auf, in denen Systeme als Zusammenspiel sehr vieler gleichartiger Einzelsysteme untersucht werden. Die Spannbreite reicht von den Sozialwissenschaften über die Wirtschaftswissenschaften bis zur Physik.
In der Physik gibt es das Teilgebiet der statistischen Physik, welche statistische Modelle nutzt um insbesondere eine Vielzahl thermodynamischer Zusammenhänge zu formulieren. Statt eine extrem große Anzahl von interagierenden Teilchen durch teilchenbasierte Einzelmodelle zu beschreiben (was die verfügbare Rechenleistung von Computern gar nicht erlaubt), werden nur die statistischen Eigenschaften des Gesamtsystems untersucht.
2.5Datenbasierte Modelle¶
Möchte man einen komplexen Vorgang modellieren, zu dessen Abbildungsverhalten schon sehr viele Messwerte vorliegen (welche Eingabe liefert welche Ausgabe?), so kann man automatisiert aus diesen Messwerten ein Modell generieren, welchen dieses Abbildungsverhalten auf die Menger aller möglichen Eingaben verallgemeinert. Dieser Form des Modellierens wird als datenbasiertes Modellieren oder als maschinelles Lernen bezeichnet.
Seien Paare von Eingaben (Vektoren in ) und zugehörigen Ausgaben (reelle Zahlen), die sogennanten Trainingsdaten, und sei eine von reellen Parametern abhängige Funktion. Dann ist das Minimierungsproblem
zu lösen. Die daraus erhaltenen Parameter liefern ein konkretes als Modell für den Zusammenhang zwischen beobachteten Ein- und Ausgaben, welches auch bisher nicht beobachtete Eingaben verarbeiten kann.
Typische Wahlen für sind Linearkombinationen einfacher Ansatzfunktionen (z.B. Monome, Hütchenfunktionen) oder speziell strukturierte, rekursiv definierte Verschachtelungen sehr einfacher Grundfunktionen (z.B. nichtlinear transformiertes Skalarprodukt aus Eingabevektor und Parametervektor). In ersterem Fall spricht man von linearer Regression, im zweiten Fall von künstlichen neuronalen Netzen.
Vorteile gegenüber klassischen Modellen:
Physikalische oder anderweitige Zusammenhänge zwischen Ein- und Ausgaben müssen nicht bekannt sein.
Leichte algorithmische Auswertung der Modelle (zur Eingabe berechne den Funktionswert ).
Nachteile:
Zuverlässigkeit bei Eingaben, die nicht sehr nah an den Trainingsdaten sind, ist unklar.
Bereich der Eingaben, die korrekten Ausgaben liefern, ist unklar.
Lösung des Minimierungsproblems isz im Fall neuronaler Netze sehr aufwendig. Meist ist nur eine sehr grobe Näherung des eigentlichen Minimierers verfügbar.
Es sind keine strukturellen Erkenntnisse aus dem Modell ableitbar (Warum gerade diese Ausgabe? “Black-Box”).
Es werden große Mengen qualitativ hochwertiger Trainingsdaten benötigt.