48
Sitzungen
verstehe. Die Erfahrung aus vielen Anwendungen zeigt, dass folgende Modellstruktur
für die quantitative Beschreibung eines dynamischen Systems fast immer angemessen ist:
1. Es gibt eine Systemgleichung: Sei der Zustand eines Systems zur Zeit t durch die
Größe X(t) charakterisiert. Dann gebe es eine Gleichung für das zeitliche Ver-
halten von X(t). Das kann ein Satz von Differentialgleichungen sein oder eine
Gleichung, die einen stochastischen Prozess für X(t) formuliert. In einem stati-
schen, d. h. nicht zeitabhängigen Problem kann aber auch X eine Funktion einer
anderen Variablen, z. B. dem Ort sein, die den Zustand des Systems charakteri-
siert.
2. Es gibt eine Beobachtungsgleichung: In der Regel kann man die Systemgrößen
X nicht direkt beobachten. Stattdessen kann man eine Größe Y(t) messen oder
beobachten, die von X bzw. X(t) in irgendeiner Weise abhängt. Dabei ist zwei-
erlei zu beachten: Zum einen ist die Menge der beobachtbaren Komponenten
von Y(t) im allgemeinen verschieden von der Menge der Komponenten von X(t),
meistens ist sie kleiner. Zum anderen tritt immer ein Messfehler bzw. Beobach-
tungsfehler auf, der die Beobachtungsgleichung zu einer stochastischen Bezie-
hung macht, z. B. von der Form
Y(t) = F[X,t] + o E(t),
wobei F[.,t] die Beziehung zwischen X und Y andeutet, E(t) eine Zufallsvariable
darstellt, die den Messfehler charakterisiert. In vielen Fällen ist diese eine stan-
dardnormalverteilte Zufallsvariable (d. h. mit verschwindendem Erwartungs-
wert und einer Standardabweichung gleich 1). Dann stellt a die Standardabwei-
chung des Messfehlers dar.
Sowohl System- wie Beobachtungsgleichung enthalten Parameter. Erst wenn man
diese kennt, kann man von einem fertigen Modell reden.
3. Die drei typischen Fragen im Rahmen eines Modells
Gegeben solch eine Modellstruktur, kann man drei mathematische Ziele in der daten-
gestützten Modellierung ausmachen:
3.1. Schätzen des Hintergrundprozesses
Das einfachste und damit zuerst zu nennende Ziel ist die Schätzung des Hintergrund-
prozesses {X(t)} bei gegebenen Parametern des Modells und gegebenen Daten {Y(t)}.
Ein klassisches Problem dieser Art ist: Seien {X(t)} die Koordinaten und Geschwin-
digkeiten eines Raumschiffes, das nicht direkt beobachtet werden kann, {Y(t)J die Sig-
nale, die per Funk vom Raumschiff empfangen werden. Dann möchte man aus den
Funkdaten {Y(t)} auf die Koordinaten und Geschwindigkeiten des Raumschiffes
schließen. Aber auch die sogenannten „Inversen Probleme“, bei denen eine System-
gleichung für {X(t)} gar nicht vorliegt, somit nur eine Beobachtungsgleichung existiert,
sind hier zu nennen. Auf diese werde ich im letzten Teil des Vortrages genauer ein-
gehen.
3.2. Modellidentifikation
Das zweite Problem ist die Schätzung der Parameter des Modells aus den Daten, also
die Verfertigung des Modells mit Hilfe der Daten. Die Schätzung dieser Parameter
sollte nicht nur bestimmte Werte liefern, sondern auch deren Vertrauensintervalle, so
dass man z. B. das Intervall angeben kann, in dem mit 68% Wahrscheinlichkeit der
wahre Wert der Parameter liegt.
Sitzungen
verstehe. Die Erfahrung aus vielen Anwendungen zeigt, dass folgende Modellstruktur
für die quantitative Beschreibung eines dynamischen Systems fast immer angemessen ist:
1. Es gibt eine Systemgleichung: Sei der Zustand eines Systems zur Zeit t durch die
Größe X(t) charakterisiert. Dann gebe es eine Gleichung für das zeitliche Ver-
halten von X(t). Das kann ein Satz von Differentialgleichungen sein oder eine
Gleichung, die einen stochastischen Prozess für X(t) formuliert. In einem stati-
schen, d. h. nicht zeitabhängigen Problem kann aber auch X eine Funktion einer
anderen Variablen, z. B. dem Ort sein, die den Zustand des Systems charakteri-
siert.
2. Es gibt eine Beobachtungsgleichung: In der Regel kann man die Systemgrößen
X nicht direkt beobachten. Stattdessen kann man eine Größe Y(t) messen oder
beobachten, die von X bzw. X(t) in irgendeiner Weise abhängt. Dabei ist zwei-
erlei zu beachten: Zum einen ist die Menge der beobachtbaren Komponenten
von Y(t) im allgemeinen verschieden von der Menge der Komponenten von X(t),
meistens ist sie kleiner. Zum anderen tritt immer ein Messfehler bzw. Beobach-
tungsfehler auf, der die Beobachtungsgleichung zu einer stochastischen Bezie-
hung macht, z. B. von der Form
Y(t) = F[X,t] + o E(t),
wobei F[.,t] die Beziehung zwischen X und Y andeutet, E(t) eine Zufallsvariable
darstellt, die den Messfehler charakterisiert. In vielen Fällen ist diese eine stan-
dardnormalverteilte Zufallsvariable (d. h. mit verschwindendem Erwartungs-
wert und einer Standardabweichung gleich 1). Dann stellt a die Standardabwei-
chung des Messfehlers dar.
Sowohl System- wie Beobachtungsgleichung enthalten Parameter. Erst wenn man
diese kennt, kann man von einem fertigen Modell reden.
3. Die drei typischen Fragen im Rahmen eines Modells
Gegeben solch eine Modellstruktur, kann man drei mathematische Ziele in der daten-
gestützten Modellierung ausmachen:
3.1. Schätzen des Hintergrundprozesses
Das einfachste und damit zuerst zu nennende Ziel ist die Schätzung des Hintergrund-
prozesses {X(t)} bei gegebenen Parametern des Modells und gegebenen Daten {Y(t)}.
Ein klassisches Problem dieser Art ist: Seien {X(t)} die Koordinaten und Geschwin-
digkeiten eines Raumschiffes, das nicht direkt beobachtet werden kann, {Y(t)J die Sig-
nale, die per Funk vom Raumschiff empfangen werden. Dann möchte man aus den
Funkdaten {Y(t)} auf die Koordinaten und Geschwindigkeiten des Raumschiffes
schließen. Aber auch die sogenannten „Inversen Probleme“, bei denen eine System-
gleichung für {X(t)} gar nicht vorliegt, somit nur eine Beobachtungsgleichung existiert,
sind hier zu nennen. Auf diese werde ich im letzten Teil des Vortrages genauer ein-
gehen.
3.2. Modellidentifikation
Das zweite Problem ist die Schätzung der Parameter des Modells aus den Daten, also
die Verfertigung des Modells mit Hilfe der Daten. Die Schätzung dieser Parameter
sollte nicht nur bestimmte Werte liefern, sondern auch deren Vertrauensintervalle, so
dass man z. B. das Intervall angeben kann, in dem mit 68% Wahrscheinlichkeit der
wahre Wert der Parameter liegt.