Erwartungswert und Varianz#
Wie wir das von Stichproben kennen, gibt es auch für Zufallsvariablen gewisse Maßzahlen, welche die Verteilung beschreiben. Zwei besonders wichtige sind der Erwartungswert und die Varianz. Auf dieser Seite führen wir diese für diskrete Zufallsvariablen. Entsprechende Kennzahlen gibt es aber auch im Falle stetiger Zufallsvariablen.
Definition#
Definition
Sei \(X\) eine diskrete Zufallsvariable mit Trägermenge \(T=\{x_1,x_2,\dots\}\). Dann ist
der Erwartungswert von \(X\) definiert durch
\[ \mathbb E(X) = \sum_{i} x_i \cdot \mathbb P(X=x_i) \]die Varianz von \(X\) definiert durch
\[ \mathrm{Var}(X) = \sum_{i} (x_i- \mathbb E(X))^2 \cdot \mathbb P(X=x_i) \]
Den Wert \(\sqrt{\mathrm{Var}(X)}\) nennt man Standardabweichung von \(X\).
Einen wichtigen Trick für die Berechnung von \(\mathrm{Var}(X)\) liefert die folgende Formel (genannt Verschiebungssatz):
Für die Berechnung von \(\mathbb E(X^2)\) gilt
Interpretation
der Erwartungswert beschreibt den mittleren Wert der Zufallsvariable \(X\), also den Wert um den die Realsierungen der Zufallsvariable schwanken.
die Varianz beschreibt die mittlere quadratische Schwankung um den Erwartungswert, sie ist also ein Maß dafür wie stark die Realisierungen der Zufallsvariable um \(\mathbb E(X)\) streuen.
Beispiel#
Schauen wir uns gleich im Beipiel an, wie man dies berechnet.
Beispiel: Gewinnspiel
Dies ist die Fortsetzung von dem Gewinnspiel-Beispiel von vorher. Die Zufallsvariable \(X\) ist hier beschrieben durch:
Wert \(x\) |
-1 |
10 |
20 |
---|---|---|---|
\(\mathbb P (X=x)\) |
\(\frac{30}{32}\) |
\(\frac{1}{32}\) |
\(\frac{1}{32}\) |
Der Erwartungswert:
\[ \mathbb E(X)= \sum_{i=1}^3 x_i \cdot \mathbb P(X=x_i) = -1\cdot \frac{30}{32}+ 10\cdot \frac{1}{32}+20\cdot \frac{1}{32}= 0\]Im Mittel ist Gewinn und Verlust also ausgeglichen. Auf lange Sicht würde weder der eine noch der andere Spieler einen Vorteil haben. Daher ist das Spiel fair.
Die Varianz:
\[ \mathrm{Var}(X)= \mathbb E(X^2) - (\mathbb E(X))^2 = 16.5625 - 0^2 = 16.5625\]Denn Wert \(\mathbb E(X^2)\) haben wir wie folgt berechnet:
\[\mathbb E(X^2) =\sum_{i} x_i^2 \cdot \mathbb P(X=x_i)= (-1)^2\cdot \frac{30}{32}+ 10^2\cdot \frac{1}{32}+20^2\cdot \frac{1}{32}= 16.5625\]
Wir ändern die Auszahlungen und berechnen dann noch einmal Erwartungswert und Varianz.
Variante 2
Jetzt soll gelten
Wert \(x\)
-2
10
20
\(\mathbb P (X=x)\)
\(\frac{30}{32}\)
\(\frac{1}{32}\)
\(\frac{1}{32}\)
Damit ändert sich der Wert zu
\[\mathbb E(X) = -2\cdot \frac{30}{32}+ 10\cdot \frac{1}{32}+20\cdot \frac{1}{32}= -0.9375\]Jetzt macht ein Spieler also pro Spiel im Mittel \(0.9375\) Euro verlust (und der andere Spieler macht im Mittel \(0.9375\) Euro Gewinn). Die Varianz hat sich auch verändert:
\[\mathbb E(X^2) = (-2)^2\cdot \frac{30}{32}+ 10^2\cdot \frac{1}{32}+20^2\cdot \frac{1}{32}= 19.375\]\[ \mathrm{Var}(X) = \mathbb E(X^2)- \mathbb E(X)^2 =19.375 - (-0.9375)^2 = 18.49609375\]Die Varianz hat sich also erhöht, die Werte schwanken jetzt stärker um \(\mathbb E(X)\).
Variante 3
Jetzt soll gelten
Wert \(x\)
-2
10
50
\(\mathbb P (X=x)\)
\(\frac{30}{32}\)
\(\frac{1}{32}\)
\(\frac{1}{32}\)
Nun gilt:
\[\mathbb E(X)=0\quad\text{und}\quad \mathrm{Var}(X) =85\]Die der Erwartungswert ist wieder gleich \(0\). Die Varianz ist im Vergleich zur Ausgangssituation aber deutlich erhöht, die Werte schwanken sehr stark.
Variante 4
Jetzt soll gelten
Wert \(x\)
-1
11
51
\(\mathbb P (X=x)\)
\(\frac{30}{32}\)
\(\frac{1}{32}\)
\(\frac{1}{32}\)
Wir haben also alle Auszahlungen um 1 erhöht. Damit wird auch der Erwartungswert um 1 höher. Die Varianz ändert sich aber nicht, da die Werte noch gleich stark schwanken (nur um einen anderen Wert).
\[\mathbb E(X)=1\quad\text{und}\quad \mathrm{Var}(X) =85\]
Rechenregeln#
Wir haben im Beispiel schon ein paar Regeln gesehen. Wir halten sie hier noch mal fest.
Rechenregeln
Sei \(X\) eine Zufallsvariable und \(a\) eine reelle Zahl, dann gilt
\(\mathbb E(a X)= a \mathbb E(X)\) |
\(\mathbb E(X+a)= \mathbb E(X)+a\) |
\(\mathrm{Var}(aX)= a^2\mathrm{Var}(X)\) |
\(\mathrm{Var}(X+a)= \mathrm{Var}(X)\) |
Ist \(Y\) noch eine weitere Zufallsvariable, so gilt
\(\mathbb E(X+Y)= \mathbb E(X) + \mathbb E(Y)\)
Ist \(a\in\mathbb R\), so gilt
\(\mathbb E(a) = a \quad \text{und}\quad \mathrm{Var}(a) = 0\)
Wir sehen hier was mit Erwartungswert und Varianz passiert, wenn die Zufallsvariable mit einer reellen Zahl addiert oder multipliziert wird. Außerdem ist ersichtlich, dass der Erwartungswert der Summe von Zufallsvariablen gleich der Summe der Erwartungswerte ist. Eine ähnliche Regel gibt es auch für die Varianz der Summe zweier Zufallsvariablen. Allerdings kommt in entsprechender Formel die Kovarianz vor. Diese Größe lernen wir erst etwas später kennen.
Im letzten Punkt der Bemerkung, sehen wir was passiert, wenn Erwartungswert und Varianz einer reellen Zahl (also einer Zufallsvariable, die immer den gleichen Wert liefert) berechnet werden soll. Die Varianz einer Zufallsvaribale die immer den gleichen Wert annimmt, ist gleich Null. Der Erwartungswert einer solchen Variable/Zahl, ist die Zahl selbst.