Konfidenzintervalle - Einführung#
Was sind Konfidenzintervalle?#
Punktschätzer liefert Wert, der den wahren Parameter höchstwahrscheinlich nicht genau trifft
Frage: Wie gut kann man sich auf den Schätzwert verlassen?
Konfidenzintervalle helfen diese Frage zu beantworten
Konfidenzintervalle liefern einen (zufälligen) Bereich, welcher mit hoher Wahrscheinlichkeit den wahren Wert überdeckt.
Da hier ein Intervall geschätzt wird, sprechen wir auch von Intervallschätzern.
Definition
Ein Intervall
welches zu einem vorgegebenen Wert \(\alpha \in (0,1)\) die Bedingung
erfüllt, heißt Konfidenzintervall (oder Vertrauensintervall) zum Niveau \(1 - \alpha\).
Man nennt \(1 - \alpha\) Konfidenzniveau (oder Vertrauenswahrscheinlichkeit).
Beachte:
\(I(X_1,\dots,X_n)\) ist zufällig
\(\theta \in \Theta\) ist fest (aber unbekannt)
Bemerkungen zum Konfidenzintervall
Um ein Konfidenzintervall zu bestimmen, wählt man zuerst einen Wert \(\alpha\).
Typische Werte sind \(\alpha = 0.05\) oder \(\alpha = 0.01\).Die Intervallgrenzen \(g_u\) und \(g_o\) können \(-\infty\) bzw. \(\infty\) annehmen.
D.h. Intervalle der Art \((-\infty, b]\) oder \([a, \infty)\) sind möglich. Diese nennt man einseitige Konfidenzintervalle.Die Realisierung \(I(x_1,\dots,x_n)\) des Konfidenzintervalls für eine konkrete Stichprobe heißt konkretes Konfidenzintervall.
Warum nicht einfach \(\alpha=0\) wählen?
Dies bedeutet wir suchen einen Bereich \(I\), welcher den Parameter \(\theta\) mit Wahrscheinlichkeit \(1\) enthält
Diese Forderung liefert typischerweise \(I=\Theta\) und daher keinen Erkenntnisgewinn.
Interpretation#
Sei \(I(X_1,\dots,X_n)\) ein Konfidenzintervall zum Konfidenzniveau \(1-\alpha\) für die Größe \(\theta\). Dann treffen folgende Aussagen zu
Das (zufällige) Intervall \(I(X_1,\dots,X_n)\) enthält den wahren Parameter \(\theta\) mit einer Wahrscheinlichkeit von (mindestens) \(1-\alpha\).
Im Mittel enthalten \((1-\alpha)\cdot 100\%\) der auf diese Weise konstruierten Konfidenzintervalle den wahren Parameter \(\theta\).
Ein Möglichkeit ist es also allgemein über das Verfahren zu sprechen und zu erklären, dass dies mit Wahrscheinlichkeit \(1-\alpha\) zu einer Überdeckung der gesuchten Größe führt. Eine andere Möglichkeit ist es sich vorzustellen, dass man wieder und wieder Stichproben nimmt und daraus auf gleiche Weise Konfidenzintervalle berechnet. Von diesen enthalten dann im Mittel \((1-\alpha)\cdot 100 \%\) der Intervalle den Wert \(\theta\).
Warnung
Über das konkrete Konfidenzintervall (mit ausgerechneten Zahlen) lässt sich keine Wahrscheinlichkeitsaussage treffen!
Einseitige vs Zweiseitige Konfidenzintervalle#
Zweiseitiges Konfidenzintervall#
Ein zweiseitiges Konfidenzintervall hat die Form:
Es schneidet symmetrisch am linken und rechten Rand der Verteilung einen Bereich mit je einer Wahrscheinlichkeit von \(\alpha/2\), so dass der wahre Wert mit einer Wahrscheinlichkeit von \(1-\alpha\) vom Intervall überdeckt wird.
Es wird verwendet, wenn:
Abweichungen nach unten und oben gleichermaßen relevant sind,
wenn die Stichprobe von einem unabhängigen Beobachter bewertet wird,
man keine Richtung vorgibt, in der der Parameter vom Referenzwert abweichen könnte/sollte/darf.
Beispiel: Man will prüfen, ob die durchschnittliche Füllmenge von einem Sollwert abweicht - egal ob nach oben oder unten.
Einseitiges Konfidenzintervall#
Ein einseitiges Konfidenzintervall hat die Form:
Es berücksichtigt nur eine Richtung der Abweichung und legt das gesamte \(\alpha\) auf eine Seite der Verteilung. Es schneidet entweder nur am linken oder nur am rechten Rand der Verteilung einen Bereich mit einer Wahrscheinlichkeit von \(\alpha\) ab, so dass der wahre Wert mit einer Wahrscheinlichkeit von \(1-\alpha\) vom Intervall überdeckt wird.
Es wird verwendet, wenn
nur Abweichungen in eine Richtung relevant oder kritisch sind,
wenn man ein „parteiischer“ Beobachter der Stichprobe ist,
wenn man entweder nur an oberen oder nur an unteren Schranken interessiert sind, welche typischerweise eingehalten werden.
Es wird typischerweise so erstellt, dass das Intervall möglichst viele - aus der eigenen Sicht - günstige Fälle enthält.
Beispiel: Ein Kühlhaus darf nicht wärmer als \(-18^\circ\)C sein. In diesem Fall interessiert nur, ob der Mittelwert über dem Grenzwert liegt. Man verwendet ein Intervall der Form \((-\infty, b]\).