# Konfidenzintervalle - Einführung

## Was sind Konfidenzintervalle?

- Punktschätzer liefert Wert, der den wahren Parameter höchstwahrscheinlich nicht genau trifft  
- **Frage:** Wie gut kann man sich auf den Schätzwert verlassen?  
- Konfidenzintervalle helfen diese Frage zu beantworten  
- Konfidenzintervalle liefern *einen (zufälligen) Bereich, welcher mit hoher Wahrscheinlichkeit den wahren Wert überdeckt.*  
- Da hier ein Intervall geschätzt wird, sprechen wir auch von Intervallschätzern.

---

:::{admonition} Definition
:class: definition


Ein Intervall  

$$
I(X_1,\dots,X_n) = [g_u(X_1,\dots,X_n), g_o(X_1,\dots,X_n)]
$$  

welches zu einem vorgegebenen Wert $\alpha \in (0,1)$ die Bedingung  

$$
\mathbb{P}(\theta \in I(X_1,\dots,X_n)) \geq 1 - \alpha
$$  

erfüllt, heißt **Konfidenzintervall** (oder **Vertrauensintervall**) zum Niveau $1 - \alpha$.  
Man nennt $1 - \alpha$ **Konfidenzniveau** (oder **Vertrauenswahrscheinlichkeit**).

:::


**Beachte:**

- *$I(X_1,\dots,X_n)$ ist zufällig*
- *$\theta \in \Theta$ ist fest (aber unbekannt)*

---

:::{admonition} Bemerkungen zum Konfidenzintervall
:class: bemerkung

- Um ein Konfidenzintervall zu bestimmen, wählt man **zuerst** einen Wert $\alpha$.  
  Typische Werte sind $\alpha = 0.05$ oder $\alpha = 0.01$.
- Die Intervallgrenzen $g_u$ und $g_o$ können $-\infty$ bzw. $\infty$ annehmen.  
  D.h. Intervalle der Art $(-\infty, b]$ oder $[a, \infty)$ sind möglich. Diese nennt man **einseitige Konfidenzintervalle**.
- Die Realisierung $I(x_1,\dots,x_n)$ des Konfidenzintervalls für eine konkrete Stichprobe heißt **konkretes Konfidenzintervall**.

:::


**Warum nicht einfach $\alpha=0$ wählen?**

- Dies bedeutet wir suchen einen Bereich $I$, welcher den Parameter $\theta$ mit Wahrscheinlichkeit $1$ enthält
- Diese Forderung liefert typischerweise $I=\Theta$ und daher keinen Erkenntnisgewinn.

## Interpretation

Sei $I(X_1,\dots,X_n)$ ein Konfidenzintervall zum Konfidenzniveau $1-\alpha$ für die Größe $\theta$. Dann treffen folgende Aussagen zu

- Das (zufällige) Intervall $I(X_1,\dots,X_n)$ enthält den wahren Parameter $\theta$ mit einer Wahrscheinlichkeit von (mindestens) $1-\alpha$.
- Im Mittel enthalten $(1-\alpha)\cdot 100\%$ der auf diese Weise konstruierten Konfidenzintervalle den wahren Parameter $\theta$.

Ein Möglichkeit ist es also allgemein über das Verfahren zu sprechen und zu erklären, dass dies mit Wahrscheinlichkeit $1-\alpha$ zu einer Überdeckung der gesuchten Größe führt. Eine andere Möglichkeit ist es sich vorzustellen, dass man wieder und wieder Stichproben nimmt und daraus auf gleiche Weise Konfidenzintervalle berechnet. Von diesen enthalten dann im Mittel $(1-\alpha)\cdot 100 \%$ der Intervalle den Wert $\theta$.


:::{admonition} Warnung
:class: warning

Über das konkrete Konfidenzintervall (mit ausgerechneten Zahlen) lässt sich keine Wahrscheinlichkeitsaussage treffen!

:::

## Einseitige vs Zweiseitige Konfidenzintervalle

### Zweiseitiges Konfidenzintervall

Ein zweiseitiges Konfidenzintervall hat die Form:

 $$I= [ \mathrm{untere\ Grenze}\ ,\ \mathrm{obere\ Grenze} ]$$
 
Es schneidet symmetrisch am linken und rechten Rand der Verteilung einen Bereich mit je einer Wahrscheinlichkeit von $\alpha/2$, so dass der wahre Wert mit einer Wahrscheinlichkeit von $1-\alpha$ vom Intervall überdeckt wird.

Es wird verwendet, wenn:

- Abweichungen nach unten und oben gleichermaßen relevant sind,
- wenn die Stichprobe von einem unabhängigen Beobachter bewertet wird,
- man keine Richtung vorgibt, in der der Parameter vom Referenzwert abweichen könnte/sollte/darf.

**Beispiel:**
Man will prüfen, ob die durchschnittliche Füllmenge von einem Sollwert abweicht - egal ob nach oben oder unten.

### Einseitiges Konfidenzintervall

Ein einseitiges Konfidenzintervall hat die Form:

$$(-\infty, b]\qquad\text{oder}\qquad [a, \infty)$$

Es berücksichtigt nur eine Richtung der Abweichung und legt das gesamte $\alpha$ auf eine Seite der Verteilung. Es schneidet entweder nur am linken oder nur am rechten Rand der Verteilung einen Bereich mit einer Wahrscheinlichkeit von $\alpha$ ab, so dass der wahre Wert mit einer Wahrscheinlichkeit von $1-\alpha$ vom Intervall überdeckt wird.

Es wird verwendet, wenn

- nur Abweichungen in eine Richtung relevant oder kritisch sind,
- wenn man ein "parteiischer" Beobachter der Stichprobe ist,
- wenn man entweder nur an oberen oder nur an unteren Schranken interessiert sind, welche typischerweise eingehalten werden.

*Es wird typischerweise so erstellt, dass das Intervall möglichst viele - aus der eigenen Sicht - günstige Fälle enthält.*

**Beispiel:**
Ein Kühlhaus darf nicht wärmer als $-18^\circ$C sein. In diesem Fall interessiert nur, ob der Mittelwert über dem Grenzwert liegt. Man verwendet ein Intervall der Form $(-\infty, b]$.

