Übung 13: Konfidenzintervalle#
Aufgabe 1: Konfidenzintervall für die mittlere Ladedauer#
Ein Energieversorger untersucht die Ladedauer von Schnellladestationen an Autobahnraststätten.
Dazu wurden 18 zufällig ausgewählte Ladevorgänge für ein bestimmtes E-Auto-Modell beobachtet.
Gemessen wurde jeweils die Zeit (in Minuten), bis der Akku von 10 % auf 80 % geladen war.
Die Stichprobe ergab:
Mittelwert: 27,4 Minuten
Standardabweichung: 3,8 Minuten
Es wird angenommen, dass die Ladedauer in diesem Szenario annähernd normalverteilt ist.
Bestimmen Sie ein passendes (einseitiges oder zweiseitiges) Konfidenzintervall für die mittlere Ladedauer zum Niveau \(1 − \alpha = 0,9\) …
(a) … aus Sicht einer unabhängigen Verbraucherorganisation.
(b) … aus Sicht des Herstellers der Ladestationen.
(c) … aus Sicht eines skeptischen Autofahrers, der Schnellladungen für unzuverlässig hält.
# Platz zum Lösen der Aufgabe
Aufgabe 2: Math-Score untersuchen#
Wir betrachten für das Merkmal \(X\) alle Beobachtungen der Variable mathscr aus dem Datensatz Caschool (Paket Ecdat in R).
Die Variable mathscr beschreibt den durchschnittlichen Mathematik-Testscore eines Schulbezirks.
Die Stichprobe besteht aus sämtlichen in der Spalte enthaltenen Beobachtungen. Es kann davon ausgegangen werden, dass das Merkmal \(X\) näherungsweise normalverteilt ist.
Bestimmen Sie die Varianz, den Variationskoeffizienten und die Spannweite.
Bestimmen Sie den Median und den Interquartilsabstand.
Bestimmen Sie zum Konfidenzniveau \(1-\alpha = 0{,}9\) ein zweiseitiges, symmetrisches Konfidenzintervall für den Erwartungswert.
Bestimmen Sie zum Konfidenzniveau \(\alpha = 0{,}05\) ein zweiseitiges Konfidenzintervall für die Varianz.
# Platz zum Lösen der Aufgabe
Aufgabe 3: Wahrscheinlichkeit für eine außereheliche Affaire#
Wir betrachten ein dichotomes Merkmal \(X\) (also ein Merkmal mit 2 Ausprägungen), das aus dem Datensatz Fair (Paket Ecdat in R) gewonnen wird.
Die Variable affairs gibt die Anzahl außerehelicher Affären einer befragten Person innerhalb des letzten Jahres an.
Definieren Sie daraus die Spalte unfaithful, welche genau dort den Wert 0 hat, wo affairs gleich 0 ist. An allen anderen werte ist unfaithful gleich 1.
Der unbekannte Parameter \(p\) beschreibt somit die Wahrscheinlichkeit, dass eine (aus der ensprechenden Grundgesamtheit) zufällig ausgewählte Person im letzten Jahr mindestens eine Affäre hatte.
Bestimmen Sie den (erwartungstreuen) Schätzer \(\hat p\) für \(p\).
Bestimmen Sie zum Konfidenzniveau \(1-\alpha = 0{,}95\) ein exaktes Konfidenzintervall für \(p\) (Clopper–Pearson-Konfidenzintervall).
Bestimmen Sie zum gleichen Konfidenzniveau ein asymptotisches Konfidenzintervall für \(p\) (Wilson-Konfidenzintervall).
Wir interessieren uns wie sehr die Intervalle von der Stichprobengröße abhängen. Berechnen Sie daher für ein (erfundene) Stichproben mit nahezu dem gleichen \(\hat p\) (gerundet auf 2 Nachkommastellen) und Stichprobengrößen \(n=12\), \(n=60\) bzw \(n=2000\) je
ein exaktes Konfidenzintervall und
ein asymptotisches Konfidenzintervall.
Tragen Sie die Ergebnisse zum Beispiel in dieser Tabelle ein:
\(n=12\)
\(n=60\)
\(n=2000\)
exaktes KI
[… , …]
[… , …]
[… , …]
asymptotisches KI
[… , …]
[… , …]
[… , …]
Was stellen Sie fest?
# Platz zum Lösen der Aufgabe
Aufgabe 4: Was sagt uns ein Konfidenzintervall?#
Diskutieren Sie mit Ihrer Nachbarin und Ihrem Nachbarn was ein Konfidenzintervall aussagt (und was es nicht aussagt). Schreiben Sie eine richtige Forumulierung auf.