Übung 5#

1. Datentyp anpassen#

Wir nutzen im folgenden den Datensatz sleep_health_lifestye.txt.

  1. Laden Sie den Datensatz und speichern Sie ihn in der Variable SLH.

  2. Die Spalte mit der BMI-Kategorie enthält ordinal messbare Daten. Dies soll R wissen, damit Sie immer in der passenden Reihenfolge angezeigt werden. Wandeln Sie die Spalte mit der BMI-Kategorie mit dem Befehl factor() und den Optionen levels=c("Underweight","Normal","Overweight","Obese") und ordered = TRUE um.

# Platz zum Rechnen

2. Kontingenztafeln#

Wir nutzen im folgenden weiterhin den Datensatz SLH.

  1. Stellen Sie in einer Kontingenztafel Schlafstörungen und BMI-Kategorie gegebenüber. Wie viele Personen sind Übergewichtig und leiden unter Schlafapnoe? (Lösung: 65)

  2. Erstellen Sie eine Kontingenztafel mit den bedingten relativen Häufigkeiten der Schlafstörungen, gegeben der BMI-Kategorie. Lesen sie darin ab: Wie viel Prozent der Übergewichtigen leiden an keiner der Schlafstörungen? (Lösung: 12,84%)

  3. Erstellen Sie nun eine passende Kontingenztafel in welcher Sie ablesen können: Wie viel Prozent der Befragten mit Schlafapnoe sind übergewichtig? (Lösung: 83,33%)

# Platz zum Rechnen

3. Diagramme für Kontingenztafeln#

Wir nutzen weiterhin den Datensatz SLH.

  1. Stellen Sie die Häufigkeiten des Auftretens von Schlafstörungen und BMI-Kategorie in einem gestapelten Säulendiagramm dar. Passen Sie die Farben an. Fügen Sie eine Legende und eine Überschrift hinzu hinzu.

  2. Nutzen Sie die Funktion mosaicplot() um die Kontingentafel von Schlafstörungen und BMI-Kategorie zu veranschaulichen. Setzen Sie einmal die Kontingenztafel und einmal die transponierte Kontingentafeln ein. Wie unterscheiden sich die Darstellungen

  3. Stellen Sie die bedingten relativen Häufigkeiten der Schlafstörungen, gegeben der BMI-Kategorie in einem gestapelten Säulendiagramm dar. Passen Sie Farben, Überschrift, Achsenbezeichnungen und Legende so an, dass es etwa wie in der folgenden Grafik aussieht.

  4. Stellen Sie nur für die Frauen die Häufigkeiten für die Schlafstörungen und der BMI-Kathegorie in einem Säulendiagramm dar. In der Grafik sollen die 3 Gruppen „None“, „Insomnia“ und „Sleep Apnea“ auf der x-Achse aufgeführt sein. Für jede der 3 Gruppen sollen 4 Säulen (entsprechend der BMI-Kategorie) dargestellt werden. Fügen Sie eine Legende hinzu.

# Platz zum Rechnen

4. Maßzahlen#

Wir nutzen auch hier den Datensatz SLH.

  1. Erstellen Sie eine neue Spalte overweight welche bei allen Personen mit der BMI-Kategorie Overweight oder Obese den Wert TRUE enthält (und bei allen anderen FALSE) Hinweis: Nutzen Sie %in%. Mit dem Befehl c("a","b","c","d") %in% c("s","t","a","f","c","r") wird für jedes Element des ersten Vektors geprüft ob er im 2. Vektor vorkommt. In diesem Beispiel ist die Rückgabe TRUE, FALSE, TRUE, FALSE, da a und c im 2. Vektor vorkommen, b und d aber nicht.

  2. Erstellen Sie für die Spalten Gender und overweight eine Kontingentafel. Berechnen Sie anschließend das Chancenverhältnis (odds ratio) und interpretieren Sie den Wert. (Lösung: 0.2694 oder 3.7119)

  3. Berechnen Sie folgendes nur für die Übergewichtigen:

    • eine Kontingenztafel mit Sleep.Disorder und Gender

    • den zugehörigen Chi-Quadrat-Wert (Lösung: 30.446)

    • den Kontingenzkoeffizient (Lösung: 0.40195)

    • den korrigierten Kontingenzkoeffizient (Lösung: 0.56844)

  4. Wiederholen Sie Schritt 3 für die Nicht-Übergewichtigen. Interpretieren Sie die Parameter indem Sie sie zwischen den Gruppen (überwichig und nicht übergewichtig) vergleichen.

# Platz zum Rechnen