Übung 5#
1. Datentyp anpassen#
Wir nutzen im folgenden den Datensatz sleep_health_lifestye.txt
.
Laden Sie den Datensatz und speichern Sie ihn in der Variable
SLH
.Die Spalte mit der BMI-Kategorie enthält ordinal messbare Daten. Dies soll R wissen, damit Sie immer in der passenden Reihenfolge angezeigt werden. Wandeln Sie die Spalte mit der BMI-Kategorie mit dem Befehl
factor()
und den Optionenlevels=c("Underweight","Normal","Overweight","Obese")
undordered = TRUE
um.
# Platz zum Rechnen
2. Kontingenztafeln#
Wir nutzen im folgenden weiterhin den Datensatz SLH
.
Stellen Sie in einer Kontingenztafel Schlafstörungen und BMI-Kategorie gegebenüber. Wie viele Personen sind Übergewichtig und leiden unter Schlafapnoe? (Lösung: 65)
Erstellen Sie eine Kontingenztafel mit den bedingten relativen Häufigkeiten der Schlafstörungen, gegeben der BMI-Kategorie. Lesen sie darin ab: Wie viel Prozent der Übergewichtigen leiden an keiner der Schlafstörungen? (Lösung: 12,84%)
Erstellen Sie nun eine passende Kontingenztafel in welcher Sie ablesen können: Wie viel Prozent der Befragten mit Schlafapnoe sind übergewichtig? (Lösung: 83,33%)
# Platz zum Rechnen
3. Diagramme für Kontingenztafeln#
Wir nutzen weiterhin den Datensatz SLH
.
Stellen Sie die Häufigkeiten des Auftretens von Schlafstörungen und BMI-Kategorie in einem gestapelten Säulendiagramm dar. Passen Sie die Farben an. Fügen Sie eine Legende und eine Überschrift hinzu hinzu.
Nutzen Sie die Funktion
mosaicplot()
um die Kontingentafel von Schlafstörungen und BMI-Kategorie zu veranschaulichen. Setzen Sie einmal die Kontingenztafel und einmal die transponierte Kontingentafeln ein. Wie unterscheiden sich die DarstellungenStellen Sie die bedingten relativen Häufigkeiten der Schlafstörungen, gegeben der BMI-Kategorie in einem gestapelten Säulendiagramm dar. Passen Sie Farben, Überschrift, Achsenbezeichnungen und Legende so an, dass es etwa wie in der folgenden Grafik aussieht.
Stellen Sie nur für die Frauen die Häufigkeiten für die Schlafstörungen und der BMI-Kathegorie in einem Säulendiagramm dar. In der Grafik sollen die 3 Gruppen „None“, „Insomnia“ und „Sleep Apnea“ auf der x-Achse aufgeführt sein. Für jede der 3 Gruppen sollen 4 Säulen (entsprechend der BMI-Kategorie) dargestellt werden. Fügen Sie eine Legende hinzu.
# Platz zum Rechnen
4. Maßzahlen#
Wir nutzen auch hier den Datensatz SLH
.
Erstellen Sie eine neue Spalte
overweight
welche bei allen Personen mit der BMI-KategorieOverweight
oderObese
den WertTRUE
enthält (und bei allen anderenFALSE
) Hinweis: Nutzen Sie%in%
. Mit dem Befehlc("a","b","c","d") %in% c("s","t","a","f","c","r")
wird für jedes Element des ersten Vektors geprüft ob er im 2. Vektor vorkommt. In diesem Beispiel ist die RückgabeTRUE, FALSE, TRUE, FALSE
, da a und c im 2. Vektor vorkommen, b und d aber nicht.Erstellen Sie für die Spalten
Gender
undoverweight
eine Kontingentafel. Berechnen Sie anschließend das Chancenverhältnis (odds ratio) und interpretieren Sie den Wert. (Lösung: 0.2694 oder 3.7119)Berechnen Sie folgendes nur für die Übergewichtigen:
eine Kontingenztafel mit Sleep.Disorder und Gender
den zugehörigen Chi-Quadrat-Wert (Lösung: 30.446)
den Kontingenzkoeffizient (Lösung: 0.40195)
den korrigierten Kontingenzkoeffizient (Lösung: 0.56844)
Wiederholen Sie Schritt 3 für die Nicht-Übergewichtigen. Interpretieren Sie die Parameter indem Sie sie zwischen den Gruppen (überwichig und nicht übergewichtig) vergleichen.
# Platz zum Rechnen