Konzept der Lehrveranstaltung#
Aufbau der Lehrveranstaltung#
Diese Homepage dient als zentraler Leitfaden und spielt die Rolle des Skripts für die gesamte Veranstaltung. Sie enthält alle wesentlichen Inhalte, die in diesem Modul behandelt werden.
In der Vorlesung werden wir die Inhalte dieser Seiten gemeinsam diskutieren, um sowohl die theoretischen Grundlagen als auch praktische Anwendungen zu vermitteln. Wir legen dabei gleichermaßen Wert auf ein solides theoretisches Verständnis der statistischen Methoden sowie auf deren praxisnahe Anwendung mithilfe moderner Statistik-Software. Zahlreiche Beispiele werden die theoretischen Konzepte verdeutlichen und in den Kontext der Praxis setzen.
Wo immer es sinnvoll ist integrieren wir den Einsatz von R und Jupyter Notebook, um die Umsetzung in der Statistik-Software zu demonstrieren.
Wichtige Hinweise zur Vor- und Nachbereitung#
Eine gute Vorbereitung und Nachbearbeitung der Vorlesungsinhalte ist entscheidend für den Lernerfolg. Vor der Vorlesung sollten Sie sich mit den grundlegenden Themen der jeweiligen Woche vertraut machen, um optimal vorbereitet zu sein. Nach der Vorlesung ist es wichtig, die Inhalte durch selbstständiges Üben zu festigen und offene Fragen zu klären. Diese Prozesse helfen Ihnen, ein tiefgehendes Verständnis zu entwickeln und das Gelernte nachhaltig zu verinnerlichen.
Übungen#
In jeder Woche wird eine Übung angeboten, die darauf abzielt, das Gelernte anzuwenden und zu vertiefen. Die Übungen finden in PC-Laboren statt. Sie bestehen aus:
Rechenaufgaben, um die mathematischen Grundlagen zu trainieren.
Aufgaben, die mithilfe von Statistik-Software gelöst werden sollen.
Zur optimalen Nutzung der Übungsstunden sollten Sie die Aufgaben vorab so gut wie möglich zuhause bearbeiten. Der Übungsleiter steht während der Übungen bereit, um bei offenen Fragen und Problemen zu helfen.
Welche Software verwenden wir?#
In dieser Lehrveranstaltung arbeiten wir mit der Statistik-Software R. Dies ist eine frei verfügbare Software, die auf allen gängigen Betriebssystemen läuft. Zunächst läuft R in der Kommandozeile und ist ohne weitere Tools nicht so benutzerfreundlich für Anfänger. Daher vewerwenden wir R in 2 verschiedenen Umgebungen, die uns das Arbeiten erleichtern:
RStudio: eine graphische Oberläche für R, frei verfügbar und läuft auf allen gängigen Betriebssystemen.
Jupyter Notebook: Ein interaktives Tool, das speziell für die Dokumentation und Visualisierung von Datenanalysen entwickelt wurde.
flowchart LR r["Statistik mit **R**"] rstudio["**Variante 1: RStudio** separates Programm frei verfügbar graphische Oberfläche"]:::wide notebook["**Variante 2: Jupyter Notebook** läuft auf einem Server der HTW Verwendung im Browser keine Installation auf PC nötig"]:::wide r --> rstudio r --> notebook
Was ist R und RStudio?#
R#
R ist eine leistungsstarke und kostenlose Softwareumgebung zur statistischen Analyse und Datenvisualisierung. Sie ist plattformübergreifend verfügbar und läuft auf Windows, MacOS und Linux. Die große Anzahl an frei verfügbaren Paketen erweitert die Funktionalität von R kontinuierlich, sodass es in der Statistik-Community weit verbreitet und anerkannt ist.
RStudio#
RStudio ist eine benutzerfreundliche Entwicklungsumgebung für R, die das Arbeiten erheblich erleichtert. Die wichtigsten Vorteile von RStudio sind:
Eine strukturierte Benutzeroberfläche, die Code, Graphiken und Dateien übersichtlich organisiert.
Direkte Integration von Hilfe-Funktionen und Dokumentation.
Werkzeuge für Debugging und Versionskontrolle.
Hilfe für den Umgang mit R#
Falls Sie beim Arbeiten mit R auf Schwierigkeiten stoßen, stehen Ihnen folgende Ressourcen zur Verfügung:
R-Community: Online-Foren wie Stack Overflow oder das RStudio Community-Forum.
Dokumentation und Tutorials: Die offiziellen R-Dokumentationen und zahlreiche frei zugängliche Tutorials, z.B. R-Tutorial der LMU
Übungsleiter und Tutorien: Während der Lehrveranstaltung stehen Übungsleiter zur Klärung von Fragen bereit.
Künstliche Intelligenz: Über die AcademicCloud haben Sie mit Ihrem Hochschullogin Zugang zu einem (datenschutz-konformen) KI-System. KI kann:
helfen die richtigen R-Befehle zu finden und sogar längeren Code zu erzeugen
bestehenden Code erklären, so dass Sie genau erfahren was Zeile für Zeile passiert
helfen Fehler im Code zu finden
Installation von R und RStudio (Kurzanleitung)#
R:
Laden Sie R von der offiziellen Seite CRAN herunter.
Wählen Sie Ihr Betriebssystem (Windows, MacOS oder Linux) aus und folgen Sie den Installationsanweisungen.
RStudio:
Laden Sie RStudio von der offiziellen Website herunter.
Installieren Sie zunächst R, bevor Sie RStudio installieren.
Nach der Installation können Sie RStudio öffnen, um direkt mit R zu arbeiten.
Was ist Jupyter Notebook?#
Jupyter Notebook ist ein interaktives Tool, das die Kombination von Code, Text und Visualisierungen in einem einzigen Dokument ermöglicht. Es eignet sich hervorragend für Datenanalysen, da Ergebnisse unmittelbar sichtbar sind und dokumentiert werden können. In dieser Veranstaltung werden wir den R-Kernel in Jupyter Notebook verwenden. Das heißt, innerhalb von Jupyter Notebook schreiben wir Text oder führen R-Code aus. Somit stellt Jupyter Notebook für uns lediglich eine andere Möglichkeit dar, R-Code auszuführen.
Wie verwende ich Jupyter Notebook?#
In dieser Veranstaltung können Sie Jupyter Notebook bequem über den JupyterHub der Fakultät verwenden. Eine lokale Installation ist nicht erforderlich, wird jedoch für interessierte Studierende empfohlen.
JupyterHub#
Viele Seiten dieser Homepage sind selbst Jupyter Notebooks. Sie lassen sich direkt an den JupyterHub schicken, wo sie angepasst und verändert werden können. So können Sie mit den Beispielen aus der Vorlesung experimentieren, Zahlen ändern und Funktionen ausprobieren.
Wie schicke ich eine Seite an JupyterHub?#
Seiten, die sich an den JupyterHub schicken lassen, sind mit einer kleinen Rakete oben rechts markiert. Wenn Sie darauf klicken, öffnet sich ein Untermenü, in dem Sie JupyterHub auswählen können. Der Rest passiert automatisch: Die Seite wird im JupyterHub geöffnet, wo Sie nach Belieben experimentieren und Änderungen vornehmen können.
Keine Sorge: Ihre Änderungen werden nicht als Vorlesungsunterlagen gespeichert. Sie können diesen Vorgang jederzeit wiederholen, um die Seite im Originalzustand neu zu laden.
Installation von Jupyter Notebook (Kurzanleitung)#
Wie oben beschrieben, müssen sie Jupyter Notebook nicht selbst installieren, sondern können über den Browser (auch von zuhause) auf das Jupyterhub der HTW zugreifen. Wollen sie unabhänig von der HTW Jupyter Notebook nutzen, gehen Sie entsprechend der folgenden Kurzanleitung vor. Im Netz finden Sie natürlich noch viel ausführlichere Hinweise zur Installation. Diese ist auch abhängig von Ihrem speziellen System.
Installieren Sie zunächst Python, falls es nicht bereits auf Ihrem System vorhanden ist. Wir empfehlen die Installation von Anaconda, da diese Distribution alle notwendigen Pakete beinhaltet.
Installieren Sie den R-Kernel, indem Sie in der in R in der Konsole folgenden Befehl ausführen:
install.packages("IRkernel") IRkernel::installspec()
Starten Sie Jupyter Notebook und wählen Sie den R-Kernel aus, um R-Skripte auszuführen.
Woher bekomme ich Hilfe?#
Bei Fragen zur Nutzung von Jupyter Notebook empfehlen wir folgende Ressourcen:
Online-Dokumentation: Die offizielle Jupyter Notebook-Dokumentation bietet umfassende Anleitungen.
Community-Support: Plattformen wie Stack Overflow oder GitHub bieten Antworten auf häufige Fragen.
Kursmaterialien und Übungsleiter: Im Rahmen der Lehrveranstaltung erhalten Sie viele Beispiel, Tipps und Hinweise. Sprechen Sie uns an, falls Sie Probleme haben!
Künstliche Intelligenz: Nutzen Sie die KI der AcademicCloud um Ihre Fragen rund um Jupyter Notebook zu stellen.