Was ist Statistik?#

Ausgangspunkt#

Die Erhebung von Daten erfolgt durch Wissenschaftler, Unternehmen, Behörden und andere Akteure.

Statistik bietet Methoden zur Darstellung, Analyse und Auswertung von Daten im Hinblick auf spezifische Fragestellungen.

Definitionen#

  1. Statistik ist die Gesamtheit aller Methoden zur Datenanalyse.

  2. Statistik ist die Wissenschaft von der zahlenmäßigen Erfassung, Untersuchung und Auswertung von Massenerscheinungen. (Duden)

  3. Umfassendes methodisch-quantitatives Instrumentarium zur Charakterisierung und Auswertung empirischer Befunde bei gleichartigen Einheiten („Massenphänomenen“) mit universellen Einsatzmöglichkeiten in Politik, Wirtschaft und Gesellschaft sowie allen Geistes-, Sozial- und Naturwissenschaften einschließlich Medizin und Technik, in denen mit Zahlen oder Bewertungen gearbeitet wird. (Gabler Wirtschaftslexikon)

Achtung Mehrdeutigkeit

  • Das Ergebnis von statistischen Untersuchungen wird oft ebenfalls als Statistik bezeichnet.

  • In der Schätztheorie werden wir Schätzer (Schätzfunktionen) kennenlernen, die ebenfalls oft als Statistik bezeichnet werden.


Typische Fragestellungen#

Die folgenden Beispiele verdeutlichen die Bandbreite an Fragen, die mithilfe von Statistik beantwortet werden können, und zeigen, dass es in allen Lebensbereichen Anwendungen gibt:

  • Wirtschaft und Arbeitsmarkt
    Erhöht die Einführung von Mindestlöhnen die Arbeitslosigkeit in bestimmten Branchen?

  • Gesundheit und Medizin
    Ist das Medikament A wirkungsvoll, und wie hoch ist die Wahrscheinlichkeit, dass Nebenwirkungen auftreten?

  • Bildung
    Hat die Einführung von kleineren Klassengrößen in Schulen einen positiven Einfluss auf die durchschnittlichen Testergebnisse der Schüler?

  • Umwelt und Klimaforschung
    Gibt es einen statistisch signifikanten Zusammenhang zwischen CO2-Emissionen und der durchschnittlichen globalen Temperatur?

  • Marketing und Konsumentenverhalten
    Wie effektiv sind bestimmte Marketingkampagnen in der Steigerung des Produktabsatzes?

  • Technik und Qualitätssicherung
    Entspricht die Ausschussquote einer Produktionsmaschine den vom Hersteller angegebenen Werten?

  • Sozialforschung
    Gibt es regionale Unterschiede im Wahlverhalten, und welche Faktoren könnten diese Unterschiede erklären?

  • Sport und Freizeit
    Welcher Spielstil erhöht die Wahrscheinlichkeit eines Sieges im Fußball, basierend auf historischen Daten?


Ziele und Inhalte der Vorlesung#

  • Einordnung der Statistik

  • Grundlegende Begriffe der Statistik

  • Anwendung: Verfahren der Statistik

    • Anfertigung, Auswertung und Interpretation deskriptiver Statistiken (Diagramme, Tabellen, …)

    • Untersuchung statistischer Hypothesen (Testtheorie) mit Hilfe der induktiven Statistik

    • Schätzen von Parametern/Kennzahlen

    • Zusammenhangsanalyse

  • Grundlagen der Wahrscheinlichkeitsrechnung

  • Interpretation statistischer Ergebnisse

  • Umsetzung statistischer Berechnungen und Analysen mit R


Allgemeine Vorgehensweise#

Von der Fragestellung zur statistischen Antwort:

  1. Formulierung der Fragestellung

  2. Versuchsplanung

  3. Datenerhebung

  4. Dateneingabe

  5. Datenaufbereitung und Datenvalidierung (Prüfung auf Eingabe- und Erhebungsfehler)

  6. Statistische Analyse

  7. Auswertung der Ergebnisse


Einteilung der Statistik#

  1. Deskriptive Statistik (Beschreibende Statistik)

    • Methoden zur Strukturierung, Darstellung und Beschreibung umfangreichen oder unübersichtlichen Datenmaterials

    • Wichtige Instrumente: Tabellen, Kennwerte, Diagramme

  2. Induktive Statistik (Schließende Statistik)

    • Methoden zur Untersuchung von Stichproben zwecks Schlussfolgerungen auf die Grundgesamtheit

    • Wichtige Teilgebiete: Schätztheorie und Testtheorie

  3. Explorative Statistik

    • Aufsuchen von Mustern und Strukturen in zumeist sehr großen Datenbeständen zur Generierung statistischer Hypothesen

    • Datenanalyse, Data Mining


Wie kommt die Wahrscheinlichkeitstheorie ins Spiel?#

  • Der Oberbegriff Stochastik teilt sich in Wahrscheinlichkeitstheorie und Statistik auf. Diese sind eng miteinander verknüpft.

  • Viele statistische Verfahren beruhen auf wahrscheinlichkeitstheoretischen Modellen. Um diese Verfahren zu verstehen und richtig interpretieren zu können, braucht man Wissen über diese Modelle.

  • Grundlage einer statistischen Analyse ist (in den meisten Fällen) eine Stichprobe, die „zufällig“ gezogen wird – zumindest wird dies so modelliert. Zur Ableitung von Erkenntnissen sind Kenntnisse der Wahrscheinlichkeitstheorie notwendig.

  • Komplexere Aussagen aus statistisch erhobenen Größen erfordern häufig wahrscheinlichkeitstheoretisches Wissen.

Ein Beispiel#

Der laufenden Produktion von USB-Sticks wurde eine Stichprobe der Größe 50 entnommen. Es stellt sich heraus das 4 der 50 USB-Sticks defekt waren.