Desriptive Statistik
Deskriptive Statistik umfasst Methoden zur Organisation, Zusammenfassung und Darstellung von Daten, um ein klares Bild eines Datensatzes zu gewinnen, ohne dabei Schlussfolgerungen über eine größere Population zu ziehen. Sie dient dazu, die wesentlichen Eigenschaften eines Datensatzes hervorzuheben und verständlich zu machen. Die deskriptive Statistik hilft dabei, große Mengen an Daten auf eine Weise zu interpretieren, die sinnvolle Muster und Trends erkennen lässt. Zu den Hauptkomponenten der deskriptiven Statistik gehören:
- Maßzahlen der zentralen Tendenz:
- Mittelwert (Durchschnitt): Die Summe aller Werte geteilt durch die Anzahl der Werte.
- Median: Der mittlere Wert in einem geordneten Datensatz.
-
Modus: Der am häufigsten vorkommende Wert in einem Datensatz.
-
Maßzahlen der Streuung:
- Varianz: Misst die Streuung der Datenpunkte um ihren Mittelwert.
- Standardabweichung: Die Quadratwurzel der Varianz, gibt die durchschnittliche Entfernung der Datenpunkte vom Mittelwert an.
-
Spannweite (Range): Die Differenz zwischen dem größten und dem kleinsten Wert.
-
Verteilungsform (Schiefe und Kurtosis):
- Schiefe (Skewness): Ein Maß für die Asymmetrie der Verteilung eines Datensatzes.
-
Kurtosis: Ein Maß dafür, wie stark die Spitze oder die Flachheit der Verteilung eines Datensatzes im Vergleich zu einer Normalverteilung ausgeprägt ist.
-
Prozentwerte und Quartile:
- Quartile: Teilen den Datensatz in vier gleich große Teile. Das 50. Perzentil entspricht dem Median.
-
Interquartilsabstand (IQR): Die Differenz zwischen dem 25. und dem 75. Perzentil, ein Maß für die Streuung der mittleren 50% der Daten.
-
Grafische Darstellungen:
- Histogramme, Balkendiagramme und Tortendiagramme zur Visualisierung der Häufigkeitsverteilung.
- Boxplots zur Darstellung der Verteilung unter Einbeziehung von Median, Quartilen und Ausreißern.
- Streudiagramme (Scatterplots) zur Visualisierung der Beziehung zwischen zwei quantitativen Variablen.
Die Anwendung der deskriptiven Statistik ist der erste Schritt in der Datenanalyse, der Einblicke in die Datenstruktur gibt und für die vorbereitende Datenanalyse entscheidend ist. Sie bildet auch die Grundlage für die weiterführende Analyse, einschließlich der inferenziellen Statistik, die verwendet wird, um Hypothesen zu testen und Schlussfolgerungen über Populationen zu ziehen, von denen die Daten eine Stichprobe darstellen.