24.02.2024 – 04.03.2024
Deskriptive Statistik und Visualisierungen
Diese Einheit gibt eine Einführung in die deskriptive Statistik mit pandas
und zeigt, wie statistische Visualisierungen in Python erstellt werden können.
Vorausgesetzt wird statistisches Grundvokabular, wie in der letzten Einheit behandelt.
Ziele
- Berechnung und Interpretation von grundlegenden Lage- und Streuungsmaßen
- Beschreibung von univariaten stetigen und diskreten Verteilungen
- Beschreibung und Berechnung von Statistiken für stetige und diskrete bivariate Verteilungen
- Erstellung von einfachen Visualisierungen
Projektaufgabe: Deskriptive Statistik und Visualisierungen
Für den Online-Artikel zum Kundenstamm der Bibliothek braucht die Pressestelle einige interessanten Zahlen zum Thema Alter und Bibliotheksnutzung. Außerdem möchte sie die Daten in einer Info-Graphik zusammenstellen.
Für eine erste Demo bist Du verantwortlich:
- Berechne 2-3 Statistiken und erstelle 2-3 Visualisierungen basierend auf den Informationen im Datensatz.
- Nutze
pandas
zur Berechnung der Statistiken und seaborn
für die Visualisierungen.
Lade bis spätestens 18.03.24 Deinen Report in Form eines Jupyter Notebooks in der Dateiablage in Moodle hoch.
Beispielfragen, die Du mit dem Datensatz beantworten und visualisieren kannst:
- Wie viele Senioren und Kinder sind Kunden der San Francisco Public Library?
- Wie viele Nutzer möchten per Mail informiert werden?
- Wie alt sind diese Nutzer durchschnittlich im Vergleich zu Nutzern, die per Post informiert werden möchten?
- Wie viele Ausleihen werden im Mittel pro Altersgruppe und pro Jahr getätigt? Ist die Streuung zwischen den Gruppen gleich?