Deskriptive Statistik und Visualisierungen

Diese Einheit gibt eine Einführung in die deskriptive Statistik mit pandas und zeigt, wie statistische Visualisierungen in Python erstellt werden können.

Vorausgesetzt wird statistisches Grundvokabular, wie in der letzten Einheit behandelt.

Ziele

Berechnung und Interpretation von grundlegenden Lage- und Streuungsmaßen
Beschreibung von univariaten stetigen und diskreten Verteilungen
Beschreibung und Berechnung von Statistiken für stetige und diskrete bivariate Verteilungen
Erstellung von einfachen Visualisierungen

Projektaufgabe: Deskriptive Statistik und Visualisierungen

Für den Online-Artikel zum Kundenstamm der Bibliothek braucht die Pressestelle einige interessanten Zahlen zum Thema Alter und Bibliotheksnutzung. Außerdem möchte sie die Daten in einer Info-Graphik zusammenstellen.

Für eine erste Demo bist Du verantwortlich:

Berechne 2-3 Statistiken und erstelle 2-3 Visualisierungen basierend auf den Informationen im Datensatz.
Nutze pandas zur Berechnung der Statistiken und seaborn für die Visualisierungen.

Lade bis spätestens 24.03.23 Deinen Report in Form eines Jupyter Notebooks in der Dateiablage in Moodle hoch.

Beispielfragen, die Du mit dem Datensatz beantworten und visualisieren kannst:

Wie viele Senioren und Kinder sind Kunden der San Francisco Public Library?
Wie viele Nutzer möchten per Mail informiert werden?
Wie alt sind diese Nutzer durchschnittlich im Vergleich zu Nutzern, die per Post informiert werden möchten?
Wie viele Ausleihen werden im Mittel pro Altersgruppe und pro Jahr getätigt? Ist die Streuung zwischen den Gruppen gleich?