27.02.2023 – 04.03.2023

Grundbegriffe der Statistik und Einführung in Pandas

Diese Einheit gibt in einem ersten Teil eine Einführung in die Aufgaben und grundlegenden Begriffe der angewandten Statistik. Im zweiten (mehr praktischen) Teil wird das pandas Paket vorgestellt und gezeigt, wie Datensätze eingelesen und bearbeitet werden können. Manche Lektionen und Aufgaben sind als Exkurs markiert. Diese Aufgaben sind für Interessierte und dauern meist etwas länger oder sind schwieriger zu lösen.

Die Projektaufgabe fasst die in dieser Einheit gelernten Inhalte in Form einer konkreten Aufgabenstellung zusammen, wie sie in der Praxis vorkommen könnte. Nach Bearbeitung aller einzelnen Aufgaben dieser Einheit ist die Projektaufgabe einfach zu bearbeiten.

Ziele

  • Kenntnisse des statistischen Grundvokabulars und Anwendung auf die Beschreibung eines Datensatzes
  • Ein- und Auslesen von Datensätzen als DataFrames in Python
  • Filtern von DataFrames nach Spalten oder Zeilen
  • Erstellung neuer Variablen

    Projektaufgabe: Grundlagen der Datenanalyse in Python

    Die Pressestelle der San Francisco Public Library möchte einen Online-Artikel zum Kundenstamm der Bibliothek erstellen. Dazu hat sie Dir einen Datensatz geschickt, den Du auswerten sollst.

    1. Erstelle eine Beschreibung des Datensatzes unter Verwendung des statistischen Grundvokabulars.
    2. Lies den Datensatz ein.
    3. Bereinige den Datensatz von fehlenden Werten und berechne die neue Variable Membership Duration.

    Die bearbeitete Projektaufgabe kannst Du in Deinem Git-Repositorium als Notebook bzw. Markdown-Datei speichern.