Projektordner und Datensatz

Im gesamten Modul werden wir wieder mit Git arbeiten. Darüber hinaus werden wir mit einem offenen Kundendatensatz der öffentlichen Bibliothek in San Francisco arbeiten. Führe daher die unteren Anpassungen durch.

1.1. Anlegen eines Projektordners und Nutzung von Git (15 Min)

  1. Im Modul 1 hast Du ein Git Repositorium erstellt und GitHub gespiegelt. Bitte erstelle in diesem Repositorium einen Ordner mit dem Namen Modul_3. Dieser Ordner wird Dein Projektordner für dieses Modul. Dort legst Du alle Datensätze und Jupyter Notebooks ab.
  2. Erstelle einen Unterordner ./data/ und einen Unterordner ./notebooks/ innerhalb Deines Projektordners.
  3. Füge die Dateien auch in das Git-Repositorium hinzu (kleine Erinnerung git add und git commit -m "Erläuterung", große Erinnerung).

Im ersten Teil des Moduls werden wir einen offenen Kundendatensatz der öffentlichen Bibliothek in San Francisco analysieren.

The Integrated Library System (ILS) is composed of bibliographic records including inventoried items, and patron records including circulation data. The data is used in the daily operation of the library, including circulation, online public catalog, cataloging, acquisitions, collection development, processing, and serials control. This dataset represents the usage of inventoried items by patrons … (Abstract taken from here)

1.2 Arbeiten mit dem Datensatz der SFPL (20 Min)

  1. Besuche das offene Daten-Portal der Stadt San Francisco und informiere Dich über den Datensatz.
  2. Lade den Datensatz Library_Usage.csv aus dem Internet herunter und speichere ihn im Projektordner im Unter-Ordner ./data/ ab.
  3. Stell sicher, dass Dein Projektordner die folgende Verzeichnisstruktur aufweist:
Module_3
├── data
│   └── Library_Usage.csv
├── notebooks

Auf der Seite findest Du eine detallierte Erklärung der einzelnen Variablen des Datensatzes (=Spalten der Tabelle).

books by 1 brian is licesed under CC BY-NC-SA 2.0