Nützliche Funktionen in Pandas

Mit df.head() kannst Du Dir die ersten $n$ Zeilen eines DataFrames anzeigen lassen:

import pandas as pd
df = pd.read_csv("../data/Library_Usage.csv")
df.head()

Analog dazu funktioniert die Funktion df.tail().

2.9 Pandas Funktionen (5 Min)

Schau Dir die Dokumentation für die Funktion head() hier an. Wie kannst Du Dir die ersten $100$ Zeilen anzeigen lassen?

Mit df.info() erhältst Du speicherbezogene Informationen über das Objekt. Mit df.describe() werden nützliche deskriptive Statistiken für alle numerischen Spalten eines Datensatzes ausgegeben. Um alle Spalten miteinzubeziehen nutze das Funktionsargument include='all':

df.describe(include='all')

Viele Funktionen funktionieren für DataFrames und Series gleichermaßen:

print(df.min())
print(df['Total Renewals'].min())

Mit der Funktion sum() werden die Werte einer Spalte aufaddiert:

df['Total Renewals'].sum()
df['Total Renewals'].between(100, 200).sum()

DataFrames besitzen drei wichtige Attribute, die Informationen über die Spalten, die Datentypen und die Anzahl der Elemente geben:

df.columns
df.dtypes
df.shape