Mit df.head()
kannst Du Dir die ersten $n$ Zeilen eines DataFrame
s anzeigen lassen:
import pandas as pd
df = pd.read_csv("../data/Library_Usage.csv")
df.head()
Analog dazu funktioniert die Funktion df.tail()
.
Schau Dir die Dokumentation für die Funktion head()
hier an. Wie kannst Du Dir die ersten $100$ Zeilen anzeigen lassen?
Mit df.info()
erhältst Du speicherbezogene Informationen über das Objekt. Mit df.describe()
werden nützliche deskriptive Statistiken für alle numerischen Spalten eines Datensatzes ausgegeben. Um alle Spalten miteinzubeziehen nutze das Funktionsargument include='all'
:
df.describe(include='all')
Viele Funktionen funktionieren für DataFrame
s und Series
gleichermaßen:
print(df.min())
print(df['Total Renewals'].min())
Mit der Funktion sum()
werden die Werte einer Spalte aufaddiert:
df['Total Renewals'].sum()
df['Total Renewals'].between(100, 200).sum()
DataFrame
s besitzen drei wichtige Attribute, die Informationen über die Spalten, die Datentypen und die Anzahl der Elemente geben:
df.columns
df.dtypes
df.shape