Weitere Beispiele
Im Tutorial hast Du gesehen, wie Du ein Streudiagramm erstellen kannst. Hier werden exemplarisch weitere Möglichkeiten gezeigt, die Daten des Datensatzes zu visualisieren. Die wichtigste Funktion ist hierbei sns.catplot()
.
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
# matplotlib inline
sns.set_theme()
df = pd.read_csv("../data/Library_Usage.csv",low_memory=False,na_values="Null")
Nominale und ordinale Variablen
Univariate Häufigkeits- und Bivariate Kreuztatabellen können mit Balkendiagrammen visualisiert werden:
sns.catplot(y='Year Patron Registered',
data=df, kind='count', color="steelblue")
sns.catplot(y='Age Range', hue='Provided Email Address',
data=df, kind='count')
sns.catplot(x='Patron Type Definition',
data=df, kind='count',
col='Year Patron Registered', col_wrap=4)
Metrische Variablen
Univariate Verteilungen werden mit Histogrammen oder Kernel-Dichte Schätzern visualisiert:
# Histogram
sns.distplot(df['Total Renewals'], kde=False)
# With density estimation
sns.distplot(df['Total Renewals'], kde=True)
Kombination aus metrischen und nominalen/ ordinalen Variablen
# Swarmplot
sns.catplot(x='Year Patron Registered', y = 'Total Renewals',
data=df, kind='swarm', color="steelblue", aspect=4)
# Boxplot
sns.catplot(col='Year Patron Registered', y = 'Total Renewals',
data=df, kind='box', color="steelblue", aspect=4)