Im Tutorial hast Du gesehen, wie Du ein Streudiagramm erstellen kannst. Hier werden exemplarisch weitere Möglichkeiten gezeigt, die Daten des Datensatzes zu visualisieren. Die wichtigste Funktion ist hierbei sns.catplot()
.
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
# matplotlib inline
sns.set()
df = pd.read_csv("../data/Library_Usage.csv")
Univariate Häufigkeits- und Bivariate Kreuztatabellen können mit Balkendiagrammen visualisiert werden:
sns.catplot(y='Year Patron Registered',
data=df, kind='count', color="steelblue")
sns.catplot(y='Age Range', hue='Provided Email Address',
data=df, kind='count')
sns.catplot(x='Patron Type Definition',
data=df, kind='count',
col='Year Patron Registered', col_wrap=4)
Univariate Verteilungen werden mit Histogrammen oder Kernel-Dichte Schätzern visualisiert:
# Histogram
sns.distplot(df['Total Renewals'], kde=False)
# With density estimation
sns.distplot(df['Total Renewals'], kde=True)
# Swarmplot
sns.catplot(x='Year Patron Registered', y = 'Total Renewals',
data=df, kind='swarm', color="steelblue", aspect=4)
# Boxplot
sns.catplot(col='Year Patron Registered', y = 'Total Renewals',
data=df, kind='box', color="steelblue", aspect=4)