Weitere Beispiele

Im Tutorial hast Du gesehen, wie Du ein Streudiagramm erstellen kannst. Hier werden exemplarisch weitere Möglichkeiten gezeigt, die Daten des Datensatzes zu visualisieren. Die wichtigste Funktion ist hierbei sns.catplot().

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
# matplotlib inline
sns.set_theme()

df = pd.read_csv("../data/Library_Usage.csv",low_memory=False,na_values="Null")

Nominale und ordinale Variablen

Univariate Häufigkeits- und Bivariate Kreuztatabellen können mit Balkendiagrammen visualisiert werden:

sns.catplot(y='Year Patron Registered',
            data=df, kind='count', color="steelblue")

sns.catplot(y='Age Range', hue='Provided Email Address', 
            data=df, kind='count')

sns.catplot(x='Patron Type Definition', 
            data=df, kind='count', 
            col='Year Patron Registered', col_wrap=4)

Metrische Variablen

Univariate Verteilungen werden mit Histogrammen oder Kernel-Dichte Schätzern visualisiert:

# Histogram

sns.distplot(df['Total Renewals'], kde=False)

# With density estimation

sns.distplot(df['Total Renewals'], kde=True)

Kombination aus metrischen und nominalen/ ordinalen Variablen

# Swarmplot

sns.catplot(x='Year Patron Registered', y = 'Total Renewals',
            data=df, kind='swarm', color="steelblue", aspect=4)
            
# Boxplot

sns.catplot(col='Year Patron Registered', y = 'Total Renewals',
            data=df, kind='box', color="steelblue", aspect=4)