Der Median ist robust gegenüber Ausreißern, da er nicht auf den absoluten sondern nur auf der relativen Reihung der Beobachtungen basiert. Wird beispielsweise der größte Wert einer Messreihe um den Faktor 1000 tausend vergrößert, so ändert sicht der Median nicht.
Der Mittelwert hingegen basiert auf den absoluten Werten. Da die Variable Total Checkouts
einige wenige sehr große Ausreißer enthält, ist der Mittelwert hier viel größer.
Von oben links nach unten rechts:
Die Balkendiagramme beginnen nicht im Nullpunkt. Somit werden die relativen Unterschiede viel größer dargestellt, als sie in Wahrheit sind.
pd.crosstab(df['Provided Email Address'],df['Age Range'],margins=True)
und pd.crosstab(df['Provided Email Address'],df['Age Range'],margins=True, normalize=1)
df['Total Checkouts'].quantile(0.60)
df['Age Range'].mode()
df['Total Renewals'].quantile([0.25, 0.75]).diff()