Bivariate Verteilungen

Bisher haben wir immer nur einzelne Variablen betrachtet, zusammengefasst oder visualisiert. In vielen Fällen ist jedoch der Zusammenhang zwischen zwei Variablen von Interesse.

Nach diesem Kapitel solltest Du beispielsweise die folgenden Fragen beantworten können:

  • Leihen ältere Bibliothekskunden im Schnitt mehr Bücher aus als jüngere?
  • Führen Kunden, die häufiger Ausleihen tätigen, im Schnitt auch häufiger Verlängerungen durch?
  • Nimmt die Anzahl der Ausleihen mit zunehmender Dauer der Mitgliedschaft ab?

Zwei Variablen, die keinen Zusammenhang aufweisen, nennt man statistisch unabhängige Variablen. Für zwei metrische Variablen kann man außerdem zwischen einem positiven oder einem negativem Zusammenhang unterscheiden.

Boxplot-Verteilung der Ausleihen nach Jahr der Registrierung. Das Notebook kannst Du Dir hier herunterladen.