03.02 – 09.02

Deskriptive Statistik und Visualisierungen

Dieses Modul gibt eine Einführung in die deskriptive Statistik mit pandas und zeigt, wie statistische Visualisierungen in Python erstellt werden können.

Versuchen Sie zuerst die Aufgaben innerhalb der angegeben Zeit selbstständig zu lösen. Versuchen Sie danach mit Hilfe der Musterlösung die Lösung nachzuvollziehen. Schreiben Sie sich bei Problemen Ihre Fragen auf, damit wir diese am Präsenztag zusammen besprechen können.

Ziele

  • Berechnen und interpretieren Sie grundlegende Lage- und Streuungsmaße
  • Beschreiben Sie univariate stetige und diskrete Verteilungen
  • Beschreiben und berechnen Sie Statistiken für stetige und diskrete bivariate Verteilungen
  • Erstellen Sie einfache Visualisierungen

Projektaufgabe

Für den Online-Artikel zum Kundenstamm der Bibliothek braucht die Pressestelle einige interessanten Zahlen zum Thema Alter und Bibliotheksnutzung. Außerdem möchte sie die Daten in einer Info-Graphik zusammenstellen.

Für eine erste Demo sind Sie verantwortlich.

  • Berechnen Sie 2-3 Statistiken und Erstellen Sie 2-3 Visualisierungen basierend auf den Informationen im Datensatz.
  • Nutzen Sie pandas zur Berechnung der Statistiken und seaborn für die Visualisierungen.

Schicken Sie bis spätestens zum Projekttag Ihren Report in Form eines Python Notebooks an malte@bonart.de. Sie können Ihr Notebook auch gerne mit den anderen Studierenden auf der Kursplatform teilen.

Beispielfragen, die Sie mit dem Datensatz beantworten und visualisieren können:

  • Wie viele Senioren und Kinder sind Kunden der San Francisco Public Library?
  • Wie viele Nutzer möchten per Mail informiert werden?
  • Wie alt sind diese Nutzer durchschnittlich im Vergleich zu Nutzern, die per Post informiert werden möchten?
  • Wie viele Ausleihen werden im Mittel pro Altersgruppe und pro Jahr getätigt? Ist die Streuung zwischen den Gruppen gleich?