27.01 – 02.02

Grundlagen der Datenanalyse in Python

Diese Einheit gibt eine Einführung in die Aufgaben und grundlegenden Begriffe der angewandten Statistik. Im zweiten Teil wird das pandas Paket vorgestellt und gezeigt, wie Datensätze eingelesen und bearbeitet werden können. Manche Lektionen und Aufgaben sind als Exkurs markiert. Diese Aufgaben sind für Interessierte und dauern meist etwas länger oder sind schwieriger zu lösen.

Versuchen Sie zuerst die Aufgaben innerhalb der angegeben Zeit selbstständig zu lösen. Versuchen Sie danach mit Hilfe der Musterlösung die Lösung nachzuvollziehen. Schreiben Sie sich bei Problemen Ihre Fragen auf, damit wir diese am Präsenztag zusammen besprechen können.

Ziele

  • Beschreiben Sie Datensätze mit dem statistischen Grundvokabular
  • Lesen Sie Datensätze als DataFrames in Python ein und aus
  • Filtern Sie DataFrames nach Spalten oder Zeilen
  • Erstellen Sie neue Variablen

    Projektaufgabe

    Die Pressestelle der San Francisco Public Library möchte einen Online-Artikel zum Kundenstamm der Bibliothek erstellen. Dazu hat sie Ihnen einen Datensatz geschickt, den Sie auswerten sollen.

    1. Erstellen Sie eine Beschreibung des Datensatzes unter Verwendung des statistischen Grundvokabulars.
    2. Lesen Sie den Datensatz ein
    3. Bereinigen Sie den Datensatz von fehlenden Werten und berechnen Sie die neue Variable Membership Duration.