Nützliche Funktionen in Pandas

Mit df.head() können Sie sich die ersten $n$ Zeilen eines DataFrames anzeigen lassen:

import pandas as pd
df = pd.read_csv("../data/Library_Usage.csv")
df.head()

Analog dazu funktioniert die Funktion df.tail().

Pandas Funktionen (5 Min)

Schauen Sie sich die Dokumentation für die Funktion head() hier an. Wie können Sie sich die ersten $100$ Zeilen anzeigen lassen?

Mit df.info() erhalten Sie speicherbezogene Informationen über das Objekt. Mit df.describe() werden nützliche deskriptive Statistiken für alle numerischen Spalten eines Datensatzes ausgegeben. Um alle Spalten miteinzubeziehen nutzen sie das Funktionsargument include='all':

df.describe(include='all')

Viele Funktionen funktionieren für DataFrames und Series gleichermaßen:

print(df.min())
print(df['Total Renewals'].min())

Mit der Funktion sum() werden die Werte einer Spalte aufaddiert:

df['Total Renewals'].sum()
df['Total Renewals'].between(100, 200).sum()

DataFrames besitzen drei wichtige Attribute, die Informationen über die Spalten, die Datentypen und die Anzahl der Elemente geben:

df.columns
df.dtypes
df.shape