import pandas as pd
= {"vornamen": ["Christopher", "Henning", "Severin"], "nachnamen": ["Annen","May", "Kantereit"], "groessen": [174, 182, 162]}
people
= pd.DataFrame(people) people_df
Übung 4
Übung 4.1
Importiere pandas
und nutze die Funktion DataFrame
, um people
in eine DataFrame umzuwandeln (siehe dazu das Beispiel unten). Weise den Output der Variablen people_df
zu und schau dir people_df
an.
Übung 4.2
In der Praxis kommen tabellarische Daten meist als “csv” Dateien daher. Wir können aus unserer eben erstellten DataFrame sehr einfach eine csv-Datei erstellen. Führe das mit folgendem Code aus und suche anschliessend die erstellte csv-Datei.
"people.csv") people_df.to_csv(
Übung 4.3
Genau so einfach ist es, ein csv zu importieren. Lade die Datei “zeckenstiche.csv” (siehe Tabelle 1) herunter und speichere es im aktuellen Arbeitsverzeichnis ab. Importiere mit folgendem Code die Datei “zeckenstiche.csv”.
# ich habe die Daten in einem Unterordner "data" abgespeichert
= pd.read_csv("data/zeckenstiche.csv") zeckenstiche
Übung 4.4
Die DataFrame zeckenstiche
beinhaltet x und y Koordinaten für jeden Unfall in den gleichnamigen Spalten. Wir können die Stiche mit einem Scatterplot räumlich visualisieren. Führe dazu folgenden Code aus.
= zeckenstiche.plot.scatter("x","y")
fig
"equal")
fig.axis(# "equal" stellt sicher, das die x und y Achsen gleich skaliert sind
# dies ist sinnvoll, da es sich ja um Schweizer Koordinaten (Meter) handelt
Übung 4.5
Um eine einzelne Spalte zu selektieren (z.B. die Spalte “ID”), kann man gleich vorgehen wie bei der Selektion eines Eintrags in einer Dictionary. Probiere es aus.
Musterlösung
"ID"] zeckenstiche[
Übung 4.6
Auch das Erstellen einer neuen Spalte ist identisch mit der Erstellung eines neuen Dictionary Eintrags. Erstelle eine neue Spalte “Stichtyp” mit dem Wert “Zecke” auf jeder Zeile (s.u.).
"Stichtyp"] = "Zecke" zeckenstiche[
Musterlösung
zeckenstiche