Übung 4

Übung 4.1

Importiere pandas und nutze die Funktion DataFrame, um people in eine DataFrame umzuwandeln (siehe dazu das Beispiel unten). Weise den Output der Variablen people_df zu und schau dir people_df an.

import pandas as pd

people = {"vornamen": ["Christopher", "Henning", "Severin"], "nachnamen": ["Annen","May", "Kantereit"], "groessen": [174, 182, 162]}


people_df = pd.DataFrame(people)

Übung 4.2

In der Praxis kommen tabellarische Daten meist als “csv” Dateien daher. Wir können aus unserer eben erstellten DataFrame sehr einfach eine csv-Datei erstellen. Führe das mit folgendem Code aus und suche anschliessend die erstellte csv-Datei.

people_df.to_csv("people.csv")

Übung 4.3

Genau so einfach ist es, ein csv zu importieren. Lade die Datei “zeckenstiche.csv” (siehe Tabelle 1) herunter und speichere es im aktuellen Arbeitsverzeichnis ab. Importiere mit folgendem Code die Datei “zeckenstiche.csv”.

# ich habe die Daten in einem Unterordner "data" abgespeichert
zeckenstiche = pd.read_csv("data/zeckenstiche.csv")

Übung 4.4

Die DataFrame zeckenstiche beinhaltet x und y Koordinaten für jeden Unfall in den gleichnamigen Spalten. Wir können die Stiche mit einem Scatterplot räumlich visualisieren. Führe dazu folgenden Code aus.

fig = zeckenstiche.plot.scatter("x","y")

fig.axis("equal")
# "equal" stellt sicher, das die x und y Achsen gleich skaliert sind
# dies ist sinnvoll, da es sich ja um Schweizer Koordinaten (Meter) handelt

Übung 4.5

Um eine einzelne Spalte zu selektieren (z.B. die Spalte “ID”), kann man gleich vorgehen wie bei der Selektion eines Eintrags in einer Dictionary. Probiere es aus.

Musterlösung
zeckenstiche["ID"]

Übung 4.6

Auch das Erstellen einer neuen Spalte ist identisch mit der Erstellung eines neuen Dictionary Eintrags. Erstelle eine neue Spalte “Stichtyp” mit dem Wert “Zecke” auf jeder Zeile (s.u.).

zeckenstiche["Stichtyp"] = "Zecke"
Musterlösung
zeckenstiche