Python Modules

Vergleich R vs. Python

Der Umgang mit Modulen ist in Python in vielerlei Hinsicht ähnlich wie in R. An dieser Stelle möchten wir die Unterschiede in einem Direktvergleich beleuchten. Dafür verwenden wir ein fiktives Modul namens maler, in Anlehnung an die Analogie des Hausbauens mit Spezialisten (siehe Vorlesungsfolien). Nehmen wir an, dieses Modul existiert als Python Modul wie auch als R Library.

Erweiterung installieren

In R ist die Installation einer Library selbst ein R-Befehl und wird innerhalb von R ausgeführt. Wenn wir keine Quelle angeben, woher die Library heruntergeladen werden soll, wird eine Default-Quelle verwendet, die im System hinterlegt ist (z.B. “https://cloud.r-project.org”).

In Python ist dies leider etwas komplizierter, es braucht für die Installation einer Python Library eine Zusatzsoftware wie zum Beispiel conda (siehe dazu das Kapitel Conda). Es gibt auch noch andere Wege, wie zum Beispiel pip, aber diese lassen wir der Einfachheit an dieser Stelle weg.

in R:

install.packages("maler")

In Python:

conda install -c conda-foge maler 

Erweiterung laden

Um eine Erweiterung nutzen zu können, müssen wir diese sowohl in R wie auch in Python in die aktuelle Session importieren. In R und Python sehen die Befehle folgendermassen aus:

in R:

library(maler)

in Python:

import maler

Erweiterung verwenden

Um eine Funktion aus einer Library in R zu verwenden, kann ich diese Function direkt aufrufen. In Python hingegen muss ich entsprechende Erweiterung der Function mit einem Punkt voranstellen.

Das ist zwar umständlicher, dafür aber weniger fehleranfällig. Angenommen zwei leicht unterschiedliche Funktionen heissen beide wand_bemalen(). Die eine stammt aus der Erweiterung maler, die andere aus der Erweiterung maurer. Wenn die Funktion in R aufgerufen wird ist nicht klar, aus welcher Library die Funktion verwendet werden soll. In Python ist im nachstehenden Beispiel unmissverständlich, dass wand_bemalen() aus dem Modul maler gemeint ist.

in R:

wand_bemalen()

in Python:

maler.wand_bemalen()

Python Eigenheiten

In Python gibt es in Bezug auf die Verwendung von Modulen ein paar Eigenheiten, die wir aus der R Welt nicht kennen. Es ist wichtig diese Eigenheiten zu kennen, denn man trifft sie immer wieder an.

Modul mit Alias importieren

Da es umständlich sein kann, jedesmal maler.wand_bemalen() voll auszuschreiben, können wir dem Modul beim Import auch einen “Alias” vergeben. Für gewisse populäre Module haben sich solche Aliasse eingebürgert. Beispielsweise wird pandas meist mit dem Alias pd importiert. Es ist sinnvoll, sich an diese Konventionen zu halten. Übertragen auf unser maler beispiel sieht der Import mit einem Alias folgendermassen aus:

import maler as m               # importiert "maler" mit dem Alias "m"
m.wand_bemalen()                # nun wird "m." vorangestellt statt "maler."

Einzelne Function importieren

Es gibt noch die Variante, explizit eine spezifische Function aus einem Modul zu laden. Wenn man dies macht, kann man die Funktion ohne vorangestelltes Modul nutzen (genau wie in R). Dies sieht folgendermassen aus:

from maler import wand_bemalen  # importiert nur die Funktion "wand_bemalen"
wand_bemalen()                  # das Voranstellen von "maler." ist nun nicht nötig

Alle Functions importieren

Zusätzlich ist es möglich, alle Functions aus einem Modul so zu importieren, dass der Modulname nicht mehr erwähnt werden muss. Diese Notation wird nicht empfohlen, aber es ist wichtig sie zu kennen.

from maler import *             # importier alle Funktionen (*) von "maler"
wand_bemalen()                  # das Voranstellen von "maler." ist nun nicht nötig