Was ist Python?

Merkmale der Programmiersprache Python:

Merkmale von CPython:

Grundlagen

Es gibt zwei Sprachversionen, die nicht vollständig kompatibel sind:

Python 2 wird zwar noch “gepflegt”, aber neue Features werden nur noch zu Python 3 hinzugefügt.

Alles hier gezeigte bezieht sich auf Python 3.

interaktiver Modus

Rechnen mit Zahlen

Ganzzahlen

  • Typ int

  • können in verschiedenen Formaten angegeben werden:
    • normalerweise Basis 10: 5, 102, -135876
    • Basis 2 (binär) mit Präfix 0b: 0b111 → 7
    • Basis 8 (oktal) mit Präfix 0o: 0o21 → 17
    • Basis 16 (hexadezimal) mit Präfix 0x: 0x2F → 47
  • keine Beschränkung des Werts: 999 ** 999 ist kein Problem (**: Potenz)

Fließkommazahlen

arithmetische Operatoren

  • ist einer der Operanden eine Fließkommazahl, wird Fließkomma-Arithmetik angewendet (u.U. Rundungsfehler)
  • ansonsten: Ganzzahl-Arithmetik (exakt)
  • +, -, *: wie erwartet
  • /, // s.u.
  • %: Modulo (123 % 103)
  • **: Potenz (3 ** 29)

Es gelten die üblichen Rechenregeln. Im Zweifel oder um die Rangfolge von Operatoren zu überstimmen, können Klammern () verwendet werden. Die Anzahl Leerzeichen um die Operatoren spielt keine Rolle (üblicherweise ein Leerzeichen):

Division

Es gibt zwei Divisionsoperatoren:

  • / ist Fließkommadivision. Ergebnis immer float:
    3 / 50.6

  • // ist Ganzzahldivision: rundet auf nächste kleinere ganze Zahl ab (Richtung  − ∞). Ergebnis int wenn beide Operanden int, sonst float):
    3 // 50
    -3 // 5-1
    -3.0 // 5-1.0

Weitere mathematische Funktionen

Das Modul math aus der Standardbibliothek enthält mathematische Konstanten und Funktionen (Trigonometrie, Logarithmen, etc.):

Variablen (Namen)

Meistens will man Zwischenergebnisse speichern, um sie später weiterzuverwenden oder um Ausdrücke zu vereinfachen.

Durch den Zuweisungsoperator = gibt man einem Objekt (momentan kennen wir nur Zahlen) einen Namen:

(es sind auch Großbuchstaben in Variablennamen erlaubt, üblicherweise schreibt man sie aber klein)

Objektmodell

In Python ist alles ein Objekt. Jedes Objekt hat

  • eine Identität
  • einen Typ
  • einen Wert

Die Identität eines Objekts wird festgelegt, wenn das Objekt erzeugt wird und ändert sich danach nicht mehr.

Der Typ eines Objekts bestimmt, welche Werte das Objekt annehmen kann und welche Operationen mit dem Objekt möglich sind. Der Typ eines Objekts ändert sich ebenfalls nicht mehr, sobald das Objekt erzeugt wurde.

Abhängig vom Typ kann der Wert eines Objekts verändert werden oder nicht. Objekte bzw. Typen, bei denen das Ändern des Werts möglich ist, heißen mutable, die anderen heißen immutable.

Die verschiedenen Zahlentypen sind z.B. immutable.

(Mehr dazu hier.)

Die Anweisung kapital = 1249 bedeutet:

Dem Objekt 1249 (vom Typ int) wird der Name kapital gegeben.

Oder: Der Name kapital “verweist” auf das int-Objekt 1249.

Hinweis: Andere Programmiersprachen haben ein anderes Datenmodell, z.B. heißt in den Sprachen C oder C++ die Anweisung kapital = 1249: Der Speicherplatz für ein int mit dem Namen kapital wird mit dem Wert 1249 belegt.

Konsequenzen:

  • Derselbe Name kann später für ein anderes Objekt (auch mit anderem Typ) neu vergeben werden.
  • Dasselbe Objekt kann unter mehreren Namen bekannt sein.

Beispiel:

Sowohl kapital als auch geld verweisen jetzt auf 1249.

Es ist dasselbe Objekt (id gibt die Identität eines Objekts aus):

Wenn man jetzt den Namen kapital neu vergibt:

hat das keine Auswirkung auf den Namen geld: geld verweist weiterhin auf dasselbe int-Objekt wie zuvor, aber kapital verweist jetzt auf ein anderes float-Objekt:

Mehrfachzuweisung

Man kann auch mehrere Namen gleichzeitig vergeben:

Somit können Namen ohne “temporäre Variable” einfach vertauscht werden:

nicht-interaktiver Modus

Anstatt die Anweisungen einzeln einzutippen, kann man sie auch in einer Datei speichern und diese als “Skript” oder “Programm” ausführen.

Im Gegensatz zum interaktiven Modus werden Ausdrücke nicht automatisch ausgegeben! Um das Ergebnis der Berechnung zu sehen, muss man es explizit auf die Standardausgabe schreiben. Das geht am einfachsten mit der Funktion print:

Beispiel: Datei zinsen.py

Ruft man von der Shell den Python-Interpreter mit dem Dateinamen als Argument auf, liest er die darin enthaltenen Anweisungen, führt sie aus und beendet sich danach wieder:

$ python3 zinsen.py
1258.3675

Zeichenketten (Strings)

Neben den Zahlen ein weiterer grundlegender Datentyp (Verwendung für “Text”): str.

Folgende Dinge sind z.B. Strings:

Eingabe

Strings werden mit Anführungszeichen eingegeben (einfache ' oder doppelte ").

Beispiele:

>>> print('Hallo Welt!')
Hallo Welt!
>>> print("Wie geht's?")
Wie geht's?
>>> print('Er heißt "Fritz".')
Er heißt "Fritz".

Bestimmte Sonderzeichen werden als Kombination mit \ beschrieben:

Für längere Texte mit mehreren Zeilen kann man auch dreifach-Anführungszeichen (''' oder """) benutzen:

(... ist der Prompt, falls eine Eingabe über eine Zeile hinaus geht)

Mehrere Strings können mit + aneinandergehängt werden:

Ein String kann mit * vervielfältigt werden:

Objekte vom Typ str sind immutable. Daher wird beim aneinanderhängen oder “multiplizieren” von Strings immer ein neues Objekt erzeugt, nicht das bestehende Objekt verändert.

Umwandlung zwischen Zahlen und Strings

int(x) wandelt ein beliebiges Objekt x in eine Ganzzahl um, falls möglich:

float(x) wandelt ein beliebiges Objekt x in eine Fließkommazahl um, falls möglich:

str(x) wandelt ein beliebiges Objekt x in seine Textdarstellung um, falls möglich:

Ausgabe

Die Funktion print wandelt Objekte automatisch in Strings um, falls möglich. Außerdem fügt sie zwischen mehrere Objekte (mit Komma getrennt) automatisch Leerzeichen ein (und am Ende einen Zeilenumbruch):

Für mehr Kontrolle über die Formatierung:

Die Dokumentation von format ist hier.

Auf einzelne Zeichen und Teilstrings zugreifen

Mit dem []-Operator greift man auf einzelne Zeichen eines Strings an einer bestimmten Position (Index) zu. Das erste Zeichen hat den Index 0:

Auf eine Position zuzugreifen, die es nicht gibt, erzeugt eine Fehlermeldung:

Die Anzahl der Zeichen (“Länge”) eines Strings bekommt man mit der len-Funktion:

Der größte gültige Index wäre also 9 (nicht 10).

(Ein “Zeichen” ist auch ein String mit der Länge 1.)

Mit negativen Indizes wird von hinten gezählt:

Abschnitte eines Strings bekommt man auf ähnliche Weise:

Optional: Schrittweite

Zeichen und Teilstrings finden

Ob ein String in einem anderen enthalten ist, bekommt man mit dem in-Operator heraus:

Speziell: Am Anfang oder am Ende?

Wo befindet sich ein Teilstring?

(startswith, endswith und index sind “Methoden” eines String-Objekts)

Zusammengesetzte Anweisungen

(compound statements)

Bisher wurde eine Anweisung durch das Ende der Zeile abgeschlossen, z.B. eine Zuweisung eines Namens mit = oder print.

Durch bestimmte Schlüsselwörter können mehrere Anweisungen über mehrere Zeilen gruppiert werden:

Bedingte Ausführung

Mit if wird eine Gruppe von Anweisungen (oder nur eine einzelne Anweisung) nur dann ausgeführt, wenn eine Bedingung erfüllt ist:

Syntax-Regeln

  • die Zeile mit if muss mit einem : enden
  • die gruppierten Anweisungen müssen weiter eingerückt sein als die if-Zeile
  • alle gruppierten Anweisungen müssen gleich weit eingerückt sein

Üblicherweise werden 4 Leerzeichen für “einmal” Einrücken verwendet.

Im interaktiven Modus ändert sich der Prompt zu ... bis die zusammengesetzte Anweisung abgeschlossen ist:

Man muss noch einmal mehr die Eingabetaste drücken, um dem Interpreter mitzuteilen, dass die Anweisung abgeschlossen ist.

Vergleichsoperatoren

  • ==: gleicher Wert (z.B. bei Zahlen, Strings, …)
  • !=: verschiedener Wert
  • >, >=, <, <=:
    • Vergleich von Objekten, deren Typ eine Sortierung unterstützt (z.B. Zahlen nach Wert, Strings alphabetisch)
    • das geht auch: 3 < x < 10 (x > 3 “und” x < 10)
  • is: gleiche Identität
    • zwangsweise dann auch gleicher Wert, aber nicht umgekehrt: verschiedene Objekte können den gleichen Wert haben
    • x is y äquivalent zu id(x) == id(y)
    • oft im Zusammenhang mit speziellem Objekt: None (“nichts”)

Wahrheitswerte

  • True ist “wahr”
  • False ist “falsch”
  • None ist “falsch”
  • 0 und 0.0 sind “falsch”, positive und negative Zahlen sind “wahr”
  • ein String der Länge 0 ('') ist “falsch”, andere sind “wahr”

Verknüpfung von Wahrheitswerten

Mit den booleschen Operatoren kann man mit Wahrheitswerten “rechnen” (Boolsche Algebra):

  • not x: “wahr” wenn x “falsch” ist
  • statt not x in y auch: x not in y
  • x and y: “wahr”, wenn beide “wahr” sind
  • x or y: “wahr”, wenn einer der beiden oder beide “wahr” sind

Genaugenommen:

Außerdem: “ternärer Operator”

  • x if c else y: x wenn c “wahr”, sonst y

Verschachtelung und Verzweigung

Zusammengesetzte Anweisungen können wiederum aus anderen zusammengesetzten Anweisungen bestehen:

Optional können mit elif weitere Bedingungen der Reihe nach abgefragt werden. Die Anweisungen, deren Bedingung zuerst erfüllt sind, werden ausgeführt, die anderen nicht.

Ebenfalls optional können unter else Anweisungen angegeben werden, die ausgeführt werden, wenn keine der Bedingungen unter if und ggf. elif erfüllt sind:

Wiederholung

Mit while werden Anweisungen wiederholt (“While-Schleife”), solange eine Bedingung erfüllt ist.

Beispiel: Algorithmus, um zu berechnen, wieviele Koffer (jeder Koffer belegt 30 Einheiten “Platz”) in einen Kofferraum (bietet 100 “Platz”) passen:

“So lange noch Platz für einen Koffer ist zähle um 1 hoch und verringere den vorhandenen Platz um soviel wie ein Koffer belegt.”

In Python ausgedrückt:

(Wiederholung: -= und += “ändern” nicht ein Zahlenobjekt, sondern setzen die Namen auf andere Objekte)

(Solange noch Klammern geöffnet sind, kann eine Anweisung über mehrere Zeilen verteilt werden, die Einrückung spielt dabei dann keine Rolle. Üblicherweise versucht man, Zeilen nicht länger als ca. 80 Zeichen zu machen.)

Mit der continue-Anweisung werden die restlichen Anweisungen übersprungen und mit der nächsten Wiederholung weitergemacht.

Beispiel: Ausgabe aller geraden Zahlen bis 10. (Indem jede ungerade Zahl übersprungen wird)

Mit der break-Anweisung wird die Schleife komplett abgebrochen:

Weitere Datentypen

Neben den grundlegenden Datentypen (Ganz- und Fließkommazahlen, Strings) gibt es in Python mehrere Datentypen, die “Sammlungen” von Objekten darstellen:

Listen

Grundlagen

Eine Liste wird mit [] und , eingegeben. In einer Liste können beliebige Objekte enthalten sein (auch andere Listen):

  • Die Elemente in einer Liste haben eine definierte Reihenfolge.
  • Auf einzelne Elemente und Teillisten greift man genauso wie bei Strings mit dem Index-Operator [] zu.
  • Auch len funktioniert genauso.
  • Auch in funktioniert genauso.

Unterschied zu Strings:

Listen sind im Gegensatz zu Strings mutable.

Erinnerung Zuweisungsoperator =: x[1] ist auch ein “Name” für den String hallo.

x[1] war vorher das int-Objekt 2. Dieses wurde nicht verändert. Der “Name” x[1] wurde von 2 auf 'hallo' umgesetzt.

Iterieren

Um eine Gruppe von Anweisungen für jedes Element einer Liste auszuführen, kann man eine for-Schleife benutzen (meistens einer while-Schleife vorzuziehen):

Es gibt verschiedene Funktionen um komplexere Iterationen zu ermöglichen:

enumerate(liste): Iteriert über liste und nummeriert dabei durch (standardmäßig von 0 beginnend, aber man kann auch den Startwert angeben):

zip(A, B): Iteriert gleichzeitig über A und B und gibt jeweils ein Tupel bestehend aus einem Element aus A und einem Element aus B aus:

Mit for kann man ebenso über Strings iterieren:

Umwandlung String/Liste

str(x) wandelt eine Liste x (wie jedes andere Objekt auch) in seine Textdarstellung um:

Umgekehrt passiert allerdings etwas anderes:

list(x) iteriert über x (falls möglich) und erzeugt eine Liste aller Elemente, die bei der Iteration herauskommen. Da man über Strings iterieren kann und dabei alle einzelnen Zeichen herauskommen, ergibt:

Ein String kann mit der split-Funktion in eine Liste von Teilstrings umgewandelt werden:

Umgekehrt kann eine Liste von Strings mit join in einen einzelnen String umwandeln:

Sortieren, Umkehren

Falls die Elemente einer Liste untereinander vergleichbar sind (< etc.):

sorted(liste) iteriert über alle Elemente in liste, in sortierter Reihenfolge beginnend beim kleinsten:

liste bleibt dabei unverändert.

Im Gegensatz dazu gibt es noch liste.sort(), wobei liste so verändert wird, dass die Einträge danach sortiert sind.

Analog mit reversed und reverse: reversed iteriert über eine Sammlung von Objekten in umgekehrter Reihenfolge, lässt die Sammlung aber unverändert. reverse ändert die Sammlung, indem die Reihenfolge der Objekte umgekehrt wird.

reversed und sorted funktionieren auch mit Strings, aber reverse und sort nicht! Strings können nicht verändert werden (“immutable”), nur eine sortierte bzw. umgekehrte Kopie erzeugt werden.

Erweitern

Neue Elemente können an eine Liste angehängt oder an einer anderen Stelle eingefügt werden (die Liste wird dabei verändert):

Vorsicht:

An beliebiger Stelle einfügen:

Neue Listen aus vorhandenen Listen erzeugen

Liste vervielfältigen mit *:

Listen aneinanderhängen mit +:

List comprehensions

(auf deutsch: ???)

Ähnlich zur Mengen-Schreibweise in der Mathematik:

{x2|x ∈ 0, ..., 9, 2x < 10}

Der if-Teil ist optional.

(range(N) iteriert über alle ganzen Zahlen von 0 bis N - 1).

Äquivalent zu:

Dictionaries

Dictionaries (dict) sind “assoziative Arrays”, also eine Sammlung von (Schlüssel → Wert)-Paaren.

Unterschiede zu Listen und Strings:

Gemeinsamkeiten mit Listen und Strings:

Eingabe mit {}, : und ,:

Falls mit dem []-Operator versucht wird, auf einen Schlüssel zuzugreifen, den es nicht gibt, wird eine Fehlermeldung erzeugt:

Als Alternative gibt es die Methode get(), die entweder den zu einem Schlüssel gehörigen Wert zurückgibt, oder falls nicht vorhanden, einen Ersatz:

Neue Einträge werden ebenfalls mit dem []-Operator angelegt:

Dictionaries aus anderen Sammlungen erzeugen

Analog zu List comprehensions gibt es Dictionary comprehensions:

Iterieren

Beim Iterieren über ein Dictionary-Objekt kommen die Schlüssel (in beliebiger Reihenfolge) heraus:

Um gleichzeitig über die Schlüssel und die zugeordneten Objekte zu iterieren, gibt es die Methode items():

Tupel

Tupel (tuple) sind ähnlich wie Listen Sammlungen von Objekten, die eine bestimmte Reihenfolge haben.

Wesentlicher Unterschied: Sie sind immutable und daher als Schlüssel in Dictionaries geeignet.

Eingabe mit , (die Klammern () sind nur optional)

z.B. in einem Spiel mit “Schatzkarte”:

Erinnerung Mehrfachzuweisung:

3, 5 war eigentlich ein Tupel. Es wurde darüber “iteriert” und der Reihe nach die Namen vergeben.

Das funktioniert genauso mit allem anderen, worüber man iterieren kann (Listen, Strings, Dictionaries).

Mengen

In einer Liste kann dasselbe Objekt mehrfach enthalten sein:

Im Gegensatz dazu kann in einer Menge (set) jeder Eintrag kann nur einmal enthalten sein, und wie in einem Dictionary haben die Einträge keine feste Reihenfolge.

Mengen werden mit {} und , eingegeben (ohne : wie bei Dictionaries).

Strukturieren und Wiederverwerten von Programmen

Um eine Gruppe von Anweisungen wiederzuverwenden und Programme zu strukturieren, kann man eigene Funktionen definieren (und bereits vorhandene benutzen).

Funktionen sind ähnlich wie “Befehle” in der Linux-Shell:

Es sind beliebige Objekte als Argumente und Rückgabewerte möglich.

Ein paar vordefinierte Funktionen:

Manche Funktionen haben scheinbar keinen Rückgabewert, z.B. print:

>>> x = print('hello')
hello
>>> x
>>>

Was ist x?

Funktionen “ohne” Rückgabewert geben in Wirklichkeit das Objekt None zurück.

>>> x is None
True

(Wiederholung: is vergleicht die Identität von Objekten und sollte nur in bestimmten Fällen benutzt werden. Normalerweise muss man den Vergleichsoperator == benutzen, um den Wert von Objekten zu vergleichen.)

“Methoden” sind eine spezielle Art von Funktion. Sie “gehören” zu einem Objekt und erhalten dieses automatisch als ein weiteres Argument:

Funktionen definieren

Eine Funktionsdefinition (def) ist wie if, while und for eine zusammengesetzte Anweisung mit den gleichen Syntax-Regeln:

Die Funktionsdefinition

erzeugt eine neue Funktion mit dem Namen f. Sie hat zwei Parameter: a und b.

Um die Funktion zu verwenden (“aufzurufen”), muss man ihr entsprechend der Parameterliste konkrete Objekte übergeben, die dann innerhalb der Funktion als a und b bekannt sind.

ist nun dasselbe wie

Ein Funktionsaufruf ist beendet, wenn alle Anweisungen ausgeführt worden sind (dann wird automatisch None zurückgegeben), oder wenn die return-Anweisung ausgeführt wurde, durch die auch optional der Rückgabewert festgelegt wird.

Eine Funktion ist auch ein Objekt, dem durch die def-Anweisung auch ein Name (hier: berechne_zinsen) zugewiesen wird, und kann daher wie jedes andere Objekt in einer Liste oder einem Dictionary enthalten sein (sogar als Schlüssel):

Sichtbarkeit von Namen

Namen, die innerhalb einer Funktion vergeben werden, sind außerhalb der Funktion nicht sichtbar.

Docstrings

Es ist empfehlenswert, zu einer Funktion einen “Docstring” hinzuzufügen, der beschreibt, was die Funktion macht, und wie man sie benutzt.

Das besondere dabei ist, dass der Docstring vom Python-Hilfesystem verarbeitet werden kann:

>>> help(zinsen)
Help on function berechne_zinsen in module __main__:

berechne_zinsen(kapital, zinssatz_prozent)
    Berechne die Zinsen, die auf das Kapital beim angegebenen Zinssatz
    (in Prozent) anfallen.

Noch besser ist es, Beispiele für die Benutzung der Funktion in den Docstring zu integrieren. Diese können vom Modul doctest automatisch ausgeführt und überprüft werden!

Angenommen, die Funktion berechne_zinsen ist in der Datei zinsen.py gespeichert, geschieht das von der Shell aus folgendermaßen:

Module

Eine Datei, in der Python-Code gespeichert ist, kann nicht nur als Skript ausgeführt werden (python3 <dateiname>), sondern auch als Modul importiert werden.

Die Funktionen, die in der Datei (mit der Endung .py) enthalten sind, werden dadurch verfügbar gemacht. Der Name des Moduls ist gleich dem Dateinamen ohne die Endung .py:

Um einzelne Funktionen zu importieren und das Voranstellen des Modulnamens zu vermeiden, gibt es folgende Variante:

Argumente von der Shell

Die Argumente, die beim Ausführen eines Python-Programms von der Shell aus mitgegeben werden, sind innerhalb des Programms als eine Liste Strings namens argv im Modul sys verfügbar.

argv[0] ist der Name des aufgerufenen Skripts, die eigentlichen Argumente sind argv[1], argv[2], etc.

Beispiel: Datei zinsen.py

Dann:

$ python3 zinsen.py 12983746 2.3
298626.158

Problem:

Beim Importieren wird immer der gesamte Inhalt der Datei ausgeführt. Um vermeiden, dass ein Skript ausgeführt wird, wenn es auch als Modul verwendet werden soll, gibt es folgende Technik:

Die Docstrings kann man auch von der Shell aus mit dem Befehl pydoc3 <Modul> aufrufen.

Ein- und Ausgabe mit Dateien

Die einfachste Möglichkeit, Informationen aus einem Programm auszugeben, ist die print-Funktion zu benutzen.

Sie schreibt normalerweise ihre Argumente auf die Standardausgabe (siehe Einführung Linux).

Die Standardeingabe wird vom Objekt stdin im Modul sys repräsentiert. Um zeilenweise davon zu lesen, gibt es folgende Technik:

import sys
for line in sys.stdin:
    # Eine gelesene Zeile ist nun ein String mit dem Namen `line`
    # und kann verarbeitet werden.

Dateien öffnen und schließen

Um anstelle der Standardeingabe eine Datei zum Lesen zu verwenden, muss sie erst geöffnet werden. Das zeilenweise Lesen funktioniert analog. Anschließend muss die Datei wieder geschlossen werden:

Falls zwischen open und close ein Fehler passiert, durch den das Programm abgebrochen wird, wird die Datei u.U. nicht richtig geschlossen. Um das zu vermeiden, gibt es folgenden Mechanismus, den man sich angewöhnen sollte:

Hier ist sichergestellt, dass die Datei nach dem with-Block in jedem Fall wieder geschlossen worden ist.

In Dateien schreiben

Um in eine Datei zu schreiben, muss beim Öffnen das Argument 'w' angegeben werden (Vorsicht: eine Datei, die bereits existiert, wird so durch eine leere Datei ersetzt).

Am einfachsten schreibt man zeilenweise in die Datei, indem man die geöffnete Datei an die print-Funktion übergibt:

Um an eine bestehende Datei anzuhängen, kann man 'a' anstatt 'w' benutzen. (Analog zu den Umleitungsoperatoren >> und > in der Linux-Shell.)