Spieltheorie — Wenn Entscheidungen voneinander abhängen

Einführung

Warum kooperieren Staaten nicht einfach gegen den Klimawandel, obwohl es offensichtlich besser wäre? Warum rüsten Länder auf, obwohl das beide ärmer macht? Warum bieten Unternehmen manchmal Produkte unter Selbstkosten an?

Diese Fragen haben mehr gemeinsam, als es aussieht: Sie alle beschreiben Situationen, in denen das Ergebnis nicht nur von den eigenen Entscheidungen abhängt — sondern von dem, was andere tun. Genau das analysiert die Spieltheorie.

Spieltheorie ist ein mathematisches Werkzeug, mit dem sich strategische Entscheidungen modellieren lassen. Sie wurde im 20. Jahrhundert entwickelt — zunächst für Militär und Ökonomie, heute angewendet in Biologie, Politikwissenschaft, Informatik, Psychologie und Verhaltensökonomie. Der Begriff „Spiel” meint dabei kein Brettspiel, sondern jede Situation, in der mehrere Akteure voneinander abhängige Entscheidungen treffen.

Grundidee

Spieltheorie beschreibt Situationen als Spiele mit folgenden Elementen:

Spieler: Wer entscheidet?
Strategien: Welche Optionen hat jeder Spieler?
Auszahlungen: Was bringt jede Kombination von Entscheidungen den Spielern?

Das Ziel jedes Spielers ist in der Regel, die eigene Auszahlung zu maximieren. Das klingt simpel — aber wenn das alle gleichzeitig tun, kann das Ergebnis für alle schlechter sein, als es sein könnte. Genau das ist das paradoxe Kernproblem der Spieltheorie.

Erklärung

Das Gefangenendilemma

Das Gefangenendilemma ist das berühmteste Beispiel der Spieltheorie. Die Situation:

Zwei Verdächtige (Anna und Ben) werden nach einem Einbruch getrennt verhört. Die Polizei hat nur geringe Beweise. Beiden wird dasselbe Angebot gemacht:

Wenn du gestehst und dein Partner nicht, kommst du frei — dein Partner bekommt 5 Jahre.
Wenn du nicht gestehst und dein Partner gesteht, bekommst du 5 Jahre — er kommt frei.
Wenn ihr beide gesteht, bekommt ihr je 3 Jahre.
Wenn keiner gesteht, bekommt ihr je 1 Jahr (nur wegen geringer Vergehen).

Die Auszahlungsmatrix (in Jahren Haft, kleiner ist besser):

	Ben schweigt	Ben gesteht
Anna schweigt	1 / 1	5 / 0
Anna gesteht	0 / 5	3 / 3

Dominante Strategie

Denk aus Annas Perspektive. Sie weiß nicht, was Ben tut. Zwei Fälle:

Fall 1: Ben schweigt. Wenn Anna auch schweigt: 1 Jahr. Wenn Anna gesteht: 0 Jahre. → Gestehen ist besser.

Fall 2: Ben gesteht. Wenn Anna schweigt: 5 Jahre. Wenn Anna gesteht: 3 Jahre. → Gestehen ist besser.

Egal was Ben tut — für Anna ist Gestehen immer besser als Schweigen. Das nennt man eine dominante Strategie: eine Strategie, die alle anderen überbietet, unabhängig davon, was die Gegenseite tut.

Das Gleiche gilt für Ben. Also gestehen beide.

Nash-Gleichgewicht

Das Ergebnis: Beide gestehen, beide bekommen 3 Jahre. Das ist das Nash-Gleichgewicht — benannt nach John Nash (1928–2015).

Ein Nash-Gleichgewicht ist ein Zustand, in dem kein Spieler seine Strategie einseitig ändern will, gegeben die Strategie der anderen. Wenn beide gestehen, hat niemand einen Anreiz abzuweichen: Würde Anna allein zum Schweigen wechseln, bekäme sie 5 statt 3 Jahre.

Das Nash-Gleichgewicht ist stabil — aber nicht optimal.

Pareto-Optimum vs. Nash-Gleichgewicht

Das Pareto-Optimum (benannt nach Vilfredo Pareto) beschreibt eine Situation, in der niemand besser gestellt werden kann, ohne jemand anderen schlechter zu stellen.

Im Gefangenendilemma ist das Schweigen-Schweigen-Ergebnis (je 1 Jahr) pareto-optimal: Man könnte ein Ergebnis verbessern, nur indem man das andere verschlechtert. Aber genau dieses Ergebnis ist kein Nash-Gleichgewicht!

Das zeigt ein fundamentales Problem: Rationale Akteure können systematisch schlechtere Ergebnisse produzieren, als kollektiv möglich wäre. Jeder handelt in seinem besten Interesse — und alle landen schlechter da.

Nullsummenspiel vs. kooperative Spiele

Im Nullsummenspiel verliert einer genau so viel, wie der andere gewinnt. Tennis, Schach, Pokern — der Gesamtgewinn aller Spieler ist immer null. Hier hilft nur, den Gegner zu überbieten.

In kooperativen Spielen können alle gewinnen (oder alle verlieren). Klimapolitik, Handelsabkommen, Teamarbeit — hier gibt es Spielraum für gegenseitig vorteilhafte Lösungen, aber auch für das Gefangenendilemma.

Wiederholtes Spiel und Tit-for-Tat

Was passiert, wenn dasselbe Spiel immer wieder gespielt wird — nicht einmalig, sondern hunderte Male? Dann ändert sich die Logik fundamental.

Robert Axelrod führte in den 1980er Jahren Computerturniere durch: Welche Strategie siegt im wiederholten Gefangenendilemma? Das Ergebnis überraschte:

Tit-for-Tat gewann: Beginne mit Kooperation. Dann spiele immer das, was der andere in der letzten Runde gespielt hat. Kooperiert er — kooperiere. Verrät er dich — verrate ihn im nächsten Zug.

Diese Strategie ist simpel, verzeiht nach einer Runde und bestraft Verrat sofort. Im langen Spiel produziert sie mehr Kooperation als jede aggressivere Strategie.

Das erklärt reale Phänomene: Handelspolitik zwischen Ländern, die sich gegenseitig Zölle auferlegen und wieder abbauen — ein wiederholtes Spiel, in dem Reputation und Geschichte zählen.

Beispiel aus dem Alltag

Klimapolitik als globales Gefangenendilemma:

Land A überlegt, ob es teure Klimamaßnahmen einführt. Wenn Land B mitspielt, profitieren beide. Wenn Land B nicht mitspielt, trägt A die Kosten — und B profitiert kostenlos (free rider). Also wartet A auf B. Und B wartet auf A. Beide handeln „rational” — und das Klima wird nicht geschützt.

Das internationale Klimaregime versucht, dieses Dilemma durch Verträge, Überwachung und Sanktionen in ein wiederholtes Spiel umzuwandeln — mit gemischten Erfolgen.

Rüstungswettlauf:

Zwei Staaten können abrüsten (billig, aber riskant) oder aufrüsten (teuer, aber sicher). Wenn der andere aufrüstet und man selbst abrüstet, ist man verwundbar. Also rüsten beide auf — und geben Milliarden aus, die beiden schaden. Ein klassisches Gefangenendilemma: Das Nash-Gleichgewicht (beide rüsten) ist für beide schlechter als das Pareto-Optimum (beide rüsten ab).

Verhandlungen:

Beim Verhandeln über Gehalt oder Preise spielt Spieltheorie eine Rolle: Wer das erste Angebot macht, setzt einen Anker. Wer blufft, riskiert einen Abbruch. Wer kooperiert, signalisiert Vertrauen — kann aber ausgenutzt werden. Tit-for-Tat-artige Strategien — faire Eröffnungsangebote, klare Reaktion auf Unfairness — funktionieren langfristig besser als pure Aggression.

Anwendung

Überlege das folgende Szenario:

Zwei Firmen (Firma X und Firma Y) konkurrieren auf demselben Markt. Beide können entweder ihren Preis halten oder einen Preiskrieg beginnen (Preis senken):

Wenn beide Preise halten: beide machen guten Gewinn (je 10 Mio. €).
Wenn X senkt, Y hält: X gewinnt Marktanteile (15 Mio. €), Y verliert (3 Mio. €).
Wenn Y senkt, X hält: Y gewinnt (15 Mio. €), X verliert (3 Mio. €).
Wenn beide senken: beide verdienen wenig (je 5 Mio. €).

Beantworte:

Was ist die dominante Strategie?
Was ist das Nash-Gleichgewicht?
Was wäre das Pareto-Optimum?
Wie verändert sich die Analyse, wenn die Firmen langfristig in einem Markt konkurrieren?

Typische Fehler

Spieltheorie verwechseln mit Psychologie: Spieltheorie modelliert rationale Akteure. Reale Menschen verhalten sich nicht immer rational — sie handeln aus Gefühlen, Fairness, Stolz. Verhaltensökonomie ergänzt Spieltheorie mit psychologischen Realitäten.

Nash-Gleichgewicht mit gutem Ergebnis gleichsetzen: Das Nash-Gleichgewicht ist stabil, aber nicht notwendigerweise gut. Das Gefangenendilemma zeigt, dass stabile Gleichgewichte für alle Beteiligten schlechter sein können als mögliche Alternativen.

Nullsummendenken auf alle Situationen anwenden: Nicht jede Situation ist ein Nullsummenspiel. Handel, Kooperation und Verhandlungen können für alle Seiten positiv ausgehen — wenn man das Gefangenendilemma überwinden kann.

Einmaliges und wiederholtes Spiel verwechseln: Tit-for-Tat funktioniert im wiederholten Spiel, aber nicht im einmaligen. Wer nur einmal mit einem Fremden interagiert, hat keinen Anreiz zur Kooperation. Wer dauerhaft mit denselben Akteuren interagiert, schon.

Zusammenfassung

Spieltheorie analysiert strategische Entscheidungen mit mehreren voneinander abhängigen Akteuren
Im Gefangenendilemma produziert individuelle Rationalität ein kollektiv suboptimales Ergebnis
Dominante Strategie: Diese Strategie ist immer besser, egal was andere tun
Nash-Gleichgewicht: Kein Spieler will einseitig abweichen — aber es muss nicht das beste Ergebnis für alle sein
Pareto-Optimum: Niemand kann besser gestellt werden, ohne jemanden schlechter zu stellen — oft kein Nash-Gleichgewicht
Im wiederholten Spiel ermöglicht Tit-for-Tat Kooperation durch Belohnung von Fairness und Bestrafung von Verrat

Quiz

Frage 1: Was ist eine dominante Strategie — und warum führt sie im Gefangenendilemma zu einem schlechten Ergebnis?

Frage 2: Was ist ein Nash-Gleichgewicht — und muss es das beste Ergebnis sein?

Frage 3: Was ist Tit-for-Tat — und warum funktioniert diese Strategie im wiederholten Spiel?

Frage 4: Warum ist Klimapolitik ein Beispiel für ein Gefangenendilemma — und welche Mechanismen können es auflösen?