Bedingte Wahrscheinlichkeit

Einführung

„Dein Freund sagt: Der Corona-Test ist 99 % sicher! Du testest positiv. Bist du zu 99 % krank? NEIN! Und das ist der ganze Punkt dieser Lektion.”

Bedingte Wahrscheinlichkeit ist eines der zentralen Themen im Abi — und gleichzeitig das Thema, bei dem die Intuition am stärksten in die Irre führt. Es verbindet Baumdiagramme, Vierfeldertafeln und den berühmten Satz von Bayes.

Grundidee

Stell dir folgende Situation vor: Es regnet draußen in Strömen. Dein Bus hat bei Regen häufig Verspätung. Die Tatsache, dass es regnet, verändert die Wahrscheinlichkeit, dass du zu spät kommst. Das ist bedingte Wahrscheinlichkeit in einem Satz.

Aber es wird richtig spannend, wenn die Intuition versagt. Stell dir vor:

Du lebst in einer Stadt mit 10.000 Menschen. Eine seltene Krankheit betrifft 200 davon (2 %). Es gibt einen Test — er erkennt 95 % der Kranken richtig und zeigt bei 10 % der Gesunden fälschlicherweise „positiv” an. Du testest positiv. Wie wahrscheinlich bist du wirklich krank?

Die meisten Menschen antworten spontan: „95 %!” oder „90 %!” Die wahre Antwort: nur etwa 16 %. Wie das sein kann, zeigt diese Lektion Schritt für Schritt.

Die Kernfrage

Bedingte Wahrscheinlichkeit beantwortet: Wie ändert sich die Wahrscheinlichkeit eines Ereignisses, wenn du bereits etwas anderes weißt? Das „Wissen” schränkt die möglichen Ausgänge ein — und damit ändern sich die Chancen.

Erklärung

Definition

Die bedingte Wahrscheinlichkeit von $A$ unter der Bedingung $B$ (gelesen: „ $A$ gegeben $B$ ”) ist:

In Worten: Wir schauen uns nur die Fälle an, in denen $B$ eingetreten ist. Von diesen Fällen zählen wir, wie viele auch $A$ erfüllen.

$P(A \mid B) = \frac{P(A \cap B)}{P(B)}$

Dabei muss $P(B) > 0$ gelten.

Multiplikationssatz

Aus der Definition folgt direkt:

In Worten: Die Wahrscheinlichkeit, dass beides eintritt, ist die Wahrscheinlichkeit des einen mal die bedingte Wahrscheinlichkeit des anderen.

$P(A \cap B) = P(B) \cdot P(A \mid B) = P(A) \cdot P(B \mid A)$

Das kennt man vom Baumdiagramm: Entlang eines Pfades wird multipliziert.

Vierfeldertafel

Eine Vierfeldertafel ordnet zwei Merkmale ( $A$ / $\bar{A}$ und $B$ / $\bar{B}$ ) übersichtlich an:

	$B$	$\bar{B}$	Summe
$A$	$P(A \cap B)$	$P(A \cap \bar{B})$	$P(A)$
$\bar{A}$	$P(\bar{A} \cap B)$	$P(\bar{A} \cap \bar{B})$	$P(\bar{A})$
Summe	$P(B)$	$P(\bar{B})$	$1$

Aus der Vierfeldertafel lassen sich alle bedingten Wahrscheinlichkeiten ablesen:

$P(A \mid B) = \frac{P(A \cap B)}{P(B)}$

Satz der totalen Wahrscheinlichkeit

In Worten: Wenn es zwei sich ausschließende Wege gibt, auf denen $A$ eintreten kann (über $B$ oder über „nicht $B$ ”), dann addiert man beide Wege.

Wenn $B$ und $\bar{B}$ alle Fälle abdecken:

$P(A) = P(A \mid B) \cdot P(B) + P(A \mid \bar{B}) \cdot P(\bar{B})$

Das entspricht der Pfadadditionsregel im Baumdiagramm: Man summiert alle Pfade, die zu $A$ führen.

Satz von Bayes

Der Satz von Bayes „dreht” die Bedingung um — von $P(A \mid B)$ zu $P(B \mid A)$ :

In Worten: Du kennst, wie wahrscheinlich ein positiver Test bei Krankheit ist. Du willst aber wissen, wie wahrscheinlich die Krankheit bei positivem Test ist. Bayes dreht die Richtung um.

$P(B \mid A) = \frac{P(A \mid B) \cdot P(B)}{P(A)}$

Satz von Bayes — die Umkehr-Formel

Eingabe: $P(A \mid B)$ (z. B. P(positiv | krank) = Sensitivität)
Ausgabe: $P(B \mid A)$ (z. B. P(krank | positiv) = was dich wirklich interessiert)
Schlüssel: Die Grundrate $P(B)$ geht entscheidend ein — wie häufig ist die Krankheit überhaupt?

Stochastische Unabhängigkeit

Zwei Ereignisse $A$ und $B$ heißen stochastisch unabhängig, wenn:

$P(A \mid B) = P(A)$

In Worten: Das Wissen über $B$ ändert nichts an der Wahrscheinlichkeit von $A$ . Ob es regnet oder nicht — die Wahrscheinlichkeit, dass dein Toaster kaputtgeht, bleibt gleich.

Äquivalent dazu:

$P(A \cap B) = P(A) \cdot P(B)$

Beispiel aus dem Alltag

Das Herzstück: Der medizinische Test

Dieses Beispiel ist das zentrale Beispiel für bedingte Wahrscheinlichkeit. Wir gehen es Schritt für Schritt durch.

Ausgangslage:

Eine Krankheit betrifft $2\,\%$ der Bevölkerung (Prävalenz)
Sensitivität $95\,\%$ : $P(\text{positiv} \mid \text{krank}) = 0{,}95$
Spezifität $90\,\%$ : $P(\text{negativ} \mid \text{gesund}) = 0{,}90$

Schritt 1: Wir stellen uns 10.000 Menschen vor.

Von 10.000 Menschen sind:
  → 200 krank    (2 % von 10.000)
  → 9.800 gesund (98 % von 10.000)

Schritt 2: Alle werden getestet.

Von den 200 Kranken:
  → 190 testen positiv  (95 % Sensitivität)
  →  10 testen negativ  (werden übersehen!)

Von den 9.800 Gesunden:
  → 980 testen positiv  (10 % Falsch-Positiv-Rate!)
  → 8.820 testen negativ

Schritt 3: Die Vierfeldertafel — alle Zahlen auf einen Blick:

                  krank     gesund    │ Summe
  ────────────────┼─────────┼─────────┼────────
  Test positiv    │   190   │   980   │ 1.170
  Test negativ    │    10   │ 8.820   │ 8.830
  ────────────────┼─────────┼─────────┼────────
  Summe           │   200   │ 9.800   │ 10.000

Schritt 4: Die entscheidende Frage — du testest positiv. Wie wahrscheinlich bist du krank?

Von 1.170 positiv Getesteten sind nur 190 wirklich krank:

P(krank | positiv) = 190 / 1.170 ≈ 0,162 = 16,2 %

$P(\text{krank} \mid \text{positiv}) = \frac{190}{1\,170} \approx 0{,}162 = 16{,}2\,\%$

Häufiger Irrtum

Irrtum: „P(positiv | krank) = 95 %, also muss P(krank | positiv) auch ungefähr 95 % sein.”

Richtig ist: $P(A \mid B) \neq P(B \mid A)$ — die Richtung der Bedingung ist entscheidend!

$P(\text{positiv} \mid \text{krank}) = 95\,\%$ — der Test erkennt Kranke gut.
$P(\text{krank} \mid \text{positiv}) = 16{,}2\,\%$ — aber ein positiver Test heißt trotzdem wenig!

Das ist wie: „Die meisten Haie sind im Meer” ( $P(\text{Meer} \mid \text{Hai}) \approx 100\,\%$ ) bedeutet NICHT „Die meisten Meeresbewohner sind Haie” ( $P(\text{Hai} \mid \text{Meer})$ ist winzig).

Base Rate Neglect — der häufigste Denkfehler

Warum versagt die Intuition? Weil wir die Grundrate (wie selten die Krankheit ist) ignorieren. Bei 2 % Kranken gibt es 9.800 Gesunde, die falsch-positiv testen können. Selbst wenn nur 10 % von ihnen falsch-positiv sind, sind das 980 falsch-positive — weit mehr als die 190 richtig-positiven! Je seltener die Krankheit, desto unzuverlässiger ist ein positiver Test.

Beispiel 2: Qualitätskontrolle

Eine Fabrik hat zwei Maschinen. Maschine A produziert $60\,\%$ der Teile (Fehlerquote $3\,\%$ ), Maschine B produziert $40\,\%$ (Fehlerquote $5\,\%$ ).

Totale Wahrscheinlichkeit — wie viele Teile sind insgesamt defekt?

$P(\text{defekt}) = 0{,}60 \cdot 0{,}03 + 0{,}40 \cdot 0{,}05 = 0{,}018 + 0{,}020 = 0{,}038$

Bayes — ein defektes Teil wird gefunden. Von welcher Maschine stammt es?

$P(A \mid \text{defekt}) = \frac{0{,}018}{0{,}038} \approx 0{,}474 = 47{,}4\,\%$

$P(B \mid \text{defekt}) = \frac{0{,}020}{0{,}038} \approx 0{,}526 = 52{,}6\,\%$

Obwohl Maschine A mehr produziert, ist das defekte Teil eher von Maschine B — wegen der höheren Fehlerquote.

Anwendung

Aufgabe 1: Vierfeldertafel ausfüllen

Gegeben: $P(A) = 0{,}4$ , $P(B) = 0{,}5$ , $P(A \cap B) = 0{,}15$ .

	$B$	$\bar{B}$	Summe
$A$	$0{,}15$	$0{,}25$	$0{,}40$
$\bar{A}$	$0{,}35$	$0{,}25$	$0{,}60$
Summe	$0{,}50$	$0{,}50$	$1{,}00$

$P(A \mid B) = \frac{0{,}15}{0{,}50} = \boxed{0{,}30}$

Aufgabe 2: Baumdiagramm — Urne ohne Zurücklegen

Eine Urne enthält 4 rote und 6 blaue Kugeln. Zwei werden ohne Zurücklegen gezogen.

Erster Zug          Zweiter Zug (ohne Zurücklegen!)
                    ┌── rot:  3/9  → P(rot,rot) = 4/10 · 3/9
       ┌── rot: 4/10
       │            └── blau: 6/9  → P(rot,blau) = 4/10 · 6/9
Start ─┤
       │            ┌── rot:  4/9  → P(blau,rot) = 6/10 · 4/9
       └── blau: 6/10
                    └── blau: 5/9  → P(blau,blau) = 6/10 · 5/9

$P(\text{2. rot} \mid \text{1. rot}) = \frac{3}{9} = \frac{1}{3}$

$P(\text{beide rot}) = \frac{4}{10} \cdot \frac{3}{9} = \frac{12}{90} = \boxed{\frac{2}{15} \approx 0{,}133}$

Aufgabe 3: Satz von Bayes — Drogentest

Ein Drogentest hat Sensitivität $99\,\%$ und Spezifität $95\,\%$ . In der getesteten Gruppe konsumieren $5\,\%$ Drogen.

$P(\text{positiv}) = 0{,}99 \cdot 0{,}05 + 0{,}05 \cdot 0{,}95 = 0{,}0495 + 0{,}0475 = 0{,}097$

$P(\text{Konsum} \mid \text{positiv}) = \frac{0{,}0495}{0{,}097} \approx \boxed{0{,}510 = 51{,}0\,\%}$

Nur gut die Hälfte der positiv Getesteten konsumiert tatsächlich Drogen.

Aufgabe 4: Unabhängigkeit prüfen

Gegeben: $P(A) = 0{,}3$ , $P(B) = 0{,}5$ , $P(A \cap B) = 0{,}15$ .

Prüfung: $P(A) \cdot P(B) = 0{,}3 \cdot 0{,}5 = 0{,}15 = P(A \cap B)$ ✓

$\boxed{A \text{ und } B \text{ sind stochastisch unabhängig.}}$

Typische Fehler

Häufiger Irrtum

Irrtum: „ $P(A \mid B)$ und $P(B \mid A)$ sind dasselbe — die Reihenfolge ist egal.”

Richtig ist: Die Reihenfolge der Bedingung ist entscheidend! $P(\text{krank} \mid \text{positiv})$ ist etwas völlig anderes als $P(\text{positiv} \mid \text{krank})$ . Im Testbeispiel: $P(\text{positiv} \mid \text{krank}) = 95\,\%$ , aber $P(\text{krank} \mid \text{positiv}) = 16{,}2\,\%$ .

Häufiger Irrtum

Irrtum: „Ein Test mit 99 % Trefferquote ist praktisch perfekt.”

Richtig ist: Bei einer seltenen Krankheit ( $0{,}1\,\%$ ) kann trotzdem die Mehrheit der positiven Tests falsch-positiv sein. Die Grundrate (Prävalenz) bestimmt maßgeblich, wie aussagekräftig ein positives Ergebnis ist.

Häufiger Irrtum

Irrtum: „Unabhängig und unvereinbar sind dasselbe.”

Richtig ist: Unabhängig bedeutet $P(A \cap B) = P(A) \cdot P(B)$ — beide können gleichzeitig eintreten, beeinflussen sich aber nicht. Unvereinbar bedeutet $P(A \cap B) = 0$ — beide können NICHT gleichzeitig eintreten. Das Gegenteil!

Weitere häufige Fehler:

Vierfeldertafel-Summen nicht prüfen: Zeilen und Spalten müssen sich korrekt aufsummieren, die Gesamtsumme muss $1$ (oder die Gesamtzahl) ergeben.
Bayes vergessen: Wenn man $P(B \mid A)$ braucht, aber nur $P(A \mid B)$ kennt, muss man den Satz von Bayes anwenden — nicht einfach die Bedingung umdrehen.

Zusammenfassung

Bedingte Wahrscheinlichkeit: $P(A \mid B) = P(A \cap B) / P(B)$ — „Wahrscheinlichkeit von $A$ , wenn $B$ bekannt”.
Die Vierfeldertafel ist das zentrale Werkzeug zum Organisieren bedingter Wahrscheinlichkeiten.
Der Satz von Bayes dreht die Bedingung um: von $P(A \mid B)$ zu $P(B \mid A)$ .
Der Satz der totalen Wahrscheinlichkeit summiert alle Pfade zu einem Ereignis.
Stochastische Unabhängigkeit liegt vor, wenn $P(A \cap B) = P(A) \cdot P(B)$ .
Bei seltenen Ereignissen führen selbst gute Tests zu vielen falsch-positiven Ergebnissen.

Quiz

Frage 1: $P(A) = 0{,}6$ , $P(B) = 0{,}5$ , $P(A \cap B) = 0{,}2$ . Berechne $P(A \mid B)$ .

Frage 2: Sind $A$ und $B$ aus Frage 1 unabhängig?

Frage 3: Ein Test hat Sensitivität $90\,\%$ , die Krankheit betrifft $1\,\%$ der Bevölkerung. Warum ist $P(\text{krank} \mid \text{positiv})$ trotzdem niedrig?

Frage 4: In einem Baumdiagramm kennst du $P(B) = 0{,}3$ und $P(A \mid B) = 0{,}7$ . Wie berechnest du $P(A \cap B)$ ?

Bedingte Wahrscheinlichkeit

Lernziele

Vorwissen empfohlen

Einführung

Grundidee

Erklärung

Definition

Multiplikationssatz

Vierfeldertafel

Satz der totalen Wahrscheinlichkeit

Satz von Bayes

Stochastische Unabhängigkeit

Beispiel aus dem Alltag

Das Herzstück: Der medizinische Test

Beispiel 2: Qualitätskontrolle

Anwendung

Aufgabe 1: Vierfeldertafel ausfüllen

Aufgabe 2: Baumdiagramm — Urne ohne Zurücklegen

Aufgabe 3: Satz von Bayes — Drogentest

Aufgabe 4: Unabhängigkeit prüfen

Typische Fehler

Zusammenfassung

Quiz

Schlüsselwörter

Aufgaben mit Lösungsweg

Verwandte Themen