Mittelstufe ~25 Min. Mathematik & Logik

Bedingte Wahrscheinlichkeit

Lernziele

  • bedingte Wahrscheinlichkeiten mit der Formel berechnen
  • Vierfeldertafeln aufstellen und auswerten
  • den Satz von Bayes anwenden
  • stochastische Unabhängigkeit prüfen

Einführung

„Dein Freund sagt: Der Corona-Test ist 99 % sicher! Du testest positiv. Bist du zu 99 % krank? NEIN! Und das ist der ganze Punkt dieser Lektion.”

Bedingte Wahrscheinlichkeit ist eines der zentralen Themen im Abi — und gleichzeitig das Thema, bei dem die Intuition am stärksten in die Irre führt. Es verbindet Baumdiagramme, Vierfeldertafeln und den berühmten Satz von Bayes.

Grundidee

Stell dir folgende Situation vor: Es regnet draußen in Strömen. Dein Bus hat bei Regen häufig Verspätung. Die Tatsache, dass es regnet, verändert die Wahrscheinlichkeit, dass du zu spät kommst. Das ist bedingte Wahrscheinlichkeit in einem Satz.

Aber es wird richtig spannend, wenn die Intuition versagt. Stell dir vor:

Du lebst in einer Stadt mit 10.000 Menschen. Eine seltene Krankheit betrifft 200 davon (2 %). Es gibt einen Test — er erkennt 95 % der Kranken richtig und zeigt bei 10 % der Gesunden fälschlicherweise „positiv” an. Du testest positiv. Wie wahrscheinlich bist du wirklich krank?

Die meisten Menschen antworten spontan: „95 %!” oder „90 %!” Die wahre Antwort: nur etwa 16 %. Wie das sein kann, zeigt diese Lektion Schritt für Schritt.

Die Kernfrage

Bedingte Wahrscheinlichkeit beantwortet: Wie ändert sich die Wahrscheinlichkeit eines Ereignisses, wenn du bereits etwas anderes weißt? Das „Wissen” schränkt die möglichen Ausgänge ein — und damit ändern sich die Chancen.

Erklärung

Definition

Die bedingte Wahrscheinlichkeit von AA unter der Bedingung BB (gelesen: „AA gegeben BB”) ist:

In Worten: Wir schauen uns nur die Fälle an, in denen BB eingetreten ist. Von diesen Fällen zählen wir, wie viele auch AA erfüllen.

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

Dabei muss P(B)>0P(B) > 0 gelten.

Multiplikationssatz

Aus der Definition folgt direkt:

In Worten: Die Wahrscheinlichkeit, dass beides eintritt, ist die Wahrscheinlichkeit des einen mal die bedingte Wahrscheinlichkeit des anderen.

P(AB)=P(B)P(AB)=P(A)P(BA)P(A \cap B) = P(B) \cdot P(A \mid B) = P(A) \cdot P(B \mid A)

Das kennt man vom Baumdiagramm: Entlang eines Pfades wird multipliziert.

Vierfeldertafel

Eine Vierfeldertafel ordnet zwei Merkmale (AA/Aˉ\bar{A} und BB/Bˉ\bar{B}) übersichtlich an:

BBBˉ\bar{B}Summe
AAP(AB)P(A \cap B)P(ABˉ)P(A \cap \bar{B})P(A)P(A)
Aˉ\bar{A}P(AˉB)P(\bar{A} \cap B)P(AˉBˉ)P(\bar{A} \cap \bar{B})P(Aˉ)P(\bar{A})
SummeP(B)P(B)P(Bˉ)P(\bar{B})11

Aus der Vierfeldertafel lassen sich alle bedingten Wahrscheinlichkeiten ablesen:

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

Satz der totalen Wahrscheinlichkeit

In Worten: Wenn es zwei sich ausschließende Wege gibt, auf denen AA eintreten kann (über BB oder über „nicht BB”), dann addiert man beide Wege.

Wenn BB und Bˉ\bar{B} alle Fälle abdecken:

P(A)=P(AB)P(B)+P(ABˉ)P(Bˉ)P(A) = P(A \mid B) \cdot P(B) + P(A \mid \bar{B}) \cdot P(\bar{B})

Das entspricht der Pfadadditionsregel im Baumdiagramm: Man summiert alle Pfade, die zu AA führen.

Satz von Bayes

Der Satz von Bayes „dreht” die Bedingung um — von P(AB)P(A \mid B) zu P(BA)P(B \mid A):

In Worten: Du kennst, wie wahrscheinlich ein positiver Test bei Krankheit ist. Du willst aber wissen, wie wahrscheinlich die Krankheit bei positivem Test ist. Bayes dreht die Richtung um.

P(BA)=P(AB)P(B)P(A)P(B \mid A) = \frac{P(A \mid B) \cdot P(B)}{P(A)}

Satz von Bayes — die Umkehr-Formel
  • Eingabe: P(AB)P(A \mid B) (z. B. P(positiv | krank) = Sensitivität)
  • Ausgabe: P(BA)P(B \mid A) (z. B. P(krank | positiv) = was dich wirklich interessiert)
  • Schlüssel: Die Grundrate P(B)P(B) geht entscheidend ein — wie häufig ist die Krankheit überhaupt?

Stochastische Unabhängigkeit

Zwei Ereignisse AA und BB heißen stochastisch unabhängig, wenn:

P(AB)=P(A)P(A \mid B) = P(A)

In Worten: Das Wissen über BB ändert nichts an der Wahrscheinlichkeit von AA. Ob es regnet oder nicht — die Wahrscheinlichkeit, dass dein Toaster kaputtgeht, bleibt gleich.

Äquivalent dazu:

P(AB)=P(A)P(B)P(A \cap B) = P(A) \cdot P(B)

Beispiel aus dem Alltag

Das Herzstück: Der medizinische Test

Dieses Beispiel ist das zentrale Beispiel für bedingte Wahrscheinlichkeit. Wir gehen es Schritt für Schritt durch.

Ausgangslage:

  • Eine Krankheit betrifft 2%2\,\% der Bevölkerung (Prävalenz)
  • Sensitivität 95%95\,\%: P(positivkrank)=0,95P(\text{positiv} \mid \text{krank}) = 0{,}95
  • Spezifität 90%90\,\%: P(negativgesund)=0,90P(\text{negativ} \mid \text{gesund}) = 0{,}90

Schritt 1: Wir stellen uns 10.000 Menschen vor.

Von 10.000 Menschen sind:
  → 200 krank    (2 % von 10.000)
  → 9.800 gesund (98 % von 10.000)

Schritt 2: Alle werden getestet.

Von den 200 Kranken:
  → 190 testen positiv  (95 % Sensitivität)
  →  10 testen negativ  (werden übersehen!)

Von den 9.800 Gesunden:
  → 980 testen positiv  (10 % Falsch-Positiv-Rate!)
  → 8.820 testen negativ

Schritt 3: Die Vierfeldertafel — alle Zahlen auf einen Blick:

                  krank     gesund    │ Summe
  ────────────────┼─────────┼─────────┼────────
  Test positiv    │   190   │   980   │ 1.170
  Test negativ    │    10   │ 8.820   │ 8.830
  ────────────────┼─────────┼─────────┼────────
  Summe           │   200   │ 9.800   │ 10.000

Schritt 4: Die entscheidende Frage — du testest positiv. Wie wahrscheinlich bist du krank?

Von 1.170 positiv Getesteten sind nur 190 wirklich krank:

P(krank | positiv) = 190 / 1.170 ≈ 0,162 = 16,2 %

P(krankpositiv)=19011700,162=16,2%P(\text{krank} \mid \text{positiv}) = \frac{190}{1\,170} \approx 0{,}162 = 16{,}2\,\%

Häufiger Irrtum

Irrtum: „P(positiv | krank) = 95 %, also muss P(krank | positiv) auch ungefähr 95 % sein.”

Richtig ist: P(AB)P(BA)P(A \mid B) \neq P(B \mid A) — die Richtung der Bedingung ist entscheidend!

  • P(positivkrank)=95%P(\text{positiv} \mid \text{krank}) = 95\,\% — der Test erkennt Kranke gut.
  • P(krankpositiv)=16,2%P(\text{krank} \mid \text{positiv}) = 16{,}2\,\% — aber ein positiver Test heißt trotzdem wenig!

Das ist wie: „Die meisten Haie sind im Meer” (P(MeerHai)100%P(\text{Meer} \mid \text{Hai}) \approx 100\,\%) bedeutet NICHT „Die meisten Meeresbewohner sind Haie” (P(HaiMeer)P(\text{Hai} \mid \text{Meer}) ist winzig).

Base Rate Neglect — der häufigste Denkfehler

Warum versagt die Intuition? Weil wir die Grundrate (wie selten die Krankheit ist) ignorieren. Bei 2 % Kranken gibt es 9.800 Gesunde, die falsch-positiv testen können. Selbst wenn nur 10 % von ihnen falsch-positiv sind, sind das 980 falsch-positive — weit mehr als die 190 richtig-positiven! Je seltener die Krankheit, desto unzuverlässiger ist ein positiver Test.

Beispiel 2: Qualitätskontrolle

Eine Fabrik hat zwei Maschinen. Maschine A produziert 60%60\,\% der Teile (Fehlerquote 3%3\,\%), Maschine B produziert 40%40\,\% (Fehlerquote 5%5\,\%).

Totale Wahrscheinlichkeit — wie viele Teile sind insgesamt defekt?

P(defekt)=0,600,03+0,400,05=0,018+0,020=0,038P(\text{defekt}) = 0{,}60 \cdot 0{,}03 + 0{,}40 \cdot 0{,}05 = 0{,}018 + 0{,}020 = 0{,}038

Bayes — ein defektes Teil wird gefunden. Von welcher Maschine stammt es?

P(Adefekt)=0,0180,0380,474=47,4%P(A \mid \text{defekt}) = \frac{0{,}018}{0{,}038} \approx 0{,}474 = 47{,}4\,\%

P(Bdefekt)=0,0200,0380,526=52,6%P(B \mid \text{defekt}) = \frac{0{,}020}{0{,}038} \approx 0{,}526 = 52{,}6\,\%

Obwohl Maschine A mehr produziert, ist das defekte Teil eher von Maschine B — wegen der höheren Fehlerquote.

Anwendung

Aufgabe 1: Vierfeldertafel ausfüllen

Gegeben: P(A)=0,4P(A) = 0{,}4, P(B)=0,5P(B) = 0{,}5, P(AB)=0,15P(A \cap B) = 0{,}15.

BBBˉ\bar{B}Summe
AA0,150{,}150,250{,}250,400{,}40
Aˉ\bar{A}0,350{,}350,250{,}250,600{,}60
Summe0,500{,}500,500{,}501,001{,}00

P(AB)=0,150,50=0,30P(A \mid B) = \frac{0{,}15}{0{,}50} = \boxed{0{,}30}

Aufgabe 2: Baumdiagramm — Urne ohne Zurücklegen

Eine Urne enthält 4 rote und 6 blaue Kugeln. Zwei werden ohne Zurücklegen gezogen.

Erster Zug          Zweiter Zug (ohne Zurücklegen!)
                    ┌── rot:  3/9  → P(rot,rot) = 4/10 · 3/9
       ┌── rot: 4/10
       │            └── blau: 6/9  → P(rot,blau) = 4/10 · 6/9
Start ─┤
       │            ┌── rot:  4/9  → P(blau,rot) = 6/10 · 4/9
       └── blau: 6/10
                    └── blau: 5/9  → P(blau,blau) = 6/10 · 5/9

P(2. rot1. rot)=39=13P(\text{2. rot} \mid \text{1. rot}) = \frac{3}{9} = \frac{1}{3}

P(beide rot)=41039=1290=2150,133P(\text{beide rot}) = \frac{4}{10} \cdot \frac{3}{9} = \frac{12}{90} = \boxed{\frac{2}{15} \approx 0{,}133}

Aufgabe 3: Satz von Bayes — Drogentest

Ein Drogentest hat Sensitivität 99%99\,\% und Spezifität 95%95\,\%. In der getesteten Gruppe konsumieren 5%5\,\% Drogen.

P(positiv)=0,990,05+0,050,95=0,0495+0,0475=0,097P(\text{positiv}) = 0{,}99 \cdot 0{,}05 + 0{,}05 \cdot 0{,}95 = 0{,}0495 + 0{,}0475 = 0{,}097

P(Konsumpositiv)=0,04950,0970,510=51,0%P(\text{Konsum} \mid \text{positiv}) = \frac{0{,}0495}{0{,}097} \approx \boxed{0{,}510 = 51{,}0\,\%}

Nur gut die Hälfte der positiv Getesteten konsumiert tatsächlich Drogen.

Aufgabe 4: Unabhängigkeit prüfen

Gegeben: P(A)=0,3P(A) = 0{,}3, P(B)=0,5P(B) = 0{,}5, P(AB)=0,15P(A \cap B) = 0{,}15.

Prüfung: P(A)P(B)=0,30,5=0,15=P(AB)P(A) \cdot P(B) = 0{,}3 \cdot 0{,}5 = 0{,}15 = P(A \cap B)

A und B sind stochastisch unabha¨ngig.\boxed{A \text{ und } B \text{ sind stochastisch unabhängig.}}

Typische Fehler

Häufiger Irrtum

Irrtum:P(AB)P(A \mid B) und P(BA)P(B \mid A) sind dasselbe — die Reihenfolge ist egal.”

Richtig ist: Die Reihenfolge der Bedingung ist entscheidend! P(krankpositiv)P(\text{krank} \mid \text{positiv}) ist etwas völlig anderes als P(positivkrank)P(\text{positiv} \mid \text{krank}). Im Testbeispiel: P(positivkrank)=95%P(\text{positiv} \mid \text{krank}) = 95\,\%, aber P(krankpositiv)=16,2%P(\text{krank} \mid \text{positiv}) = 16{,}2\,\%.

Häufiger Irrtum

Irrtum: „Ein Test mit 99 % Trefferquote ist praktisch perfekt.”

Richtig ist: Bei einer seltenen Krankheit (0,1%0{,}1\,\%) kann trotzdem die Mehrheit der positiven Tests falsch-positiv sein. Die Grundrate (Prävalenz) bestimmt maßgeblich, wie aussagekräftig ein positives Ergebnis ist.

Häufiger Irrtum

Irrtum: „Unabhängig und unvereinbar sind dasselbe.”

Richtig ist: Unabhängig bedeutet P(AB)=P(A)P(B)P(A \cap B) = P(A) \cdot P(B) — beide können gleichzeitig eintreten, beeinflussen sich aber nicht. Unvereinbar bedeutet P(AB)=0P(A \cap B) = 0 — beide können NICHT gleichzeitig eintreten. Das Gegenteil!

Weitere häufige Fehler:

  1. Vierfeldertafel-Summen nicht prüfen: Zeilen und Spalten müssen sich korrekt aufsummieren, die Gesamtsumme muss 11 (oder die Gesamtzahl) ergeben.

  2. Bayes vergessen: Wenn man P(BA)P(B \mid A) braucht, aber nur P(AB)P(A \mid B) kennt, muss man den Satz von Bayes anwenden — nicht einfach die Bedingung umdrehen.

Zusammenfassung

  • Bedingte Wahrscheinlichkeit: P(AB)=P(AB)/P(B)P(A \mid B) = P(A \cap B) / P(B) — „Wahrscheinlichkeit von AA, wenn BB bekannt”.
  • Die Vierfeldertafel ist das zentrale Werkzeug zum Organisieren bedingter Wahrscheinlichkeiten.
  • Der Satz von Bayes dreht die Bedingung um: von P(AB)P(A \mid B) zu P(BA)P(B \mid A).
  • Der Satz der totalen Wahrscheinlichkeit summiert alle Pfade zu einem Ereignis.
  • Stochastische Unabhängigkeit liegt vor, wenn P(AB)=P(A)P(B)P(A \cap B) = P(A) \cdot P(B).
  • Bei seltenen Ereignissen führen selbst gute Tests zu vielen falsch-positiven Ergebnissen.

Quiz

Frage 1: P(A)=0,6P(A) = 0{,}6, P(B)=0,5P(B) = 0{,}5, P(AB)=0,2P(A \cap B) = 0{,}2. Berechne P(AB)P(A \mid B).

Frage 2: Sind AA und BB aus Frage 1 unabhängig?

Frage 3: Ein Test hat Sensitivität 90%90\,\%, die Krankheit betrifft 1%1\,\% der Bevölkerung. Warum ist P(krankpositiv)P(\text{krank} \mid \text{positiv}) trotzdem niedrig?

Frage 4: In einem Baumdiagramm kennst du P(B)=0,3P(B) = 0{,}3 und P(AB)=0,7P(A \mid B) = 0{,}7. Wie berechnest du P(AB)P(A \cap B)?

Schlüsselwörter

bedingte-wahrscheinlichkeitvierfeldertafelsatz-von-bayesstochastische-unabhängigkeitschnittmenge