Mittelstufe Komplexaufgabe 12 Punkte ~25 Min. Mathematik & Logik

Medizinischer Test — Vierfeldertafel und Bayes

Aufgabenstellung

Eine Krankheit tritt in der Bevölkerung mit einer Prävalenz von 2%2\,\% auf. Ein diagnostischer Test hat eine Sensitivität von 95%95\,\% und eine Spezifität von 90%90\,\%.

  • (a) Stellen Sie eine Vierfeldertafel für 1000010\,000 Personen auf.
  • (b) Berechnen Sie den positiven Vorhersagewert P(krankpositiv)P(\text{krank} \mid \text{positiv}) mithilfe des Satzes von Bayes.
  • (c) Berechnen Sie den negativen Vorhersagewert P(gesundnegativ)P(\text{gesund} \mid \text{negativ}).
  • (d) Erklären Sie, warum P(krankpositiv)P(\text{krank} \mid \text{positiv}) trotz hoher Sensitivität so niedrig ausfällt.
  • (e) Wie verändert sich P(krankpositiv)P(\text{krank} \mid \text{positiv}), wenn die Prävalenz 10%10\,\% beträgt?

Lösungsweg

Schritt 1: Vierfeldertafel für 10.000 Personen (a)

Bezeichnungen:

  • KK: „Person ist krank”
  • T+T^+: „Test fällt positiv aus”

Gegeben: P(K)=0,02P(K) = 0{,}02, Sensitivität P(T+K)=0,95P(T^+ \mid K) = 0{,}95, Spezifität P(TKˉ)=0,90P(T^- \mid \bar{K}) = 0{,}90

Aus 1000010\,000 Personen:

  • Kranke: 100000,02=20010\,000 \cdot 0{,}02 = 200
  • Gesunde: 10000200=980010\,000 - 200 = 9\,800

Testergebnisse:

  • Richtig positiv: 2000,95=190200 \cdot 0{,}95 = 190
  • Falsch negativ: 200190=10200 - 190 = 10
  • Falsch positiv: 98000,10=9809\,800 \cdot 0{,}10 = 980
  • Richtig negativ: 9800980=88209\,800 - 980 = 8\,820
KK (krank)Kˉ\bar{K} (gesund)Summe
T+T^+ (positiv)19019098098011701\,170
TT^- (negativ)101088208\,82088308\,830
Summe20020098009\,8001000010\,000

Schritt 2: Positiver Vorhersagewert mit Bayes (b)

P(KT+)=P(T+K)P(K)P(T+)P(K \mid T^+) = \frac{P(T^+ \mid K) \cdot P(K)}{P(T^+)}

Totale Wahrscheinlichkeit für ein positives Ergebnis:

P(T+)=P(T+K)P(K)+P(T+Kˉ)P(Kˉ)P(T^+) = P(T^+ \mid K) \cdot P(K) + P(T^+ \mid \bar{K}) \cdot P(\bar{K})

P(T+)=0,950,02+0,100,98=0,019+0,098=0,117P(T^+) = 0{,}95 \cdot 0{,}02 + 0{,}10 \cdot 0{,}98 = 0{,}019 + 0{,}098 = 0{,}117

P(KT+)=0,950,020,117=0,0190,117P(K \mid T^+) = \frac{0{,}95 \cdot 0{,}02}{0{,}117} = \frac{0{,}019}{0{,}117}

P(KT+)=19011700,16216,2%\boxed{P(K \mid T^+) = \frac{190}{1\,170} \approx 0{,}162 \approx 16{,}2\,\%}

Nur etwa 16,2%16{,}2\,\% der positiv getesteten Personen sind tatsächlich krank.

Schritt 3: Negativer Vorhersagewert (c)

P(KˉT)=P(TKˉ)P(Kˉ)P(T)P(\bar{K} \mid T^-) = \frac{P(T^- \mid \bar{K}) \cdot P(\bar{K})}{P(T^-)}

P(T)=P(TK)P(K)+P(TKˉ)P(Kˉ)P(T^-) = P(T^- \mid K) \cdot P(K) + P(T^- \mid \bar{K}) \cdot P(\bar{K})

P(T)=0,050,02+0,900,98=0,001+0,882=0,883P(T^-) = 0{,}05 \cdot 0{,}02 + 0{,}90 \cdot 0{,}98 = 0{,}001 + 0{,}882 = 0{,}883

P(KˉT)=0,900,980,883=0,8820,883P(\bar{K} \mid T^-) = \frac{0{,}90 \cdot 0{,}98}{0{,}883} = \frac{0{,}882}{0{,}883}

P(KˉT)=882088300,998999,9%\boxed{P(\bar{K} \mid T^-) = \frac{8\,820}{8\,830} \approx 0{,}9989 \approx 99{,}9\,\%}

Ein negatives Testergebnis schließt die Krankheit mit sehr hoher Sicherheit aus.

Schritt 4: Interpretation — warum ist der positive Vorhersagewert so niedrig? (d)

Die niedrige Prävalenz (2%2\,\%) ist der entscheidende Faktor:

  • Von 1000010\,000 Personen sind nur 200200 krank, aber 98009\,800 gesund.
  • Selbst bei 90%90\,\% Spezifität werden 980980 gesunde Personen falsch positiv getestet.
  • Die 980980 falsch Positiven überwiegen die 190190 richtig Positiven bei Weitem.

Falsch positivRichtig positiv=9801905,2\frac{\text{Falsch positiv}}{\text{Richtig positiv}} = \frac{980}{190} \approx 5{,}2

Auf jede tatsächlich kranke Person mit positivem Test kommen also etwa 55 gesunde Personen mit falsch positivem Test. Dies ist das Paradoxon der Baserate: Bei seltenen Krankheiten dominiert die große Grundgesamtheit der Gesunden.

Schritt 5: Höhere Prävalenz — Prävalenz 10 % (e)

Neue Vierfeldertafel für 1000010\,000 Personen mit P(K)=0,10P(K) = 0{,}10:

  • Kranke: 100000,10=100010\,000 \cdot 0{,}10 = 1\,000
  • Gesunde: 90009\,000
  • Richtig positiv: 10000,95=9501\,000 \cdot 0{,}95 = 950
  • Falsch positiv: 90000,10=9009\,000 \cdot 0{,}10 = 900
KK (krank)Kˉ\bar{K} (gesund)Summe
T+T^+ (positiv)95095090090018501\,850
TT^- (negativ)505081008\,10081508\,150
Summe10001\,00090009\,0001000010\,000

P(KT+)=95018500,51451,4%P(K \mid T^+) = \frac{950}{1\,850} \approx 0{,}514 \approx 51{,}4\,\%

P(KT+)51,4% (bei Pra¨valenz 10%)\boxed{P(K \mid T^+) \approx 51{,}4\,\% \text{ (bei Prävalenz } 10\,\%)}

Bei fünffacher Prävalenz steigt der positive Vorhersagewert von 16,2%16{,}2\,\% auf 51,4%51{,}4\,\% — die Prävalenz hat also einen enormen Einfluss auf die diagnostische Aussagekraft.

Ergebnis

FrageAntwort
VierfeldertafelSiehe Schritt 1
P(krankpositiv)P(\text{krank} \mid \text{positiv}) bei 2%2\,\%190117016,2%\frac{190}{1\,170} \approx 16{,}2\,\%
P(gesundnegativ)P(\text{gesund} \mid \text{negativ})8820883099,9%\frac{8\,820}{8\,830} \approx 99{,}9\,\%
Niedriger PPV trotz guter SensitivitätBaserate-Effekt: wenige Kranke, viele falsch Positive
P(krankpositiv)P(\text{krank} \mid \text{positiv}) bei 10%10\,\%950185051,4%\frac{950}{1\,850} \approx 51{,}4\,\%

Schlagwörter

vierfeldertafelbayesbedingte-wahrscheinlichkeit