Medizinischer Test — Vierfeldertafel und Bayes

Aufgabenstellung

Eine Krankheit tritt in der Bevölkerung mit einer Prävalenz von $2\,\%$ auf. Ein diagnostischer Test hat eine Sensitivität von $95\,\%$ und eine Spezifität von $90\,\%$ .

(a) Stellen Sie eine Vierfeldertafel für $10\,000$ Personen auf.
(b) Berechnen Sie den positiven Vorhersagewert $P(\text{krank} \mid \text{positiv})$ mithilfe des Satzes von Bayes.
(c) Berechnen Sie den negativen Vorhersagewert $P(\text{gesund} \mid \text{negativ})$ .
(d) Erklären Sie, warum $P(\text{krank} \mid \text{positiv})$ trotz hoher Sensitivität so niedrig ausfällt.
(e) Wie verändert sich $P(\text{krank} \mid \text{positiv})$ , wenn die Prävalenz $10\,\%$ beträgt?

Lösungsweg

Schritt 1: Vierfeldertafel für 10.000 Personen (a)

Bezeichnungen:

$K$ : „Person ist krank”
$T^+$ : „Test fällt positiv aus”

Gegeben: $P(K) = 0{,}02$ , Sensitivität $P(T^+ \mid K) = 0{,}95$ , Spezifität $P(T^- \mid \bar{K}) = 0{,}90$

Aus $10\,000$ Personen:

Kranke: $10\,000 \cdot 0{,}02 = 200$
Gesunde: $10\,000 - 200 = 9\,800$

Testergebnisse:

Richtig positiv: $200 \cdot 0{,}95 = 190$
Falsch negativ: $200 - 190 = 10$
Falsch positiv: $9\,800 \cdot 0{,}10 = 980$
Richtig negativ: $9\,800 - 980 = 8\,820$

	$K$ (krank)	$\bar{K}$ (gesund)	Summe
$T^+$ (positiv)	$190$	$980$	$1\,170$
$T^-$ (negativ)	$10$	$8\,820$	$8\,830$
Summe	$200$	$9\,800$	$10\,000$

Schritt 2: Positiver Vorhersagewert mit Bayes (b)

$P(K \mid T^+) = \frac{P(T^+ \mid K) \cdot P(K)}{P(T^+)}$

Totale Wahrscheinlichkeit für ein positives Ergebnis:

$P(T^+) = P(T^+ \mid K) \cdot P(K) + P(T^+ \mid \bar{K}) \cdot P(\bar{K})$

$P(T^+) = 0{,}95 \cdot 0{,}02 + 0{,}10 \cdot 0{,}98 = 0{,}019 + 0{,}098 = 0{,}117$

$P(K \mid T^+) = \frac{0{,}95 \cdot 0{,}02}{0{,}117} = \frac{0{,}019}{0{,}117}$

$\boxed{P(K \mid T^+) = \frac{190}{1\,170} \approx 0{,}162 \approx 16{,}2\,\%}$

Nur etwa $16{,}2\,\%$ der positiv getesteten Personen sind tatsächlich krank.

Schritt 3: Negativer Vorhersagewert (c)

$P(\bar{K} \mid T^-) = \frac{P(T^- \mid \bar{K}) \cdot P(\bar{K})}{P(T^-)}$

$P(T^-) = P(T^- \mid K) \cdot P(K) + P(T^- \mid \bar{K}) \cdot P(\bar{K})$

$P(T^-) = 0{,}05 \cdot 0{,}02 + 0{,}90 \cdot 0{,}98 = 0{,}001 + 0{,}882 = 0{,}883$

$P(\bar{K} \mid T^-) = \frac{0{,}90 \cdot 0{,}98}{0{,}883} = \frac{0{,}882}{0{,}883}$

$\boxed{P(\bar{K} \mid T^-) = \frac{8\,820}{8\,830} \approx 0{,}9989 \approx 99{,}9\,\%}$

Ein negatives Testergebnis schließt die Krankheit mit sehr hoher Sicherheit aus.

Schritt 4: Interpretation — warum ist der positive Vorhersagewert so niedrig? (d)

Die niedrige Prävalenz ( $2\,\%$ ) ist der entscheidende Faktor:

Von $10\,000$ Personen sind nur $200$ krank, aber $9\,800$ gesund.
Selbst bei $90\,\%$ Spezifität werden $980$ gesunde Personen falsch positiv getestet.
Die $980$ falsch Positiven überwiegen die $190$ richtig Positiven bei Weitem.

$\frac{\text{Falsch positiv}}{\text{Richtig positiv}} = \frac{980}{190} \approx 5{,}2$

Auf jede tatsächlich kranke Person mit positivem Test kommen also etwa $5$ gesunde Personen mit falsch positivem Test. Dies ist das Paradoxon der Baserate: Bei seltenen Krankheiten dominiert die große Grundgesamtheit der Gesunden.

Schritt 5: Höhere Prävalenz — Prävalenz 10 % (e)

Neue Vierfeldertafel für $10\,000$ Personen mit $P(K) = 0{,}10$ :

Kranke: $10\,000 \cdot 0{,}10 = 1\,000$
Gesunde: $9\,000$
Richtig positiv: $1\,000 \cdot 0{,}95 = 950$
Falsch positiv: $9\,000 \cdot 0{,}10 = 900$

	$K$ (krank)	$\bar{K}$ (gesund)	Summe
$T^+$ (positiv)	$950$	$900$	$1\,850$
$T^-$ (negativ)	$50$	$8\,100$	$8\,150$
Summe	$1\,000$	$9\,000$	$10\,000$

$P(K \mid T^+) = \frac{950}{1\,850} \approx 0{,}514 \approx 51{,}4\,\%$

$\boxed{P(K \mid T^+) \approx 51{,}4\,\% \text{ (bei Prävalenz } 10\,\%)}$

Bei fünffacher Prävalenz steigt der positive Vorhersagewert von $16{,}2\,\%$ auf $51{,}4\,\%$ — die Prävalenz hat also einen enormen Einfluss auf die diagnostische Aussagekraft.

Ergebnis

Frage	Antwort
Vierfeldertafel	Siehe Schritt 1
$P(\text{krank} \mid \text{positiv})$ bei $2\,\%$	$\frac{190}{1\,170} \approx 16{,}2\,\%$
$P(\text{gesund} \mid \text{negativ})$	$\frac{8\,820}{8\,830} \approx 99{,}9\,\%$
Niedriger PPV trotz guter Sensitivität	Baserate-Effekt: wenige Kranke, viele falsch Positive
$P(\text{krank} \mid \text{positiv})$ bei $10\,\%$	$\frac{950}{1\,850} \approx 51{,}4\,\%$

Schlagwörter