Hypothesentests

Einführung

Eine Firma behauptet, ihre Produkte hätten höchstens $3\,\%$ Ausschuss. Ein Prüfer findet in einer Stichprobe auffällig viele defekte Teile. Reicht das, um die Behauptung zu widerlegen — oder war es nur Zufall? Hypothesentests geben eine systematische Antwort auf diese Frage. Sie gehören zu den anspruchsvollsten, aber auch häufigsten Abi-Aufgaben in der Stochastik.

Grundidee

Stell dir einen Gerichtsprozess vor — Schritt für Schritt:

Der Angeklagte sitzt auf der Anklagebank. Im deutschen Recht gilt: Er ist unschuldig, bis das Gegenteil bewiesen ist. Das ist die Nullhypothese $H_0$ .

Der Staatsanwalt will zeigen, dass der Angeklagte schuldig ist. Das ist die Alternativhypothese $H_1$ .

Der Richter schaut sich die Beweise an. Nur wenn sie eindeutig genug sind (= das Signifikanzniveau $\alpha$ ), wird verurteilt — also $H_0$ abgelehnt.

Wenn die Beweise nicht reichen? Dann wird der Angeklagte freigesprochen — aber das bedeutet NICHT, dass er unschuldig ist. Es bedeutet nur: Die Beweise reichten nicht aus.

Genau so funktioniert ein Hypothesentest:

Gericht                          Hypothesentest
─────────────────────────────    ──────────────────────────────
Angeklagter ist unschuldig   →   H₀: p ≤ p₀ (Annahme stimmt)
Staatsanwalt will Schuld     →   H₁: p > p₀ (Annahme falsch)
  beweisen
Beweise eindeutig genug?     →   Testergebnis im Ablehnungs-
                                   bereich?
Beweisstandard               →   Signifikanzniveau α
Verurteilung                 →   H₀ ablehnen
Freispruch                   →   H₀ beibehalten

Die Logik in einem Satz

Ein Hypothesentest prüft: Sind die Daten so ungewöhnlich, dass die Ausgangsannahme ( $H_0$ ) nicht mehr haltbar ist?

Erklärung

Das 5-Schritte-Schema

Ein Signifikanztest folgt immer dem gleichen Schema. Dieses Schema löst jede Abi-Aufgabe:

5-Schritte-Schema für jeden Hypothesentest

Hypothesen aufstellen

$H_0$ = Die konservative Annahme (der „Status quo”, die „Unschuld”) $H_1$ = Was du zeigen willst (die „Schuld”)

Testrichtung	$H_0$	$H_1$	Wann?
Rechtsseitig	$p \leq p_0$	$p > p_0$	Verdacht: $p$ ist größer geworden
Linksseitig	$p \geq p_0$	$p < p_0$	Verdacht: $p$ ist kleiner geworden

Signifikanzniveau $\alpha$ festlegen

$\alpha$ = maximale Wahrscheinlichkeit, $H_0$ fälschlicherweise abzulehnen.

$\alpha = 0{,}05$ ( $5\,\%$ ) — Standard
$\alpha = 0{,}01$ ( $1\,\%$ ) — strenger (weniger Fehlalarme, aber mehr übersehene Effekte)

In Worten: „Ich akzeptiere ein Risiko von 5 %, einen Unschuldigen zu verurteilen.”

Testgröße und Verteilung festlegen

Unter $H_0$ gilt $X \sim B(n; p_0)$ mit:

$n$ = Stichprobenumfang
$p_0$ = der in $H_0$ angenommene Wert

Ablehnungsbereich bestimmen

Rechtsseitiger Test: Ablehnungsbereich $\{k, k+1, \ldots, n\}$ , wobei $k$ der kritische Wert ist:

$k = \text{kleinstes } k \text{ mit } P(X \geq k) \leq \alpha$

Näherung über die Sigma-Regel:

$k \approx n \cdot p_0 + z_\alpha \cdot \sqrt{n \cdot p_0 \cdot (1-p_0)}$

mit $z_{0{,}05} = 1{,}645$ und $z_{0{,}01} = 2{,}326$ .

Linksseitiger Test: Ablehnungsbereich $\{0, 1, \ldots, k\}$ :

$k \approx n \cdot p_0 - z_\alpha \cdot \sqrt{n \cdot p_0 \cdot (1-p_0)}$

Entscheidung treffen

Liegt die Testgröße (beobachteter Wert) im Ablehnungsbereich → $H_0$ ablehnen
Liegt sie außerhalb → $H_0$ beibehalten (nicht „bewiesen”!)

Visualisierung des Ablehnungsbereichs (rechtsseitiger Test):

              H₀ beibehalten                │ H₀ ablehnen
  ◄━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━►
  0     10     20     30     40     50  [k]  60     70     80     90    100
                                         ↑
                                   kritischer Wert
                              ◄──────────────────►
                              Hier liegen nur ≤ α %
                              aller Ergebnisse unter H₀

In Worten: Alles rechts vom kritischen Wert ist so unwahrscheinlich unter $H_0$ , dass wir sagen: „Das kann kein Zufall mehr sein.”

Fehler 1. und 2. Art

Zwei Arten von Fehlern — und warum beide wichtig sind

Fehler	Beschreibung	Analog zum Gericht	Wahrscheinlichkeit
Fehler 1. Art ( $\alpha$ -Fehler)	$H_0$ wird abgelehnt, obwohl sie stimmt	Unschuldiger wird verurteilt	$\leq \alpha$ (kontrolliert)
Fehler 2. Art ( $\beta$ -Fehler)	$H_0$ wird beibehalten, obwohl sie falsch ist	Schuldiger wird freigesprochen	abhängig vom wahren $p$

Die vollständige Entscheidungstabelle:

                        Wahrheit
                  ┌─────────────┬──────────────┐
                  │ H₀ stimmt   │ H₀ ist falsch│
  ┌───────────────┼─────────────┼──────────────┤
  │ H₀ ablehnen  │ Fehler 1.Art│ RICHTIG  ✓   │
  │               │  (α-Fehler) │              │
  ├───────────────┼─────────────┼──────────────┤
  │ H₀ beibehal- │ RICHTIG  ✓  │ Fehler 2.Art │
  │ ten           │             │  (β-Fehler)  │
  └───────────────┴─────────────┴──────────────┘

Der Fehler 1. Art wird durch $\alpha$ kontrolliert. Der Fehler 2. Art hängt vom tatsächlichen (unbekannten) $p$ ab und ist schwerer zu kontrollieren.

Beispiel aus dem Alltag

Beispiel 1: Faire Münze?

Jemand behauptet, eine Münze sei fair ( $p = 0{,}5$ ). Du wirfst sie $100$ -mal und erhältst $61$ -mal Kopf. Ist die Münze gezinkt?

Hypothesen (rechtsseitig):

$H_0$ : $p \leq 0{,}5$ (Münze ist fair oder begünstigt Zahl)
$H_1$ : $p > 0{,}5$ (Münze begünstigt Kopf)

Unter $H_0$ : $X \sim B(100; \; 0{,}5)$ , also $\mu = 50$ , $\sigma = \sqrt{25} = 5$ .

Kritischer Wert bei $\alpha = 0{,}05$ :

$k = 50 + 1{,}645 \cdot 5 = 58{,}225 \Rightarrow k = 59$

     H₀ beibehalten          │ H₀ ablehnen
  ◄━━━━━━━━━━━━━━━━━━━━━━━━━━━►
  0    10    20    30    40  50    59    70    80    90   100
                             μ     ↑            ↑
                          kritisch         beobachtet: 61
                           (k=59)          → im Ablehnungsbereich!

Entscheidung: $61 \geq 59$ → $61$ liegt im Ablehnungsbereich → $H_0$ wird abgelehnt.

Bei $\alpha = 5\,\%$ spricht das Ergebnis signifikant dafür, dass die Münze Kopf begünstigt.

Beispiel 2: Wirkt das Medikament?

Ein neues Medikament soll die Heilungsrate von bisher $60\,\%$ steigern. In einer Studie mit $n = 80$ Patienten werden $56$ geheilt.

$H_0$ : $p \leq 0{,}60$ , $H_1$ : $p > 0{,}60$
$\mu = 48$ , $\sigma = \sqrt{80 \cdot 0{,}6 \cdot 0{,}4} = \sqrt{19{,}2} \approx 4{,}38$
$k = 48 + 1{,}645 \cdot 4{,}38 \approx 55{,}2 \Rightarrow k = 56$
$56 \geq 56$ → knapp im Ablehnungsbereich → $H_0$ ablehnen.

Anwendung

Aufgabe 1: Rechtsseitiger Test — Ausschussrate

Ein Hersteller behauptet, seine Ausschussrate betrage höchstens $5\,\%$ . Ein Prüfer untersucht $n = 200$ Teile und findet 18 defekte. Teste bei $\alpha = 0{,}05$ .

$H_0$ : $p \leq 0{,}05$ , $H_1$ : $p > 0{,}05$ .

$\mu = 200 \cdot 0{,}05 = 10, \quad \sigma = \sqrt{200 \cdot 0{,}05 \cdot 0{,}95} = \sqrt{9{,}5} \approx 3{,}08$

$k = 10 + 1{,}645 \cdot 3{,}08 \approx 15{,}07 \Rightarrow k = 16$

$18 \geq 16$ → $H_0$ wird abgelehnt. Die Ausschussrate ist signifikant höher als $5\,\%$ .

Aufgabe 2: Linksseitiger Test — Kaufrate

Ein Online-Shop hat bisher eine Kaufrate von $12\,\%$ . Nach einer Umgestaltung vermutet man einen Rückgang. Bei $n = 150$ Besuchern kaufen nur 12.

$H_0$ : $p \geq 0{,}12$ , $H_1$ : $p < 0{,}12$ .

$\mu = 150 \cdot 0{,}12 = 18, \quad \sigma = \sqrt{150 \cdot 0{,}12 \cdot 0{,}88} \approx 3{,}98$

$k = 18 - 1{,}645 \cdot 3{,}98 \approx 11{,}45 \Rightarrow k = 11$

$12 > 11$ → $12$ liegt nicht im Ablehnungsbereich → $H_0$ wird beibehalten.

Es gibt keinen signifikanten Hinweis auf einen Rückgang der Kaufrate.

Aufgabe 3: Kritischen Wert exakt bestimmen

$X \sim B(20; \; 0{,}5)$ , rechtsseitiger Test, $\alpha = 0{,}05$ .

Gesucht: kleinstes $k$ mit $P(X \geq k) \leq 0{,}05$ .

$k$	$P(X \geq k)$	$\leq 0{,}05$ ?
$13$	$0{,}1316$	Nein
$14$	$0{,}0577$	Nein
$15$	$0{,}0207$	Ja ← kritischer Wert

$P(X \geq 15) = 0{,}0207 \leq 0{,}05$ , aber $P(X \geq 14) = 0{,}0577 > 0{,}05$ .

$\boxed{k = 15}$

Der Ablehnungsbereich ist $\{15, 16, 17, 18, 19, 20\}$ .

Aufgabe 4: Fehlerarten interpretieren

Im Münztest (Beispiel 1): Was bedeuten Fehler 1. und 2. Art konkret?

Fehler 1. Art: Wir behaupten, die Münze sei gezinkt, obwohl sie tatsächlich fair ist. Wahrscheinlichkeit: $\leq 5\,\%$ .
Fehler 2. Art: Wir behalten bei, dass die Münze fair ist, obwohl sie in Wahrheit gezinkt ist. Die Wahrscheinlichkeit hängt davon ab, wie stark die Münze tatsächlich gezinkt ist.

Typische Fehler

Häufiger Irrtum

Irrtum: „Wenn $H_0$ beibehalten wird, ist $H_0$ bewiesen.”

Richtig ist: Man kann $H_0$ nie beweisen, nur beibehalten. „Nicht abgelehnt” bedeutet nur: Die Daten reichen nicht aus, um $H_0$ zu widerlegen. Vielleicht war die Stichprobe einfach zu klein, um den Effekt zu sehen. Vergleich: Ein Freispruch im Gericht bedeutet nicht „unschuldig” — nur „nicht genug Beweise”.

Häufiger Irrtum

Irrtum: „Ich kann $H_0$ und $H_1$ frei wählen und einfach vertauschen.”

Richtig ist: $H_0$ ist immer die konservative Annahme (der Status quo). $H_1$ ist das, was man zeigen will. Vertauscht man die beiden, schützt der Test das Falsche. Faustregel: Was du zeigen willst, gehört in $H_1$ .

Weitere häufige Fehler:

Testrichtung falsch wählen: „Ausschuss gestiegen?” → rechtsseitig. „Anteil gesunken?” → linksseitig. Die Richtung bestimmt, wo der Ablehnungsbereich liegt.
$\alpha$ mit dem p-Wert verwechseln: $\alpha$ wird vor dem Test festgelegt. Der p-Wert ist die tatsächliche Wahrscheinlichkeit des beobachteten Ergebnisses unter $H_0$ .
Sigma-Regel bei kleinem $n$ nützen: Die Näherung funktioniert nur für $n \cdot p_0 \cdot (1-p_0) > 9$ . Bei kleinem $n$ muss man die kumulierte Binomialverteilung direkt verwenden.

Zusammenfassung

Ein Hypothesentest prüft, ob Daten mit einer Annahme ( $H_0$ ) vereinbar sind.
$H_0$ = konservative Annahme, $H_1$ = das, was man zeigen will.
Das Signifikanzniveau $\alpha$ begrenzt das Risiko einer falschen Ablehnung von $H_0$ .
Der Ablehnungsbereich wird über den kritischen Wert $k$ bestimmt.
Fehler 1. Art ( $\alpha$ ): $H_0$ falsch abgelehnt. Fehler 2. Art ( $\beta$ ): $H_0$ falsch beibehalten.
Das 5-Schritte-Schema (Hypothesen → $\alpha$ → Verteilung → Ablehnungsbereich → Entscheidung) löst jede Abi-Aufgabe.

Quiz

Frage 1: Ein Bäcker behauptet, $90\,\%$ seiner Brötchen wiegen mindestens 50 g. Du vermutest, der Anteil sei niedriger. Wie lauten $H_0$ und $H_1$ ?

Frage 2: Was passiert, wenn man $\alpha$ von $5\,\%$ auf $1\,\%$ senkt?

Frage 3: $n = 100$ , $p_0 = 0{,}4$ , rechtsseitiger Test, $\alpha = 0{,}05$ . Bestimme den kritischen Wert.

Frage 4: In einer Studie wird $H_0$ beibehalten. Ist $H_0$ damit bewiesen?