Hypothesentests
Lernziele
- Null- und Alternativhypothese formulieren
- einseitige Signifikanztests durchführen
- Ablehnungsbereich und kritischen Wert bestimmen
- Fehler 1. und 2. Art erklären und interpretieren
Vorwissen empfohlen
Einführung
Eine Firma behauptet, ihre Produkte hätten höchstens Ausschuss. Ein Prüfer findet in einer Stichprobe auffällig viele defekte Teile. Reicht das, um die Behauptung zu widerlegen — oder war es nur Zufall? Hypothesentests geben eine systematische Antwort auf diese Frage. Sie gehören zu den anspruchsvollsten, aber auch häufigsten Abi-Aufgaben in der Stochastik.
Grundidee
Stell dir einen Gerichtsprozess vor — Schritt für Schritt:
Der Angeklagte sitzt auf der Anklagebank. Im deutschen Recht gilt: Er ist unschuldig, bis das Gegenteil bewiesen ist. Das ist die Nullhypothese .
Der Staatsanwalt will zeigen, dass der Angeklagte schuldig ist. Das ist die Alternativhypothese .
Der Richter schaut sich die Beweise an. Nur wenn sie eindeutig genug sind (= das Signifikanzniveau ), wird verurteilt — also abgelehnt.
Wenn die Beweise nicht reichen? Dann wird der Angeklagte freigesprochen — aber das bedeutet NICHT, dass er unschuldig ist. Es bedeutet nur: Die Beweise reichten nicht aus.
Genau so funktioniert ein Hypothesentest:
Gericht Hypothesentest
───────────────────────────── ──────────────────────────────
Angeklagter ist unschuldig → H₀: p ≤ p₀ (Annahme stimmt)
Staatsanwalt will Schuld → H₁: p > p₀ (Annahme falsch)
beweisen
Beweise eindeutig genug? → Testergebnis im Ablehnungs-
bereich?
Beweisstandard → Signifikanzniveau α
Verurteilung → H₀ ablehnen
Freispruch → H₀ beibehalten
Ein Hypothesentest prüft: Sind die Daten so ungewöhnlich, dass die Ausgangsannahme () nicht mehr haltbar ist?
Erklärung
Das 5-Schritte-Schema
Ein Signifikanztest folgt immer dem gleichen Schema. Dieses Schema löst jede Abi-Aufgabe:
5-Schritte-Schema für jeden Hypothesentest
Hypothesen aufstellen
= Die konservative Annahme (der „Status quo”, die „Unschuld”) = Was du zeigen willst (die „Schuld”)
| Testrichtung | Wann? | ||
|---|---|---|---|
| Rechtsseitig | Verdacht: ist größer geworden | ||
| Linksseitig | Verdacht: ist kleiner geworden |
Signifikanzniveau festlegen
= maximale Wahrscheinlichkeit, fälschlicherweise abzulehnen.
- () — Standard
- () — strenger (weniger Fehlalarme, aber mehr übersehene Effekte)
In Worten: „Ich akzeptiere ein Risiko von 5 %, einen Unschuldigen zu verurteilen.”
Testgröße und Verteilung festlegen
Unter gilt mit:
- = Stichprobenumfang
- = der in angenommene Wert
Ablehnungsbereich bestimmen
Rechtsseitiger Test: Ablehnungsbereich , wobei der kritische Wert ist:
Näherung über die Sigma-Regel:
mit und .
Linksseitiger Test: Ablehnungsbereich :
Entscheidung treffen
- Liegt die Testgröße (beobachteter Wert) im Ablehnungsbereich → ablehnen
- Liegt sie außerhalb → beibehalten (nicht „bewiesen”!)
Visualisierung des Ablehnungsbereichs (rechtsseitiger Test):
H₀ beibehalten │ H₀ ablehnen
◄━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━►
0 10 20 30 40 50 [k] 60 70 80 90 100
↑
kritischer Wert
◄──────────────────►
Hier liegen nur ≤ α %
aller Ergebnisse unter H₀
In Worten: Alles rechts vom kritischen Wert ist so unwahrscheinlich unter , dass wir sagen: „Das kann kein Zufall mehr sein.”
Fehler 1. und 2. Art
| Fehler | Beschreibung | Analog zum Gericht | Wahrscheinlichkeit |
|---|---|---|---|
| Fehler 1. Art (-Fehler) | wird abgelehnt, obwohl sie stimmt | Unschuldiger wird verurteilt | (kontrolliert) |
| Fehler 2. Art (-Fehler) | wird beibehalten, obwohl sie falsch ist | Schuldiger wird freigesprochen | abhängig vom wahren |
Die vollständige Entscheidungstabelle:
Wahrheit
┌─────────────┬──────────────┐
│ H₀ stimmt │ H₀ ist falsch│
┌───────────────┼─────────────┼──────────────┤
│ H₀ ablehnen │ Fehler 1.Art│ RICHTIG ✓ │
│ │ (α-Fehler) │ │
├───────────────┼─────────────┼──────────────┤
│ H₀ beibehal- │ RICHTIG ✓ │ Fehler 2.Art │
│ ten │ │ (β-Fehler) │
└───────────────┴─────────────┴──────────────┘
Der Fehler 1. Art wird durch kontrolliert. Der Fehler 2. Art hängt vom tatsächlichen (unbekannten) ab und ist schwerer zu kontrollieren.
Beispiel aus dem Alltag
Beispiel 1: Faire Münze?
Jemand behauptet, eine Münze sei fair (). Du wirfst sie -mal und erhältst -mal Kopf. Ist die Münze gezinkt?
Hypothesen (rechtsseitig):
- : (Münze ist fair oder begünstigt Zahl)
- : (Münze begünstigt Kopf)
Unter : , also , .
Kritischer Wert bei :
H₀ beibehalten │ H₀ ablehnen
◄━━━━━━━━━━━━━━━━━━━━━━━━━━━►
0 10 20 30 40 50 59 70 80 90 100
μ ↑ ↑
kritisch beobachtet: 61
(k=59) → im Ablehnungsbereich!
Entscheidung: → liegt im Ablehnungsbereich → wird abgelehnt.
Bei spricht das Ergebnis signifikant dafür, dass die Münze Kopf begünstigt.
Beispiel 2: Wirkt das Medikament?
Ein neues Medikament soll die Heilungsrate von bisher steigern. In einer Studie mit Patienten werden geheilt.
- : , :
- ,
- → knapp im Ablehnungsbereich → ablehnen.
Anwendung
Aufgabe 1: Rechtsseitiger Test — Ausschussrate
Ein Hersteller behauptet, seine Ausschussrate betrage höchstens . Ein Prüfer untersucht Teile und findet 18 defekte. Teste bei .
: , : .
→ wird abgelehnt. Die Ausschussrate ist signifikant höher als .
Aufgabe 2: Linksseitiger Test — Kaufrate
Ein Online-Shop hat bisher eine Kaufrate von . Nach einer Umgestaltung vermutet man einen Rückgang. Bei Besuchern kaufen nur 12.
: , : .
→ liegt nicht im Ablehnungsbereich → wird beibehalten.
Es gibt keinen signifikanten Hinweis auf einen Rückgang der Kaufrate.
Aufgabe 3: Kritischen Wert exakt bestimmen
, rechtsseitiger Test, .
Gesucht: kleinstes mit .
| ? | ||
|---|---|---|
| Nein | ||
| Nein | ||
| Ja ← kritischer Wert |
, aber .
Der Ablehnungsbereich ist .
Aufgabe 4: Fehlerarten interpretieren
Im Münztest (Beispiel 1): Was bedeuten Fehler 1. und 2. Art konkret?
- Fehler 1. Art: Wir behaupten, die Münze sei gezinkt, obwohl sie tatsächlich fair ist. Wahrscheinlichkeit: .
- Fehler 2. Art: Wir behalten bei, dass die Münze fair ist, obwohl sie in Wahrheit gezinkt ist. Die Wahrscheinlichkeit hängt davon ab, wie stark die Münze tatsächlich gezinkt ist.
Typische Fehler
Irrtum: „Wenn beibehalten wird, ist bewiesen.”
Richtig ist: Man kann nie beweisen, nur beibehalten. „Nicht abgelehnt” bedeutet nur: Die Daten reichen nicht aus, um zu widerlegen. Vielleicht war die Stichprobe einfach zu klein, um den Effekt zu sehen. Vergleich: Ein Freispruch im Gericht bedeutet nicht „unschuldig” — nur „nicht genug Beweise”.
Irrtum: „Ich kann und frei wählen und einfach vertauschen.”
Richtig ist: ist immer die konservative Annahme (der Status quo). ist das, was man zeigen will. Vertauscht man die beiden, schützt der Test das Falsche. Faustregel: Was du zeigen willst, gehört in .
Weitere häufige Fehler:
-
Testrichtung falsch wählen: „Ausschuss gestiegen?” → rechtsseitig. „Anteil gesunken?” → linksseitig. Die Richtung bestimmt, wo der Ablehnungsbereich liegt.
-
mit dem p-Wert verwechseln: wird vor dem Test festgelegt. Der p-Wert ist die tatsächliche Wahrscheinlichkeit des beobachteten Ergebnisses unter .
-
Sigma-Regel bei kleinem nützen: Die Näherung funktioniert nur für . Bei kleinem muss man die kumulierte Binomialverteilung direkt verwenden.
Zusammenfassung
- Ein Hypothesentest prüft, ob Daten mit einer Annahme () vereinbar sind.
- = konservative Annahme, = das, was man zeigen will.
- Das Signifikanzniveau begrenzt das Risiko einer falschen Ablehnung von .
- Der Ablehnungsbereich wird über den kritischen Wert bestimmt.
- Fehler 1. Art (): falsch abgelehnt. Fehler 2. Art (): falsch beibehalten.
- Das 5-Schritte-Schema (Hypothesen → → Verteilung → Ablehnungsbereich → Entscheidung) löst jede Abi-Aufgabe.
Quiz
Frage 1: Ein Bäcker behauptet, seiner Brötchen wiegen mindestens 50 g. Du vermutest, der Anteil sei niedriger. Wie lauten und ?
Frage 2: Was passiert, wenn man von auf senkt?
Frage 3: , , rechtsseitiger Test, . Bestimme den kritischen Wert.
Frage 4: In einer Studie wird beibehalten. Ist damit bewiesen?