Die Normalverteilung — Die Kurve der Natur
Lernziele
- die Normalverteilung beschreiben und Parameter deuten
- die 68-95-99,7-Regel anwenden
- Wahrscheinlichkeiten mit der Φ-Funktion berechnen
- die Binomialverteilung durch die Normalverteilung approximieren
Vorwissen empfohlen
Einführung
Köpergrößen, IQ-Testergebnisse, Messfehler in der Physik, Blutdruckwerte — sie alle folgen demselben mathematischen Muster: einer Glockenkurve. Diese Kurve heißt Normalverteilung und ist die wichtigste stetige Verteilung der Statistik.
Der Grund ist tiefgründig: Immer wenn ein Merkmal durch viele kleine, unabhängige Zufallseinflüsse entsteht, entsteht zwangsläufig eine Normalverteilung. Das erklärt, warum die Natur so oft Glockenkurven produziert.
Grundidee
Stell dir vor, du misst die Körpergröße von 1000 Menschen. Die meisten sind ungefähr gleich groß — sehr kleine und sehr große Menschen gibt es kaum. Wenn du ein Histogramm zeichnest, entsteht eine symmetrische Glockenform: viele Werte in der Mitte, wenige an den Rändern.
Diese Glockenform lässt sich mathematisch durch zwei Parameter vollständig beschreiben: die Mitte (Erwartungswert) und die Breite (Standardabweichung).
Erklärung
Parameter der Normalverteilung
Eine Normalverteilung ist durch zwei Parameter vollständig bestimmt:
- Erwartungswert (mü): der Mittelpunkt der Glocke, der Wert, um den die Daten streuen
- Standardabweichung (sigma): die „Breite” der Glocke, ein Maß für die Streuung
Schreibweise: — „X ist normalverteilt mit Erwartungswert und Varianz ”.
Die Dichtefunktion (die mathematische Formel für die Glockenkurve) lautet:
Diese Formel musst du im Abitur nicht auswendig können — aber du solltest verstehen, was und bedeuten.
Erhöht man , verschiebt sich die Glocke nach rechts. Erhöht man , wird die Glocke breiter und flacher (die Fläche bleibt immer 1). Verringert man , wird sie schmaler und höher.
Die 68-95-99,7-Regel
Die wichtigste Eigenschaft der Normalverteilung:
Auf Deutsch: Ca. 68 % aller Werte liegen innerhalb einer Standardabweichung vom Mittelwert, ca. 95 % innerhalb von zwei, ca. 99,7 % innerhalb von drei.
Beispiel Körpergröße (, für 18-jährige Männer):
- 68 % sind zwischen und
- 95 % sind zwischen und
- Nur 0,3 % liegen außerhalb von bis
Die 68-95-99,7-Regel ist der schnellste Weg, Wahrscheinlichkeiten der Normalverteilung abzuschätzen. Sie funktioniert für alle Normalverteilungen — unabhängig von µ und σ.
Die Standardnormalverteilung und die Φ-Funktion
Die Standardnormalverteilung hat Erwartungswert 0 und Standardabweichung 1. Sie ist die Referenzverteilung für alle Berechnungen.
Jede Normalverteilung lässt sich durch Standardisierung auf zurückführen:
Die standardisierte Zufallsgröße ist dann -verteilt.
Die Verteilungsfunktion gibt die Wahrscheinlichkeit an, dass ist:
Für gilt die Symmetrieregel:
Wahrscheinlichkeiten für Intervalle:
Wahrscheinlichkeiten berechnen — Schritt für Schritt
Approximation der Binomialverteilung
Eine Binomialverteilung lässt sich durch eine Normalverteilung approximieren, wenn:
Dann gilt näherungsweise: mit
Diese Approximation ist praktisch, weil die Normalverteilung einfacher zu handhaben ist als die Binomialverteilung bei großem .
Beispiel aus dem Alltag
IQ-Tests: IQ-Tests sind so konstruiert, dass die Ergebnisse normalverteilt sind mit und .
- 68 % der Menschen haben einen IQ zwischen 85 und 115
- 95 % liegen zwischen 70 und 130
- Nur 2,5 % haben einen IQ über 130 (zwei Standardabweichungen über dem Mittelwert)
Die Frage „Ab welchem IQ gehört man zu den oberen 2 %?” beantwortet man durch Umkehrung:
Gesucht: mit , also .
Ab einem IQ von ca. 131 gehört man zu den oberen 2 %.
Anwendung
Aufgabe: Abfüllanlagen für Mineralwasser sind auf eingestellt, mit . Welcher Anteil der Flaschen enthält weniger als 495 ml?
Standardisierung:
Etwa 4,75 % der Flaschen werden zu wenig befüllt.
Typische Fehler
„Ich vergesse zu standardisieren.” Man kann die -Tabelle nur für die Standardnormalverteilung direkt ablesen. Immer zuerst standardisieren: .
„Φ(−z) = −Φ(z)” — Das ist falsch! Die Symmetrieregel lautet: . Wahrscheinlichkeiten sind immer positiv und liegen zwischen 0 und 1.
„Die Normalverteilung ist für alle x definiert, also können auch negative Körpergrößen auftreten.” Theoretisch ja, praktisch nein. Die Wahrscheinlichkeit für sehr unrealistische Werte (mehr als 4σ vom Mittel) ist so gering (), dass sie ignoriert werden kann.
Zusammenfassung
Merke dir:
- Normalverteilung : symmetrische Glocke um den Erwartungswert , Breite durch
- 68-95-99,7-Regel: diese Anteile liegen innerhalb von 1, 2, 3 Standardabweichungen
- Standardisierung: transformiert auf
- : Wahrscheinlichkeit ; für Intervall:
- Symmetrieregel:
- Approximation der Binomialverteilung: wenn und
Quiz
Frage 1: Die Gewichte von Äpfeln einer Sorte sind -verteilt (in Gramm). Was sind und ?
Frage 2: Was ergibt , wenn ?
Frage 3: Warum approximiert man manchmal eine Binomialverteilung durch eine Normalverteilung?
Frage 4: Körpergrößen von Frauen: , . Wie groß ist ?