Mittelstufe ~15 Min. Mathematik & Logik

Die Normalverteilung — Die Kurve der Natur

Lernziele

  • die Normalverteilung beschreiben und Parameter deuten
  • die 68-95-99,7-Regel anwenden
  • Wahrscheinlichkeiten mit der Φ-Funktion berechnen
  • die Binomialverteilung durch die Normalverteilung approximieren

Vorwissen empfohlen

Einführung

Köpergrößen, IQ-Testergebnisse, Messfehler in der Physik, Blutdruckwerte — sie alle folgen demselben mathematischen Muster: einer Glockenkurve. Diese Kurve heißt Normalverteilung und ist die wichtigste stetige Verteilung der Statistik.

Der Grund ist tiefgründig: Immer wenn ein Merkmal durch viele kleine, unabhängige Zufallseinflüsse entsteht, entsteht zwangsläufig eine Normalverteilung. Das erklärt, warum die Natur so oft Glockenkurven produziert.

Grundidee

Stell dir vor, du misst die Körpergröße von 1000 Menschen. Die meisten sind ungefähr gleich groß — sehr kleine und sehr große Menschen gibt es kaum. Wenn du ein Histogramm zeichnest, entsteht eine symmetrische Glockenform: viele Werte in der Mitte, wenige an den Rändern.

Diese Glockenform lässt sich mathematisch durch zwei Parameter vollständig beschreiben: die Mitte (Erwartungswert) und die Breite (Standardabweichung).

Erklärung

Parameter der Normalverteilung

Eine Normalverteilung ist durch zwei Parameter vollständig bestimmt:

  • Erwartungswert μ\mu (mü): der Mittelpunkt der Glocke, der Wert, um den die Daten streuen
  • Standardabweichung σ\sigma (sigma): die „Breite” der Glocke, ein Maß für die Streuung

Schreibweise: XN(μ; σ2)X \sim N(\mu;\ \sigma^2) — „X ist normalverteilt mit Erwartungswert μ\mu und Varianz σ2\sigma^2”.

Die Dichtefunktion (die mathematische Formel für die Glockenkurve) lautet:

f(x)=1σ2πe12(xμσ)2f(x) = \frac{1}{\sigma\sqrt{2\pi}} \cdot e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}

Diese Formel musst du im Abitur nicht auswendig können — aber du solltest verstehen, was μ\mu und σ\sigma bedeuten.

Was verändert µ und σ?

Erhöht man μ\mu, verschiebt sich die Glocke nach rechts. Erhöht man σ\sigma, wird die Glocke breiter und flacher (die Fläche bleibt immer 1). Verringert man σ\sigma, wird sie schmaler und höher.

Die 68-95-99,7-Regel

Die wichtigste Eigenschaft der Normalverteilung:

P(μσXμ+σ)68%P(\mu - \sigma \leq X \leq \mu + \sigma) \approx 68\,\% P(μ2σXμ+2σ)95%P(\mu - 2\sigma \leq X \leq \mu + 2\sigma) \approx 95\,\% P(μ3σXμ+3σ)99,7%P(\mu - 3\sigma \leq X \leq \mu + 3\sigma) \approx 99{,}7\,\%

Auf Deutsch: Ca. 68 % aller Werte liegen innerhalb einer Standardabweichung vom Mittelwert, ca. 95 % innerhalb von zwei, ca. 99,7 % innerhalb von drei.

Beispiel Körpergröße (μ=178cm\mu = 178\,\mathrm{cm}, σ=7cm\sigma = 7\,\mathrm{cm} für 18-jährige Männer):

  • 68 % sind zwischen 1787=171cm178 - 7 = 171\,\mathrm{cm} und 178+7=185cm178 + 7 = 185\,\mathrm{cm}
  • 95 % sind zwischen 164cm164\,\mathrm{cm} und 192cm192\,\mathrm{cm}
  • Nur 0,3 % liegen außerhalb von 157cm157\,\mathrm{cm} bis 199cm199\,\mathrm{cm}
Merke dir

Die 68-95-99,7-Regel ist der schnellste Weg, Wahrscheinlichkeiten der Normalverteilung abzuschätzen. Sie funktioniert für alle Normalverteilungen — unabhängig von µ und σ.

Die Standardnormalverteilung und die Φ-Funktion

Die Standardnormalverteilung N(0;1)N(0;1) hat Erwartungswert 0 und Standardabweichung 1. Sie ist die Referenzverteilung für alle Berechnungen.

Jede Normalverteilung lässt sich durch Standardisierung auf N(0;1)N(0;1) zurückführen:

z=xμσz = \frac{x - \mu}{\sigma}

Die standardisierte Zufallsgröße Z=XμσZ = \frac{X-\mu}{\sigma} ist dann N(0;1)N(0;1)-verteilt.

Die Verteilungsfunktion Φ(z)\Phi(z) gibt die Wahrscheinlichkeit an, dass ZzZ \leq z ist:

Φ(z)=P(Zz)\Phi(z) = P(Z \leq z)

Für z<0z < 0 gilt die Symmetrieregel: Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z)

Wahrscheinlichkeiten für Intervalle:

P(aXb)=Φ ⁣(bμσ)Φ ⁣(aμσ)P(a \leq X \leq b) = \Phi\!\left(\frac{b-\mu}{\sigma}\right) - \Phi\!\left(\frac{a-\mu}{\sigma}\right)

Wahrscheinlichkeiten berechnen — Schritt für Schritt

Approximation der Binomialverteilung

Eine Binomialverteilung B(n;p)B(n;p) lässt sich durch eine Normalverteilung approximieren, wenn: np5undn(1p)5n \cdot p \geq 5 \qquad \text{und} \qquad n \cdot (1-p) \geq 5

Dann gilt näherungsweise: B(n;p)N(μ; σ2)B(n;p) \approx N(\mu;\ \sigma^2) mit

μ=npσ2=np(1p)\mu = n \cdot p \qquad \sigma^2 = n \cdot p \cdot (1-p)

Diese Approximation ist praktisch, weil die Normalverteilung einfacher zu handhaben ist als die Binomialverteilung bei großem nn.

Beispiel aus dem Alltag

IQ-Tests: IQ-Tests sind so konstruiert, dass die Ergebnisse normalverteilt sind mit μ=100\mu = 100 und σ=15\sigma = 15.

  • 68 % der Menschen haben einen IQ zwischen 85 und 115
  • 95 % liegen zwischen 70 und 130
  • Nur 2,5 % haben einen IQ über 130 (zwei Standardabweichungen über dem Mittelwert)

Die Frage „Ab welchem IQ gehört man zu den oberen 2 %?” beantwortet man durch Umkehrung:

Gesucht: xx mit P(X>x)=0,02P(X > x) = 0{,}02, also P(Xx)=0,98P(X \leq x) = 0{,}98.

Φ(z)=0,98z2,05\Phi(z) = 0{,}98 \Rightarrow z \approx 2{,}05

x=μ+zσ=100+2,0515=130,75x = \mu + z \cdot \sigma = 100 + 2{,}05 \cdot 15 = 130{,}75

Ab einem IQ von ca. 131 gehört man zu den oberen 2 %.

Anwendung

Aufgabe: Abfüllanlagen für Mineralwasser sind auf μ=500ml\mu = 500\,\mathrm{ml} eingestellt, mit σ=3ml\sigma = 3\,\mathrm{ml}. Welcher Anteil der Flaschen enthält weniger als 495 ml?

Standardisierung: z=4955003=531,67z = \frac{495 - 500}{3} = \frac{-5}{3} \approx -1{,}67

P(X<495)=Φ(1,67)=1Φ(1,67)=10,9525=0,0475P(X < 495) = \Phi(-1{,}67) = 1 - \Phi(1{,}67) = 1 - 0{,}9525 = 0{,}0475

Etwa 4,75 % der Flaschen werden zu wenig befüllt.

Typische Fehler

„Ich vergesse zu standardisieren.” Man kann die Φ\Phi-Tabelle nur für die Standardnormalverteilung N(0;1)N(0;1) direkt ablesen. Immer zuerst standardisieren: z=xμσz = \frac{x - \mu}{\sigma}.

Häufiger Irrtum

„Φ(−z) = −Φ(z)” — Das ist falsch! Die Symmetrieregel lautet: Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z). Wahrscheinlichkeiten sind immer positiv und liegen zwischen 0 und 1.

„Die Normalverteilung ist für alle x definiert, also können auch negative Körpergrößen auftreten.” Theoretisch ja, praktisch nein. Die Wahrscheinlichkeit für sehr unrealistische Werte (mehr als 4σ vom Mittel) ist so gering (<0,01%<0{,}01\,\%), dass sie ignoriert werden kann.

Zusammenfassung

Merke dir:

  • Normalverteilung N(μ; σ2)N(\mu;\ \sigma^2): symmetrische Glocke um den Erwartungswert μ\mu, Breite durch σ\sigma
  • 68-95-99,7-Regel: diese Anteile liegen innerhalb von 1, 2, 3 Standardabweichungen
  • Standardisierung: z=xμσz = \frac{x-\mu}{\sigma} transformiert auf N(0;1)N(0;1)
  • Φ(z)\Phi(z): Wahrscheinlichkeit P(Zz)P(Z \leq z); für Intervall: Φ(z2)Φ(z1)\Phi(z_2) - \Phi(z_1)
  • Symmetrieregel: Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z)
  • Approximation der Binomialverteilung: wenn np5np \geq 5 und n(1p)5n(1-p) \geq 5

Quiz

Frage 1: Die Gewichte von Äpfeln einer Sorte sind N(180;400)N(180; 400)-verteilt (in Gramm). Was sind μ\mu und σ\sigma?

Frage 2: Was ergibt Φ(1,5)\Phi(-1{,}5), wenn Φ(1,5)=0,9332\Phi(1{,}5) = 0{,}9332?

Frage 3: Warum approximiert man manchmal eine Binomialverteilung durch eine Normalverteilung?

Frage 4: Körpergrößen von Frauen: μ=165cm\mu = 165\,\mathrm{cm}, σ=6cm\sigma = 6\,\mathrm{cm}. Wie groß ist P(X>177)P(X > 177)?

Schlüsselwörter

normalverteilungerwartungswertstandardabweichungstandardnormalverteilungphi-funktionapproximation