Statistiken lesen und hinterfragen

Einführung

„Laut einer Studie verdient der Durchschnittsdeutsche 3.800 Euro im Monat.” Klingt gut — aber fühlst du dich so? Vermutlich nicht. Und das liegt nicht an dir.

Statistiken begegnen dir täglich: in Nachrichten, Wahlumfragen, Werbung, Gesundheitsberichten. Sie wirken objektiv, präzise, wissenschaftlich. Aber hinter jeder Zahl stecken Entscheidungen: Wer wurde befragt? Wie wurde die Frage gestellt? Was wurde weggelassen?

Wer Statistiken blind vertraut, lässt sich leicht manipulieren. Wer sie richtig liest, erkennt Muster — und Tricks. Diese Lektion gibt dir das Handwerkszeug, um Zahlen einzuordnen, statt ihnen einfach zu glauben.

Grundidee

Der entscheidende Satz lautet: Eine Zahl sagt nichts ohne Kontext.

„85 % der Befragten stimmen zu” — wie viele wurden befragt? 10 oder 100.000? Wer wurde ausgewählt? Wie war die Frage formuliert? All das verändert, was die Zahl bedeutet.

Statistische Manipulation muss nicht bewusste Täuschung sein. Oft entstehen irreführende Zahlen durch schlecht designte Studien, vorschnelle Interpretation — oder durch journalistische Vereinfachung. Das Ergebnis ist dasselbe: Du glaubst etwas zu wissen, das du nicht weißt.

Erklärung

Mittelwert, Median, Modus

Drei Maßzahlen für die „Mitte” einer Verteilung — aber sie meinen Verschiedenes:

Mittelwert (arithmetisches Mittel): Alle Werte addieren, durch Anzahl teilen. Empfindlich für Ausreißer.

Median: Der mittlere Wert, wenn alle Werte sortiert sind. Robuster gegenüber Ausreißern.

Modus: Der häufigste Wert.

Beispiel: Lohnstatistik

Zehn Menschen verdienen: 1.500 / 1.800 / 2.000 / 2.200 / 2.400 / 2.500 / 2.600 / 2.800 / 3.000 / 50.000 Euro.

Mittelwert: (Summe = 70.800) ÷ 10 = 7.080 € — wegen des einen Ausreißers massiv verzerrt.
Median: Mitte der sortierten Liste = (2.400 + 2.500) ÷ 2 = 2.450 € — realistischer.

Wenn eine Zeitung über Durchschnittslöhne berichtet, macht es einen enormen Unterschied, welche Maßzahl gemeint ist. Oft wird der Mittelwert genommen — und der ist bei schiefen Verteilungen (viele Niedriglöhne, wenige Spitzenlöhne) nicht repräsentativ für das, was die meisten verdienen.

Stichprobe und Grundgesamtheit

Eine Stichprobe ist die Gruppe, die tatsächlich befragt oder untersucht wurde. Die Grundgesamtheit ist die Gruppe, über die man eine Aussage treffen will.

Probleme entstehen, wenn die Stichprobe nicht repräsentativ ist:

Selbstauswahl: Wer freiwillig an einer Umfrage teilnimmt, ist oft anders als die, die es nicht tun. Zufriedene Kunden füllen häufiger Bewertungsformulare aus als unzufriedene — oder umgekehrt.
Zu kleine Stichprobe: 50 Befragte sagen wenig über 80 Millionen Einwohner aus.
Falsche Auswahl: Eine Studie über Schlafgewohnheiten, die nur Studierende befragt, gilt nicht für Schichtarbeiter.

Faustregel: Bevor du einer Studie glaubst, frage: Wer wurde befragt, wie viele, und wie wurden sie ausgewählt?

Korrelation ≠ Kausalität

Das ist einer der wichtigsten Sätze der Statistik.

Korrelation bedeutet: Zwei Dinge treten zusammen auf oder verändern sich gleichzeitig. Kausalität bedeutet: Das eine verursacht das andere.

Scheinkorrelation (Beispiele):

In Sommern steigt sowohl der Eiscremeverkauf als auch die Zahl der Ertrinkungsopfer. Verursacht Eis-Essen Ertrinken? Nein — beide haben eine gemeinsame Ursache: heißes Wetter.
In Ländern mit mehr Schokoladenkonsum gibt es mehr Nobelpreisträger. Macht Schokolade klüger? Eher nicht — beide korrelieren mit Wohlstand.

Mögliche Beziehungen bei Korrelation:

A verursacht B.
B verursacht A.
C verursacht sowohl A als auch B.
Zufall (bei kleinen Stichproben häufig).

Ein Test: Wenn du die Ursache manipulierst, sollte die Wirkung folgen. Wenn du mehr Eis isst, ertrinkst du nicht häufiger. Also: keine Kausalität.

Typische Manipulationen in Grafiken

Verkürzte Y-Achse: Eine Grafik beginnt nicht bei 0, sondern bei 90. Kleine Unterschiede wirken riesig. Ein Anstieg von 91 auf 93 % sieht aus wie eine Verdoppelung.

Cherry-Picking: Man zeigt nur den Zeitraum, in dem die Daten die gewünschte Geschichte erzählen. „Aktienmarkt stieg in den letzten 3 Monaten um 15 %!” — während er im Jahresverlauf gefallen ist.

Relative vs. absolute Zahlen: „Das Risiko verdoppelt sich!” klingt dramatisch. Aber von 0,001 % auf 0,002 % — das ist ein winziger Unterschied in absoluten Zahlen. Immer beide Zahlen fordern.

Prozenttricks: 20 % Rabatt auf einen um 25 % erhöhten Preis ist kein gutes Angebot. Oder: „Wir haben 50 % mehr Personal eingestellt!” — von 2 auf 3 Mitarbeiter.

Irreführende Achsenbeschriftung: Gleiche Abstände auf der Achse, aber unterschiedliche Zeitintervalle: Jan, Feb, März, dann direkt Dezember.

Survivorship Bias

Der Survivorship Bias (Überlebensbestätigungsfehler) entsteht, wenn wir nur die Fälle sehen, die eine Selektion überlebt haben — und die Fälle vergessen, die ausgeschieden sind.

Klassisches Beispiel: Im Zweiten Weltkrieg untersuchten Ingenieure zurückgekehrte Kampfflugzeuge und wollten die beschädigten Stellen stärker panzern. Statistiker Abraham Wald erkannte: Die Flugzeuge mit Treffern an diesen Stellen sind zurückgekehrt — also sind diese Stellen weniger kritisch. Die Flugzeuge, die nicht zurückkamen, wurden getroffen — wo? An den Stellen, die bei den Überlebenden unbeschädigt sind. Also: Panzer die unbeschädigten Stellen.

Alltag:

„Unternehmer X hat mit 20 Jahren sein Studium abgebrochen und ist Millionär geworden!” — Tausende, die dasselbe taten und scheiterten, hören wir nicht.
Ratschläge von sehr alten Menschen über ihren Lebensstil: Sie haben überlebt — aber war ihr Stil der Grund dafür?

Beispiel aus dem Alltag

Wahlumfragen:

Eine Umfrage sagt: „Partei A liegt bei 34 %.” Was steckt dahinter?

Stichprobengröße: 1.000 Befragte (repräsentativ für Bundestagswahl? In etwa, wenn gut ausgewählt).
Fehlertoleranz: ±3 Prozentpunkte ist üblich — also könnte die reale Zahl zwischen 31 und 37 % liegen.
Zeitpunkt: Umfrage wurde vor einer großen Nachricht erhoben — die Lage kann sich geändert haben.
Formulierung: „Wen würden Sie wählen?” vs. „Welcher Partei stehen Sie am nächsten?” — unterschiedliche Fragen, andere Ergebnisse.

Corona-Inzidenzen:

Die 7-Tage-Inzidenz (Fälle pro 100.000 Einwohner) klingt vergleichbar — war es aber oft nicht:

Mehr Testkapazitäten → mehr erkannte Fälle, obwohl Infektionen konstant blieben.
Unterschiedliche Teststrategien in verschiedenen Ländern machten internationale Vergleiche schwierig.
Inzidenz sagt nichts über Schwere der Erkrankungen.

Das bedeutet nicht, dass Zahlen nutzlos sind — sondern dass man immer fragen muss, was genau gemessen wurde.

Anwendung

Analysiere diese drei Behauptungen und benenne jeweils den statistischen Fehler:

„Seit der neue Bürgermeister gewählt wurde, ist die Kriminalitätsrate um 15 % gesunken. Er hat gute Arbeit geleistet.”
„In unserer Umfrage unter Abiturienten fanden 90 %, dass die Schule ausreichend auf das Leben vorbereitet.” (Befragt wurden 20 Schüler der eigenen Schulklasse.)
„Vegetarier leben im Schnitt 6 Jahre länger als Fleischesser — also macht vegetarische Ernährung gesünder.”

Für jede Behauptung: Welcher Fehler steckt dahinter? Was müsste man wissen, um eine valide Aussage zu machen?

Typische Fehler

Mittelwert immer nehmen: Schiefen Verteilungen (Löhne, Preise, Stadtgrößen) trifft der Median fast immer besser. Wer nur Mittelwerte hört, sollte nach der Verteilung fragen.

Prozentzahlen ohne Basis verstehen: „10 % mehr” bedeutet gar nichts ohne Ausgangszahl. 10 % von 10 sind 1 — 10 % von 10.000 sind 1.000.

Korrelation als Beweis akzeptieren: Zwei Dinge korrelieren zu sehen ist kein Beweis für eine Ursache. Immer fragen: Was könnte sonst dahinterstecken?

Einzelne Studien als Beweis behandeln: Wissenschaftliche Erkenntnisse entstehen aus vielen Studien, die sich gegenseitig überprüfen und replizieren. Eine einzelne Studie — auch aus einer Fachzeitschrift — ist ein erster Hinweis, kein Beweis.

Grafiken nicht lesen: Viele Manipulationen passieren visuell. Immer die Achsenbeschriftung und den Nullpunkt prüfen.

Zusammenfassung

Mittelwert, Median und Modus messen alle die „Mitte”, aber reagieren unterschiedlich auf Ausreißer — bei Lohnstatistiken ist der Median aussagekräftiger
Stichproben müssen repräsentativ sein; Selbstauswahl, zu kleine Gruppen oder falsche Auswahl verzerren Ergebnisse
Korrelation bedeutet gemeinsames Auftreten, Kausalität bedeutet Verursachung — beides zu verwechseln ist ein häufiger Fehler
Typische Manipulationen: verkürzte Achsen, Cherry-Picking, relative statt absolute Zahlen, Prozenttricks
Survivorship Bias: Wer nur die Überlebenden betrachtet, zieht falsche Schlüsse über die Erfolgsfaktoren
Die wichtigste Frage bei jeder Statistik: Was wurde gemessen, an wem, und was wurde weggelassen?

Quiz

Frage 1: Warum ist der Median bei Lohnstatistiken meist aussagekräftiger als der Mittelwert?

Frage 2: Was ist Cherry-Picking — und wie erkennt man es?

Frage 3: Was ist Survivorship Bias — und warum führt er zu falschen Schlüssen?

Frage 4: Warum beweist eine Korrelation keine Kausalität — und was wäre nötig, um Kausalität zu zeigen?