Klassische und operante Konditionierung

Einführung

Warum sabbern Hunde beim Klang einer Glocke? Warum willst du unbedingt weiterspielen, obwohl du eigentlich aufhören wolltest? Warum kaufst du genau diese Marke, obwohl du gar nicht weißt, warum?

Hinter all dem steckt Konditionierung — einer der fundamentalsten Lernmechanismen. Zwei Forscher haben dieses Prinzip besonders gründlich untersucht: Iwan Pawlow mit Hunden und B.F. Skinner mit Ratten und Tauben. Was sie herausfanden, veränderte das Verständnis von Lernen, Erziehung und menschlichem Verhalten grundlegend.

Konditionierung erklärt nicht alles — aber erstaunlich viel.

Grundidee

Lernen bedeutet oft: Dein Verhalten oder deine Reaktionen verändern sich aufgrund von Erfahrungen. Konditionierung ist der Mechanismus dahinter.

Klassische Konditionierung: Ein neutraler Reiz wird mit einem bedeutsamen Reiz verknüpft — bis er dieselbe Reaktion auslöst. Beispiel: Klingel + Futter → Hund speichelt. Irgendwann: Klingel allein → Hund speichelt.

Operante Konditionierung: Verhalten wird durch seine Konsequenzen gesteuert. Angenehme Folgen → Verhalten wird häufiger. Unangenehme Folgen → Verhalten wird seltener. So einfach. So mächtig.

Erklärung

Klassische Konditionierung (Pawlow)

Iwan Pawlow erforschte die Verdauung von Hunden — und entdeckte dabei zufällig, dass Hunde nicht erst beim Anblick von Futter zu speicheln begannen, sondern schon beim Anblick des Laborassistenten. Die Assoziation war bereits gelernt.

Die vier Begriffe:

UCS (unkonditionierter Stimulus): Der natürliche Auslöser — z.B. Futter. Löst automatisch eine Reaktion aus.
UCR (unkonditionierte Reaktion): Die automatische, angeborene Reaktion auf den UCS — z.B. Speichelfluss bei Futter.
CS (konditionierter Stimulus): Der ursprünglich neutrale Reiz — z.B. ein Glockenton. Er wird mit dem UCS gepaart.
CR (konditionierte Reaktion): Die erlernte Reaktion auf den CS allein — z.B. Speichelfluss beim Glockenton ohne Futter.

Wichtige Phänomene:

Generalisierung: Der CS löst auch ähnliche Reize als konditioniert aus. Ein Kind, das sich vor Hunden fürchtet, fürchtet sich auch vor anderen Tieren.
Diskriminierung: Das Gegenteil — man lernt, nur auf den genauen CS zu reagieren, nicht auf Ähnliches.
Löschung: Wenn der CS wiederholt ohne den UCS präsentiert wird, schwächt sich die CR ab und verschwindet schließlich.
Spontanerholung: Nach einer Pause kann eine gelöschte CR kurzfristig wieder auftreten.

Alltagsbeispiele klassischer Konditionierung:

Angstreaktionen: Ein Unfall im Auto → Angst beim Fahren (Auto ist jetzt CS)
Werbung: Schöne Landschaft + Produkt → positives Gefühl beim Produkt
Übelkeit nach bestimmten Speisen: Einmaliges Erbrechen reicht als Lernerfahrung

Operante Konditionierung (Skinner)

B.F. Skinner interessierte nicht das Innenleben von Tieren, sondern beobachtbares Verhalten und seine Konsequenzen. Er entwickelte die „Skinner-Box”: Eine Ratte drückt zufällig einen Hebel — und erhält Futter. Sie drückt ihn häufiger. Das Verhalten wurde verstärkt.

Das Vier-Felder-Schema:

	Angenehm hinzugefügt	Unangenehm hinzugefügt
Konsequenz tritt ein	Positive Verstärkung (+)	Positive Bestrafung (+)
Konsequenz entfällt	Negative Bestrafung (−)	Negative Verstärkung (−)

Positive Verstärkung: Du machst etwas Gutes, du bekommst etwas Schönes. Lob, Taschengeld, gute Note. → Verhalten wird häufiger.

Negative Verstärkung: Du machst etwas, und ein unangenehmer Reiz hört auf. Du trinkst Ibuprofen → Kopfschmerz weg. → Verhalten wird häufiger. (Achtung: „negativ” ≠ „schlecht”!)

Positive Bestrafung: Du machst etwas, und etwas Unangenehmes passiert. Du redest im Unterricht → Nachsitzen. → Verhalten wird seltener.

Negative Bestrafung: Du machst etwas, und etwas Angenehmes wird entzogen. Du kommst zu spät → Handy weg. → Verhalten wird seltener.

Verstärkerpläne: Nicht jede Reaktion muss sofort verstärkt werden. Intermittierende Verstärkung (manchmal, unvorhersehbar) führt zu besonders hartnäckigem Verhalten — deshalb sind Glücksspiele und Social-Media-Likes so schwer zu ignorieren.

Shaping (Verhaltensformung): Wenn das gewünschte Endverhalten zu komplex ist, wird es in Schritte zerlegt. Jede Annäherung wird verstärkt. So lernen Tiere Tricks — und Kinder das Sprechen.

Löschung: Verhalten, das nicht mehr verstärkt wird, tritt seltener auf und verschwindet schließlich. Kein Lob mehr → die Hand im Unterricht geht seltener hoch.

Beispiel aus dem Alltag

Schulnoten als Verstärker: Gute Note → Lob der Eltern (positive Verstärkung) → du lernst wieder. Schlechte Note → Fernsehverbot (negative Bestrafung) → du lernst mehr. Beide funktionieren — kurzfristig. Die Frage ist, ob du lernst, weil du es interessant findest, oder nur um Konsequenzen zu managen. Das hat Folgen für die intrinsische Motivation (mehr dazu in der Lektion über Motivation).

Sucht: Substanzkonsum → Hochgefühl (positive Verstärkung). Entzug → Unwohlsein (negative Bestrafung). Substanzkonsum → Entzug weg (negative Verstärkung). Sucht ist aus konditionierungstheoretischer Sicht ein dreifach verstärktes Verhalten. Das erklärt, warum sie so schwer zu durchbrechen ist.

Hund dressieren: „Sitz!” → Hund sitzt → Leckerli. Klassische operante Konditionierung. Beim Shaping: erst jede Bewegung nach unten belohnen, dann nur den halbwegen Sitz, dann nur den vollständigen.

Anwendung

Analysiere eine Lernsituation aus deinem Alltag:

Identifiziere ein Verhalten, das du häufig zeigst (z.B. Handy checken, Sport machen, Hausaufgaben zuerst erledigen).
Welche Konsequenzen folgen regelmäßig auf dieses Verhalten?
Ordne diese Konsequenzen dem Vier-Felder-Schema zu: positive Verstärkung, negative Verstärkung, positive Bestrafung, negative Bestrafung?
Wie könntest du mithilfe von Shaping ein neues erwünschtes Verhalten bei dir selbst aufbauen?

Typische Fehler

„Negative Verstärkung ist dasselbe wie Bestrafung.” Nein. Negative Verstärkung erhöht Verhalten, weil ein negativer Reiz wegfällt. Bestrafung senkt Verhalten. Die Verwechslung entsteht, weil „negativ” umgangssprachlich mit „schlecht” gleichgesetzt wird — wissenschaftlich bedeutet es nur „Entfernen eines Reizes”.

„Bestrafung ist die wirksamste Erziehungsmethode.” Forschung zeigt das Gegenteil: Bestrafung unterdrückt Verhalten situativ, erklärt aber nicht, was das Kind stattdessen tun soll. Verstärkung gewünschten Verhaltens ist nachhaltiger. Und: Angst als Lernumfeld schadet langfristig.

„Klassische Konditionierung ist nur etwas für Tiere.” Angstreaktionen, Geschmacksaversionen, Werbewirkung — all das funktioniert beim Menschen nach denselben Prinzipien. Konditionierung findet ständig statt, auch wenn wir es nicht bemerken.

„Löschung = Vergessen.” Gelöschtes Verhalten kann spontan wieder auftreten (Spontanerholung). Löschung ist kein Vergessen, sondern aktives Umlernen. Das hat Konsequenzen für Therapie: Phobien müssen aktiv gelöscht werden, nicht nur ignoriert.

Zusammenfassung

Klassische Konditionierung (Pawlow): Ein neutraler CS wird durch Kopplung mit einem UCS konditioniert und löst dann allein eine CR aus
Die vier Begriffe UCS, UCR, CS und CR beschreiben den Lernprozess präzise
Operante Konditionierung (Skinner): Verhalten wird durch Konsequenzen gesteuert — Verstärkung erhöht, Bestrafung senkt Auftretenswahrscheinlichkeit
Das Vier-Felder-Schema unterscheidet positive/negative Verstärkung und positive/negative Bestrafung
Intermittierende Verstärkung macht Verhalten besonders hartnäckig — Grundlage von Sucht und Social-Media-Design
Shaping ermöglicht das schrittweise Aufbauen komplexer Verhaltensweisen

Quiz

Frage 1: Ein Kind wird von einem Hund gebissen und entwickelt danach Angst vor allen Tieren — auch vor Katzen. Wie nennt sich dieses Phänomen?

Frage 2: Du nimmst eine Schmerztablette und deine Kopfschmerzen verschwinden. Du greifst beim nächsten Kopfschmerz sofort wieder zur Tablette. Welcher Konditionierungstyp liegt vor?

Frage 3: Was ist der Unterschied zwischen positiver Verstärkung und positiver Bestrafung?

Frage 4: Warum sind Glücksspiele psychologisch so schwer zu widerstehen?