Operante Konditionierung
Synonyme: instrumentelle Konditionierung, Verstärkungslernen, Belohnungslernen, Lernen am Erfolg
Englisch: operant conditioning
Definition
Die operante Konditionierung ist ein grundlegendes Lernprinzip aus der Psychologie. Es beschreibt, dass die Wahrscheinlichkeit eines Verhaltens durch seine Konsequenzen beeinflusst wird: Verhalten, das zu angenehmen Konsequenzen führt, wird häufiger gezeigt, Verhalten mit unangenehmen Folgen tritt seltener auf. Die Theorie bildet eine der zentralen Säulen des Behaviorismus.
Geschichte
Edward Thorndike (1874–1949) formulierte mit dem "Gesetz des Effekts" erstmals den Grundsatz, dass Verhalten häufiger gezeigt wird, wenn es zu befriedigenden Konsequenzen führt. B.F. Skinner (1904–1990) entwickelte diese Überlegungen experimentell weiter, prägte den Begriff der operanten Konditionierung und etablierte mit der Skinner-Box ein zentrales Forschungsinstrument. Er differenzierte zudem systematisch zwischen verschiedenen Formen der Verstärkung, Bestrafung und den zugrunde liegenden Verstärkerplänen, womit er die theoretische und methodische Basis des Konzepts wesentlich vertiefte.
Neuere Entwicklungen beziehen auch neurobiologische Grundlagen der Verhaltensänderung mit ein, etwa die Rolle des mesolimbischen Belohnungssystems.
Grundprinzipien
Verhalten wird durch seine Konsequenzen beeinflusst. Diese lassen sich systematisch nach zwei Dimensionen klassifizieren:
| Typen von Konsequenzen | |||
|---|---|---|---|
| Appetitiver Stimulus (angenehm) | Aversiver Stimulus (unangenehm) | ||
| Darbietungsintensität | Hinzufügung (positiv) | Positive Verstärkung: Verhalten nimmt zu | Bestrafung Typ I: Verhalten nimmt ab |
| Entzug (negativ) | Bestrafung Typ II: Verhalten nimmt ab | Negative Verstärkung: Verhalten nimmt zu | |
Verstärker
Positive Verstärker
Ein Reiz, der nach dem Verhalten hinzugefügt wird und die Auftretenswahrscheinlichkeit erhöht:
- Primäre Verstärker: Befriedigen biologische Grundbedürfnisse (z.B. Nahrung)
- Sekundäre Verstärker: Erlernt, z.B. Geld, Lob, Anerkennung
Negative Verstärker
Ein aversiver Reiz wird entfernt, wodurch das Verhalten verstärkt wird.
- Beispiel: Schmerz lässt nach, wenn eine bestimmte Handlung ausgeführt wird.
Verstärkerpläne
Kontinuierliche Verstärkung
Die Verstärkung erfolgt bei jedem Auftreten des Zielverhaltens.
Intermittierende Verstärkung
Hier gibt es verschiedene Formen:
- Fixed Ratio (FR): Verstärkung nach fester Anzahl an Reaktionen
- Variable Ratio (VR): Verstärkung nach variabler Anzahl
- Fixed Interval (FI): Verstärkung nach festem Zeitintervall
- Variable Interval (VI): Verstärkung nach variablen Zeitabständen
Bestrafungstypen
Bestrafung Typ I (positive Bestrafung)
Ein unangenehmer Reiz wird hinzugefügt, z.B. ein Stromschlag.
Bestrafung Typ II (negative Bestrafung)
Ein angenehmer Reiz wird entzogen, z.B. Fernsehverbot.
Shaping
Die Shaping-Methode ("Verhaltensformung") impliziert eine sukzessive Annäherung an das gewünschte Verhalten. Es kommt vorwiegend bei komplizierten Verhaltensweisen zum Einsatz. Durch die Verstärkung der einzelnen Schritte wird die Versuchsperson, bzw. deren Verhalten in die gewünschte Zielrichtung "geshaped", also geformt.
Shaping hat eine große Bedeutung in der Arbeit mit Tieren. Viele Hundetrainer benutzen es als Dressurmethode.
Extinktion
Bleibt eine Verstärkung aus, wird das Verhalten mit der Zeit weniger gezeigt.
Anwendungsbeispiele
- Verhaltenstherapie (z. B. Token-System)
- Tiertraining
- Pädagogik/Erziehung
- Organisationspsychologie/Mitarbeitermotivation
Grenzen und Kritik
Die operante Konditionierung erklärt primär beobachtbares Verhalten, vernachlässigt jedoch kognitive Prozesse (z.B. Erwartungen, Motivation). Moderne Lerntheorien (z. B. kognitive Verhaltenstherapie) integrieren klassische Konditionierung mit innerpsychischen Prozessen.
Abgrenzung
Die operante ist von der klassischen Konditionierung abzugrenzen. Bei der klassischen Konditionierung handelt es sich um einen Lernprozess, bei dem zwei Reize miteinander verknüpft werden. Ein ursprünglich neutraler Reiz gewinnt dabei durch wiederholte Kopplung mit einem unkonditionierten Reiz die Fähigkeit, eine ähnliche Reaktion auszulösen.
Literatur
- Skinner, The Behavior of Organisms: An Experimental Analysis, Appleton-Century, 1938
- Lee et al., Operant and classical learning principles underlying mind-body interaction in pain modulation: a pilot fMRI study, Sci Rep, 2021