Operante Konditionierung
Synonyme: instrumentelle Konditionierung, Verstärkungslernen, Belohnungslernen, Lernen am Erfolg
Englisch: operant conditioning
Definition
Die operante Konditionierung ist ein 1913 von Thorndike postuliertes Lernprinzip, welches das Lernen am Erfolg beschreibt. Diese Methode wurde von Burrhus Frederic Skinner perfektioniert und ist eine wichtige Säule im Konzept des Behaviorismus.
Grundprinzip
Die Grundprinzipien der operanten Konditionierung sind folgende:
- Folgt auf ein bestimmtes Verhalten ein angenehmer Zustand (z.B. eine Belohnung), so wird dieses Verhalten in Zukunft häufiger gezeigt.
- Folgt auf ein bestimmtes Verhalten ein unangenehmer Zustand (z.B. Bestrafung), wird dieses Verhalten in der Zukunft seltener auftreten.
Vor allem bei der Erziehung von Kindern wird dieses Prinzip oft genutzt, aber auch das Verhalten Erwachsener kann durch die operante Konditionierung noch beeinflusst werden.
Verstärker
Unter einem Verstärker versteht man einen Reiz, der die Häufigkeit des Verhaltens modifiziert.
Positive Verstärker
Unter einem positiven Verstärker versteht man allgemein den auf ein Verhalten folgenden positiven Reiz. Dieser führt zu häufigerem Auftreten des Verhaltens. Unterschieden wird zwischen
- primären Verstärkern, die der Befriedigung primärer Bedürfnisse wie Essen, Trinken usw. dienen und
- sekundären Verstärkern, die abgeleitete Bedürfnisse wie Ehre, Geld etc. betreffen.
Beispiel: Jedes Mal, wenn die Ratte Ausgang A nimmt, bekommt sie Futter.
Negative Verstärker
Unter einem negativen Verstärker versteht man einen negativen Reiz (z.B. Stromschlag, Schmerzen oder Hausarrest), der beim Eintreten des erwünschten Verhaltens entfernt wird.
Beispiel: Die Ratte bekommt via Elektroden permanente Stromschläge, die aber nur dann ausbleiben, wenn sie Ausgang A nimmt.
Bestrafung
Es muss strikt zwischen negativer Verstärkung und Bestrafung unterschieden werden. Im Falle einer Bestrafung kommt auf das Verhalten, welches künftig zu vermeiden gilt, ein negativer Reiz.
Beispiel: Jedes Mal, wenn die Ratte statt Ausgang A den Ausgang B nimmt, bekommt sie einen Stromschlag.
Weiterhin unterscheidet man einen Bestrafungstyp I, der einen unangenehmen, aversiven Reiz ausübt und einen Bestrafungstyp II, der aus der Entziehung eines angenehmen Reizes besteht.
Verstärkung
Positive Verstärkung
Bei einer positiven Verstärkung wird ein Verhalten mit primären oder sekundären Verstärkern belohnt.
Negative Verstärkung
Unter der negativen Verstärkung versteht man den Entzug eines aversiven Reizes (z.B. wird einem Kind der Hausarrest erlassen, weil es im Haushalt mitgeholfen hat).
Verstärkerpläne
Kontinuierliche Verstärkung
Hierbei wird das gewünschte Verhalten jedes Mal verstärkt, wenn es ausgeführt wird.
Intermittierende Verstärkung
- Quotenverstärkung
Bei dieser Variante wird das Verhalten nach einer bestimmtem Quote verstärkt. Zum Beispiel, jedes Mal, wenn die Ratte 5 Mal hintereinander das erwünschte Verhalten zeigt, bekommt sie Futter.
- Intervallverstärkung
In diesem Fall wird das Verhalten in einem zeitlichen Intervall, z.B. alle 3 Minuten verstärkt.
Shaping
Diese Methode impliziert eine sukzessive Annährung an das gewünschte Verhalten. Es kommt vorwiegend bei komplizierten Verhaltensweisen zum Einsatz. Durch die Verstärkung der einzelnen Schritte wird die Versuchsperson, bzw. deren Verhalten in die gewünschte Zielrichtung "geshaped", also geformt.
Shaping hat eine große Bedeutung in der Arbeit mit Tieren. Viele Hundetrainer benutzen es als Dressurmethode.
Abgrenzung
Bei der operanten Konditionierung folgt auf eine Handlung bzw. einen ersten Reiz als Belohnung oder Bestrafung ein zweiter Reiz, das Gehirn konstruiert aus dem sequentiellen Ablauf eine Kausalität. Bei der klassischen Konditionierung finden zwei Reize simultan statt, im Gehirn wird aus der Gleichzeitigkeit eine Kausalität abgeleitet.
um diese Funktion zu nutzen.