Operante Konditionierung

Synonyme: instrumentelle Konditionierung, Verstärkungslernen, Belohnungslernen, Lernen am Erfolg
Englisch: operant conditioning

Definition

Die operante Konditionierung ist ein 1913 von Thorndike postuliertes Lernprinzip, welches das Lernen am Erfolg beschreibt. Diese Methode wurde von Burrhus Frederic Skinner perfektioniert und ist eine wichtige Säule im Konzept des Behaviorismus.

Grundprinzip

Die Grundprinzipien der operanten Konditionierung sind folgende:

Folgt auf ein bestimmtes Verhalten ein angenehmer Zustand (z.B. eine Belohnung), so wird dieses Verhalten in Zukunft häufiger gezeigt.
Folgt auf ein bestimmtes Verhalten ein unangenehmer Zustand (z.B. Bestrafung), wird dieses Verhalten in der Zukunft seltener auftreten.

Vor allem bei der Erziehung von Kindern wird dieses Prinzip oft genutzt, aber auch das Verhalten Erwachsener kann durch die operante Konditionierung noch beeinflusst werden.

Verstärker

Unter einem Verstärker versteht man einen Reiz, der die Häufigkeit des Verhaltens modifiziert.

Positive Verstärker

Unter einem positiven Verstärker versteht man allgemein den auf ein Verhalten folgenden positiven Reiz. Dieser führt zu häufigerem Auftreten des Verhaltens. Unterschieden wird zwischen

primären Verstärkern, die der Befriedigung primärer Bedürfnisse wie Essen, Trinken usw. dienen und
sekundären Verstärkern, die abgeleitete Bedürfnisse wie Ehre, Geld etc. betreffen.

Beispiel: Jedes Mal, wenn die Ratte Ausgang A nimmt, bekommt sie Futter.

Negative Verstärker

Unter einem negativen Verstärker versteht man einen negativen Reiz (z.B. Stromschlag, Schmerzen oder Hausarrest), der beim Eintreten des erwünschten Verhaltens entfernt wird.

Beispiel: Die Ratte bekommt via Elektroden permanente Stromschläge, die aber nur dann ausbleiben, wenn sie Ausgang A nimmt.

Bestrafung

Es muss strikt zwischen negativer Verstärkung und Bestrafung unterschieden werden. Im Falle einer Bestrafung kommt auf das Verhalten, welches künftig zu vermeiden gilt, ein negativer Reiz.

Beispiel: Jedes Mal, wenn die Ratte statt Ausgang A den Ausgang B nimmt, bekommt sie einen Stromschlag.

Weiterhin unterscheidet man einen Bestrafungstyp I, der einen unangenehmen, aversiven Reiz ausübt und einen Bestrafungstyp II, der aus der Entziehung eines angenehmen Reizes besteht.

Verstärkung

Positive Verstärkung

Bei einer positiven Verstärkung wird ein Verhalten mit primären oder sekundären Verstärkern belohnt.

Negative Verstärkung

Unter der negativen Verstärkung versteht man den Entzug eines aversiven Reizes (z.B. wird einem Kind der Hausarrest erlassen, weil es im Haushalt mitgeholfen hat).

Verstärkerpläne

Kontinuierliche Verstärkung

Hierbei wird das gewünschte Verhalten jedes Mal verstärkt, wenn es ausgeführt wird.

Intermittierende Verstärkung

Quotenverstärkung

Bei dieser Variante wird das Verhalten nach einer bestimmtem Quote verstärkt. Zum Beispiel, jedes Mal, wenn die Ratte 5 Mal hintereinander das erwünschte Verhalten zeigt, bekommt sie Futter.

Intervallverstärkung

In diesem Fall wird das Verhalten in einem zeitlichen Intervall, z.B. alle 3 Minuten verstärkt.

Shaping

Diese Methode impliziert eine sukzessive Annährung an das gewünschte Verhalten. Es kommt vorwiegend bei komplizierten Verhaltensweisen zum Einsatz. Durch die Verstärkung der einzelnen Schritte wird die Versuchsperson, bzw. deren Verhalten in die gewünschte Zielrichtung "geshaped", also geformt.

Shaping hat eine große Bedeutung in der Arbeit mit Tieren. Viele Hundetrainer benutzen es als Dressurmethode.

Abgrenzung

Bei der operanten Konditionierung folgt auf eine Handlung bzw. einen ersten Reiz als Belohnung oder Bestrafung ein zweiter Reiz, das Gehirn konstruiert aus dem sequentiellen Ablauf eine Kausalität. Bei der klassischen Konditionierung finden zwei Reize simultan statt, im Gehirn wird aus der Gleichzeitigkeit eine Kausalität abgeleitet.