Operantes Konditionieren am Beispiel des Clickertrainings

Einleitung

Das operante Konditionieren

		THORNDIKE und SKINNER

		Verstärkung

		Bestrafung

		Löschung

Das operante Konditionieren - Verstärkung

Das Modell des operanten Konditionierens beruht auf der Annahme, dass das Verhalten auf Steigerung der Lust und Verminderung von Schmerz ausgerichtet ist. Mit Verstärkung sind alle Reize gemeint, die die Wahrscheinlichkeit des Auftretens einer Reaktion steigern. Der Reiz muss jedoch nicht unbedingt ein angenehmer Reiz sein (vgl. LEFRANCOIS, 1994, Seite 34).
Es können positive und negative Verstärkung unterschieden werden.

Positive Verstärkung

Bei der positiven Verstärkung folgt dem Verhalten ein positives (belohnendes) Ereignis. Ein Beispiel für die positive Bestärkung ist das Lob der Eltern, wenn das Kind den Frühstückstisch deckt (vgl. EDELMANN, 2000, Seite 70).

Verstärker

Es gibt verschiedene Arten von Verstärkern. Primäre Verstärker umfassen Verhaltenskonsequenzen, die per se verstärkend sind, sie wirken also ohne dass ein Lernprozess stattfinden musste (Bsp.: Nahrung, Zärtlichkeiten). Sekundäre (oder generalisierte) Verstärker sind Verhaltenskonsequenzen, die ursprünglich nicht verstärkend wirkten, aber durch wiederholte Paarung mit primären Verstärkern selbst zum Verstärker wurden (vgl. LEFRANCOIS, 1994, Seite 37). Dieser Vorgang lässt sich als assoziatives Lernen erklären (vgl. EDELMANN, 2000, Seite 76).

Zeitpunkt der Verstärkung und Verstärkerpläne

Die Verstärkung muss sofort auf das gezeigte Verhalten erfolgen, wenn sie erfolgreich sein sollen.
Beim Erlernen einer neuen Verhaltensweise ist es nötig, dass das Verhalten immer (kontinuierlich) verstärkt wird. Weiterhin darf dem Verhalten in diesem Lernabschnitt kein Strafreiz folgen, da dieser die Wirkung der positiven Verstärker beeinflusst. Die Anforderungen an den Lernenden müssen demnach so dosiert werden, dass Misserfolge, die als Bestrafung erlebt werden können, ausgeschlossen werden.
Sobald die Verhaltensweise aufgebaut ist, ist die Immerverstärkung nicht mehr nötig. Eine gelegentliche Verstärkung ist nun vorteilhafter. Eine Abschwächung des Gelernten wird besonders durch eine gelegentliche, unregelmäßige Verstärkung verhindert (vgl. EDELMANN, 2000, Seite 78).

Verhaltensformung (Shaping)

SKINNER entwickelte die Technik der stufenweise Annäherung, um Tieren Verhaltensweisen beizubringen, die normalerweise in ihrem Verhaltensrepertoire nicht enthalten sind. Hierbei werden aufeinanderfolgende Annäherungen differentiell verstärkt. Der Versuchsleiter verstärkt hierbei jeden Schritt, der das Tier der endgültigen Reaktion näher bringt, anstatt zu warten, bis das Tier diese von selbst zeigt (vgl. LEFRANCOIS, 1994, Seite 42).
Die Verstärkung gewisser Merkmale einer Reaktion wie ihre Geschwindigkeit, Dauer oder Intensität wird als Reaktionsdifferenzierung bezeichnet. Bei der differentiellen Herausbildung eines möglichst kräftigen Hebeldrucks zum Beispiel wird anfangs jedes Drücken des Hebels verstärkt. Dabei wird eine Verteilung von Reaktionen unterschiedlicher Intensität erreicht. Danach werden nur noch die Hebeldruck-Aktionen verstärkt, die mindestens mit der festgelegten Kraft ausgeführt werden. Durch diese Einschränkung werden schwächere Reaktionen gelöscht und stärkere gefördert, so dass sich die Verteilung in Richtung höhere Reaktionsintensität verschiebt. Durch immer weitere Erhöhung des Kriteriums kann dann die Reaktion in Richtung immer höhere Kraftaufwendung "geformt" werden. (vgl. BOWER/HILGARD, 1983, Seite 258).

Verhaltensketten

PIERREL & SHERMANN (1963) beschrieben folgende Verhaltenskette einer Ratte:
Die Ratte stieg eine Wendeltreppe hinauf, lief über eine Zugbrücke, kletterte eine Leiter hinab, zog ein Spielzeugauto an einer Schnur heran, stieg in das Auto ein, fuhr zu einer weiteren Leiter, kletterte diese hinauf, kroch durch ein Rohr, kletterte in einen Aufzug, zog an einer Kette, die eine Fahne hochzog und die Ratte zur Ausgangsplattform brachte, wo sie einen Hebel drückte und daraufhin eine Futterpille bekam, die sie fraß.
Oft werden solche Verhaltensketten vom Ende her gelernt. Auch im menschlichen Alltag sind Verhaltensketten zu beobachten, wie zum Beispiel das Auto fahren. Voraussetzung für die Kettenbildung ist, dass jede einzelne Verhaltensweise richtig gelernt ist. Die Konsequenzen, die jedes Glied der Kette erfährt stellen einen Reiz für das nächste Glied dar (z.B. Anspringen des Motors Hinweisreiz für Loslassen des Schlüssels, ggf. Gas geben). Die gesamte Kette wird durch den abschließenden Erfolg verstärkt (vgl. EDELMANN, 2000, Seite 79).

Negative Verstärkung

Bei der negativen Verstärkung folgt auf das erwünschte Verhalten das Verschwinden eines aversiven (unangenehmen) Ereignisses. Von negativer Verstärkung spricht man z.B. wenn der Lehrer die Schüler ermahnt, die Hausaufgaben gewissenhaft zu erledigen, da sonst der Wandertag ausfällt (vgl. EDELMANN, 2000, S. 70).
Es gibt zwei Formen der negativen Verstärkung: das Fluchtlernen (Flucht- und Abschaltverhalten) sowie das Vermeidungslernen (Ausweich- und Vorbeugungsverhalten). Beim Fluchtlernen wird die Person direkt mit dem aversiven Ereignis konfrontiert und ergreift Maßnahmen um diesem zu entkommen. Dagegen handelt es sich um Vermeidungslernen, wenn eine Person, durch einen Signalreiz gewarnt, rechtzeitig Vorsorge trifft, um das aversive Ereignis vorbeugend zu vermeiden. Dabei handelt es sich aber um eine aktive Form der Vermeidung (vgl. EDELMANN, 2000, Seite 83).