Das Modell des operanten Konditionierens beruht auf der
Annahme, dass das Verhalten auf Steigerung der Lust und Verminderung
von Schmerz ausgerichtet ist. Mit Verstärkung sind alle
Reize gemeint, die die Wahrscheinlichkeit des Auftretens einer
Reaktion steigern. Der Reiz muss jedoch nicht unbedingt ein
angenehmer Reiz sein (vgl. LEFRANCOIS, 1994, Seite 34).
Es können positive und negative Verstärkung unterschieden
werden.
Positive Verstärkung
Bei der positiven Verstärkung folgt dem Verhalten ein
positives (belohnendes) Ereignis. Ein Beispiel für die
positive Bestärkung ist das Lob der Eltern, wenn das
Kind den Frühstückstisch deckt (vgl. EDELMANN, 2000,
Seite 70).
Verstärker
Es gibt verschiedene Arten von Verstärkern. Primäre
Verstärker umfassen Verhaltenskonsequenzen, die per se
verstärkend sind, sie wirken also ohne dass ein Lernprozess
stattfinden musste (Bsp.: Nahrung, Zärtlichkeiten). Sekundäre
(oder generalisierte) Verstärker sind Verhaltenskonsequenzen,
die ursprünglich nicht verstärkend wirkten, aber
durch wiederholte Paarung mit primären Verstärkern
selbst zum Verstärker wurden (vgl. LEFRANCOIS, 1994,
Seite 37). Dieser Vorgang lässt sich als assoziatives
Lernen erklären (vgl. EDELMANN, 2000, Seite 76).
Zeitpunkt der Verstärkung und Verstärkerpläne
Die Verstärkung muss sofort auf das gezeigte Verhalten
erfolgen, wenn sie erfolgreich sein sollen.
Beim Erlernen einer neuen Verhaltensweise ist es nötig,
dass das Verhalten immer (kontinuierlich) verstärkt wird.
Weiterhin darf dem Verhalten in diesem Lernabschnitt kein
Strafreiz folgen, da dieser die Wirkung der positiven Verstärker
beeinflusst. Die Anforderungen an den Lernenden müssen
demnach so dosiert werden, dass Misserfolge, die als Bestrafung
erlebt werden können, ausgeschlossen werden.
Sobald die Verhaltensweise aufgebaut ist, ist die Immerverstärkung
nicht mehr nötig. Eine gelegentliche Verstärkung
ist nun vorteilhafter. Eine Abschwächung des Gelernten
wird besonders durch eine gelegentliche, unregelmäßige
Verstärkung verhindert (vgl. EDELMANN, 2000, Seite 78).
Verhaltensformung (Shaping)
SKINNER entwickelte die Technik der stufenweise Annäherung,
um Tieren Verhaltensweisen beizubringen, die normalerweise
in ihrem Verhaltensrepertoire nicht enthalten sind. Hierbei
werden aufeinanderfolgende Annäherungen differentiell
verstärkt. Der Versuchsleiter verstärkt hierbei
jeden Schritt, der das Tier der endgültigen Reaktion
näher bringt, anstatt zu warten, bis das Tier diese von
selbst zeigt (vgl. LEFRANCOIS, 1994, Seite 42).
Die Verstärkung gewisser Merkmale einer Reaktion wie
ihre Geschwindigkeit, Dauer oder Intensität wird als
Reaktionsdifferenzierung bezeichnet. Bei der differentiellen
Herausbildung eines möglichst kräftigen Hebeldrucks
zum Beispiel wird anfangs jedes Drücken des Hebels verstärkt.
Dabei wird eine Verteilung von Reaktionen unterschiedlicher
Intensität erreicht. Danach werden nur noch die Hebeldruck-Aktionen
verstärkt, die mindestens mit der festgelegten Kraft
ausgeführt werden. Durch diese Einschränkung werden
schwächere Reaktionen gelöscht und stärkere
gefördert, so dass sich die Verteilung in Richtung höhere
Reaktionsintensität verschiebt. Durch immer weitere Erhöhung
des Kriteriums kann dann die Reaktion in Richtung immer höhere
Kraftaufwendung "geformt" werden. (vgl. BOWER/HILGARD,
1983, Seite 258).
Verhaltensketten
PIERREL & SHERMANN (1963) beschrieben folgende Verhaltenskette
einer Ratte:
Die Ratte stieg eine Wendeltreppe hinauf, lief über eine
Zugbrücke, kletterte eine Leiter hinab, zog ein Spielzeugauto
an einer Schnur heran, stieg in das Auto ein, fuhr zu einer
weiteren Leiter, kletterte diese hinauf, kroch durch ein Rohr,
kletterte in einen Aufzug, zog an einer Kette, die eine Fahne
hochzog und die Ratte zur Ausgangsplattform brachte, wo sie
einen Hebel drückte und daraufhin eine Futterpille bekam,
die sie fraß.
Oft werden solche Verhaltensketten vom Ende her gelernt. Auch
im menschlichen Alltag sind Verhaltensketten zu beobachten,
wie zum Beispiel das Auto fahren. Voraussetzung für die
Kettenbildung ist, dass jede einzelne Verhaltensweise richtig
gelernt ist. Die Konsequenzen, die jedes Glied der Kette erfährt
stellen einen Reiz für das nächste Glied dar (z.B.
Anspringen des Motors Hinweisreiz für Loslassen des Schlüssels,
ggf. Gas geben). Die gesamte Kette wird durch den abschließenden
Erfolg verstärkt (vgl. EDELMANN, 2000, Seite 79).
Negative Verstärkung
Bei der negativen Verstärkung folgt auf das erwünschte
Verhalten das Verschwinden eines aversiven (unangenehmen)
Ereignisses. Von negativer Verstärkung spricht man z.B.
wenn der Lehrer die Schüler ermahnt, die Hausaufgaben
gewissenhaft zu erledigen, da sonst der Wandertag ausfällt
(vgl. EDELMANN, 2000, S. 70).
Es gibt zwei Formen der negativen Verstärkung: das Fluchtlernen
(Flucht- und Abschaltverhalten) sowie das Vermeidungslernen
(Ausweich- und Vorbeugungsverhalten). Beim Fluchtlernen wird
die Person direkt mit dem aversiven Ereignis konfrontiert
und ergreift Maßnahmen um diesem zu entkommen. Dagegen
handelt es sich um Vermeidungslernen, wenn eine Person, durch
einen Signalreiz gewarnt, rechtzeitig Vorsorge trifft, um
das aversive Ereignis vorbeugend zu vermeiden. Dabei handelt
es sich aber um eine aktive Form der Vermeidung (vgl. EDELMANN,
2000, Seite 83).
|