Ballada o lekkim zabarwieniu psychologicznym (cz II): warunkowanie instrumentalne

Na czym polega warunkowanie instrumentalne? Co to jest kwadrat wzmocnień? Czy kara może być pozytywna?

W dzisiejszym odcinku „Ballady” znajdziecie na te wszystkie pytania odpowiedzi!

Jeśli nie czytaliście jeszcze pierwszej części „Ballady o lekkim zabarwieniu psychologicznym” zapraszam do tekstu o Iwanie Pietrewicza Pawłowie i jego badaniach nad trawieniem i warunkowaniem klasycznym.

Dziś zobaczymy, dokąd jeszcze doprowadziły naukowców eksperymenty z warunkowania i poznamy jednego z najważniejszych przedstawicieli behawioryzmu – Burrhusa Frederica Skinnera. A oto i on!

warunkowanie instrumentalne - Burrhus Skinner — Burrhus i gołębie, na których stosował wiele eksperymentów

Na powyższym obrazku jest ujęte dokładnie to, co było dla Skinnera sednem nauki – eksperymenty i obserwacja. Jego przedmiot zainteresowań nazywamy dziś eksperymentalną analizą zachowania. Interesowało go tylko i wyłącznie obserwowalne zachowanie, a nie subiektywne odczucia i emocje. Konstruował przeróżne urządzenia, klatki, które miały służyć badaniom modyfikacji zachowań i jak najdokładniej pomierzyć te badania. Przejdźmy zatem do sedna: cóż takiego zbadał dokładnie i opisał Burrhus Skinner?

CO POKAZAŁ NAM SKINNER: warunkowanie instrumentalne

W odniesieniu do warunkowania klasycznego, które odkrył Pawłow, rodzaj oddziaływania, jakie badał Skinner, nazywamy warunkowaniem instrumentalnym lub sprawczym.

W warunkowaniu instrumentalnym, organizm uczy się, że jego działania mogą mieć konsekwencje – pozytywne bądź negatywne. Następuje skojarzenie pomiędzy bodźcem – konsekwencją zachowania, mówiąc potocznie karą lub nagrodą, a reakcją – zachowaniem organizmu. Zasadą ogólną jest to, że zachowania nagradzane zostaną powtórzone, a zachowania karane (czy też wygaszane) będą występować z coraz mniejszym prawdopodobieństwem. Mówiąc krótko: organizm uczy się, jak przez swoje zachowanie unikać kar lub otrzymywać nagrody.

W związku z tym, że możemy zwierzęciu coś dać, lub coś zabrać, i to coś może być „fajne” lub „niefajne”, powstają 4 podstawowe narzędzia warunkowania instrumentalnego. Warto się z nimi zapoznać. To pierwszy krok do pójścia dalej, czyli świadomego i rozważnego wykorzystywania ich w naszym życiu z psem.

Kwadrat wzmocnień

Wszystkie te 4 narzędzia razem bywają nazwane kwadratem wzmocnień. Myślę, że sprawa stanie się o wiele bardziej klarowna po analizie schematu, który przygotowałam.

Kilka słów wyjaśnienia schematu i struktura pojęć, którymi posługujemy się w behawioryzmie:

Zachowania podlegają modyfikacji: wzmacnianiu (reinforcement, „R”) lub wygaszaniu (mówi się też karaniu) – punishment, „P”.
Modyfikować zachowania możemy odejmując (stąd słówko negative i znaczek „-„) lub dodając (stąd słówko positive i znaczek „+”) coś – mówiąc naukowo bodziec – do środowiska psa.
Stosowany bodziec może być apetytywny (przyjemny) albo awersyjny (nieprzyjemny).
Stąd powstają 4 narzędzia: P+, P-, R+, R-. Na przykład, P- oznaczać będzie, że:
- P: mamy do czynienia z punishment, czyli karą/wygaszeniem
- „-„: chodzi o odjęcie bodźca ze środowiska
- Łącząc to w całość: zabieramy coś psu, aby wygasić jego zachowanie. Na przykład zabieramy naszą uwagę, aby pies przestał po nas skakać. Et voilà!

Myślę, że mimo wszystko przyda się krótki opis każdego z narzędzi.

R+ WZMOCNIENIE POZYTYWNE

NA CZYM POLEGA: Dwuczłonowa nazwa wskazuje nam na dwie rzeczy: Po pierwsze, że jeśli to coś zastosujemy, to zachowanie psa zostanie wzmocnione (R jak reinforcement). Po drugie, że coś zostanie psu dodane (+, positive), aby wzmocnić to zachowanie – będzie to bodziec apetytywny, inaczej nagroda. A więc: dodajemy psu coś pozytywnego, aby wzmocnić jego zachowanie.

PRZYKŁADY ZASTOSOWANIA: W większości przypadków przy nauce nowych zachowań, sztuczek: pies wykonuje sztuczkę, wypełnia postawione przez nas kryterium i otrzymuje za to nagrodę w postaci smakołyka.

Przy okazji – często stosujemy wzmocnienie pozytywne nieświadomie, wtedy, kiedy wcale nie chcemy konkretnego zachowania wzmocnić. Przykładowo, kiedy ekscytujemy się tym, co robi pies: na przykład, kiedy pies oszczekuje obcego człowieka, my krzyczymy na psa. Dla psa nasz krzyk może być nagrodą, ponieważ zwracamy w ten sposób na niego uwagę, zatem zaczyna rzucać się jeszcze bardziej.

R- WZMOCNIENIE NEGATYWNE

NA CZYM POLEGA: Wzmacniamy zachowanie psa (znowu R!), ale za pomocą odjęcia mu czegoś (-, negative). Odejmować będziemy zatem jakiś bodziec dla psa nieprzyjemny – bodziec awersyjny.

PRZYKŁADY ZASTOSOWANIA: Najprostszy to spacer na smyczy. Kiedy pies ciągnie na smyczy, czuje nieprzyjemny dla niego ucisk obroży. Nieprzyjemność ustaje, kiedy pies przestaje ciągnąć. I w ten prosty sposób uczy się chodzenia na „luźnej smyczy”. Coś nieprzyjemnego trwa, dopóki pies zachowuje się w niepożądany sposób. Nieprzyjemność ustaje, kiedy pies to zachowanie przerwie.

Inny przykład? Ucząc psa komendy „siad”, naciskamy dłonią na jego pupę. Nacisk trwa,dopóki pies nie opuści zadu i nie usiądzie. Kiedy siada, nacisk (bodziec aweresyjny) ustaje.

P- KARA NEGATYWNA

NA CZYM POLEGA: Mamy do czynienia z wygaszaniem, czy też karaniem zachowania (P jak punishment) poprzez zabranie mu („-„) czegoś przyjemnego – bodźca apetetywnego. Zachowanie psa nie jest nagradzane – pies nie dostaje tego „co chciał”. Pies uczy się, że przyjęta przez niego strategia jest nieskuteczna i rezygnuje z niej.

PRZYKŁADY ZASTOSOWANIA: Rocca nauczyła się otwierać drzwi, skacząc na klamkę. Zaczęłam więc zamykać drzwi na klucz. Uporczywe skakanie i poruszanie klamki nie dawały już rezultatów. Po pewnym czasie Rocca zrezygnowała więc ze skakania. Z punktu widzenia Rocki, jej zachowanie – skok na klamkę – dawało jej nagrodę w postaci możliwości wejścia do jakiegoś pomieszczenia. Zamykając drzwi na cztery spusty, odebrałam („-„) jej możliwość otrzymania tej nagrody i sprawiłam, że nauczyła się, że zachowanie w postaci skakania na klamkę nie przynosi pożądanego rezultatu.

P+ KARA POZYTYWNA (potocznie: kara)

NA CZYM POLEGA: Ta nazwa może być początkowo myląca no bo jak to, pozytywna kara? Chodzi o to, że dodajemy (+) do środowiska psa bodziec, aby wygasić/ukarać jego zachowanie (P, punishment). Bodziec musi być zatem awersyjny (nieprzyjemny). Najczęściej to słowo („feeee”), szarpnięcie smyczą, klaps. W karaniu jesteśmy mistrzami i mamy bardzo dużo na to pomysłów.

PRZYKŁADY ZASTOSOWANIA: Chyba każdy bez zastanowienia poda co najmniej 10 takich przykładów: klaps po zjedzeniu ciastka ze stołu; szarpnięcie smyczą, jeśli pies rzuca się na przechodniów; impuls z obroży elektrycznej, jeśli pies goni za zwierzyną.

Mam nadzieję, że teraz podstawowe pojęcia z zakresu behawioryzmu brzmią już bardziej przyjaźnie, a kwadrat wzmocnień stanie się waszym najlepszym, obok psa, przyjacielem. Z opisanymi podstawowymi zasadami warunkowania instrumentalnego wiąże się wiele niuansów i ciekawych zjawisk, o których jednak innym razem.

Czy metody te, tak samo jak na psy i gołębie, działają na ludzi? Sheldon z „Big Bang Theory” jest przekonany, że tak (ale sprawa, niestety albo stety, nie jest tak prosta):

————————————————————————————————————————-

Mocno wierzę w naukę i w to, że w wychowaniu psa intuicja to nie wszystko i często nas zwodzi, dlatego zdecydowanie warto szukać tej wiedzy. Ktoś za nas zrobił kawał dobrej roboty, nie skorzystać z tego – to by była ogromna strata!

2 komentarze

Amelia z Zamerdani

11 maja, 2017 at 6:39 pm Odpowiedz

Uczę się włąśnie do egzaminu i szukałam informacji o kwadracie wzmocnień i fajnych przykładów, no i film na końcu mnie rozwalił 😀 Dzięki, od razu mi lepiej 😀
1. Gosia i Rocca
  
  11 maja, 2017 at 10:25 pm Odpowiedz
  
  A proszę, proszę 😀