INSTRUMENTÁLIS KONDICIONÁLÁS

1. THORNDIKE PUZZLE BOXA = az éhes macskáknak meg kellett tanulniuk megszökni, hogy egy tál ételhez jussanak — Thorndike mérte a szökés KÉSŐSÉGÉT. Eredmények = több kísérlet során, A KÉSŐSÉG csökkent

a görbe fokozatos jellege meggyőzte Thorndike-ot, hogy az állatok nem a helyzetet értették meg racionálisan, hanem az élelemjutalom fokozatosan alakította ki az összefüggést a fejtörő dobozban lévő ételek és a menekülés között. Ezt a meggyőződését a “HATÁS TÖRVÉNYE”

“AMIKOR AZ ARESZPONSZT ismételten követi egy kielégítő állapot, AZ A RESZPONSZT NÖVEKEDNI fog a gyakoriságban”

2. DISCRETE TRIALS PROCEDURES = a képzés során 1) minden kísérlet akkor ér véget, amikor az állatot kiveszik a készülékből, és 2) az instrumentális választ minden kísérlet során csak egyszer hajtják végre. Általában a diszkrét kísérleti eljárások valamilyen labirintust használnak.

A labirintusok használatát W.S. SMALL vezette be a Clark Egyetemen, hogy tanulmányozhassa a patkányok tanulását.

Az ihletet a Scientific American egyik cikke adta, amelyben leírta, hogy a patkányok földalatti üregekben élnek, és állandóan “labirintusszerű” átjárókon kell átjutniuk – ezért a természettől kölcsönzött – vagyis behozta a természetet a laboratóriumba, és felállította azt, amiről azt gondolta, hogy ezeknek a földalatti labirintusoknak az egyenértékűje.

Mérés 1)Futási sebesség = milyen gyorsan tud egy állat eljutni a startboxból a célboxba — általában növekszik a kísérletek során — az állatok egyre gyorsabbak lesznek; vagy 2) KÉSŐSÉG = az idő, amíg az állatok elhagyják a startboxot és elindulnak a sikátorban — általában rövidül a kísérletek során — az állatok egyre gyorsabbak lesznek.

3. SZABADMŰKÖDÉSI ELJÁRÁSOK = olyan eljárások, amelyekben az állatok által meghatározott tempóban adott válaszok szerepelnek (pl., “szabadon” működnek a környezetükkel, akkor és olyan gyakran reagálnak, amikor és amilyen gyakran csak akarnak). Skinner teljesen megszüntette a labirintust, és olyan kamrát tervezett, amelyben a kezdődoboz és a céldoboz ugyanazon a helyen volt, hogy az állatnak ne kelljen sehova sem futnia, és megépítette a “Skinner-dobozt” – vagy operáns kamrát.

lépések a kiképzésben:

1. LÉPÉS =MAGAZIN KÉPZÉS = az étel átadásának hangja (klasszikus kondicionálás jelkövetés!)

2. LÉPÉS =KÉPZÉS = a kívánt viselkedéshez való egymást követő közelítések jutalmazása

Mérjük az állat viselkedését egy CUMULATÍV REKORDER segítségével.

Ez egy olyan készülék, amelynek van egy forgó dobja, amely állandó sebességgel húzza ki a papírt — egy tollat nyom a papírra. Ha nem történik reakció, a toll mozdulatlanul marad, és egy lapos, vízszintes vonalat rajzol, ahogy a papír kijön a gépből. Ha az állat egy kart megnyom, a toll egy lépéssel feljebb megy a papíron, és fent marad – a következő reakció a tollat még egy lépéssel feljebb viszi, és így tovább, és így tovább – ezt kumulatívnak nevezik, mert a reakciók teljes számát meg lehet mérni, ha csak a függőleges távolságot nézzük a toll kiindulási pontja és a toll megállási pontja között, miután az állat nem reagált.

VERTIKÁLIS TÁVOLSÁG = a válaszok teljes száma

HORIZONTÁLIS TÁVOLSÁG = mennyi idő telt el

VONALMÉRTÉK = a válaszok sebessége (milyen gyorsan nyomta az állat a sávot)

4. MEGERŐSÍTÉSI SZABÁLYZATOK =Szabályok, amelyek meghatározzák, hogy egy válasz mikor kerül megerősítésre.

KONTINUÁLIS MEGERŐSÍTÉS (CRF) = minden válasz megerősítésre kerül.

PARTIÁLIS vagyINTERMITTENTÁLIS MEGERŐSÍTÉS — 2 típus: Viszony & Intervallum

1. Arányos ütemezés =a megerősítés a kibocsátott válaszok számától függ, példa: “darabos” munka, ahol az embereket aszerint fizetik, hogy hány darabot készítenek (NEM aszerint, hogy mennyi ideig tart elkészíteni őket)

a. FIXED RATIO = fix szám, FR30-ban minden 30. válasz jutalmazott.

b. VARIABLE RATIO = változó szám, a VR30-ban átlagosan 30 reakciót jutalmaznak.

2. INTERVAL SCHEDULE =a megerősítés attól függ, hogy mennyi idő telt el az utolsó megerősítés óta,példa a postázás, ahol meglátogathatod a postaládát egy nap zilliószor, de még mindig nem fogsz kapni semmit, csak 24 órával a mai adag után.

a. FIXED INTERVAL = fix idő, FI30-ban a 30 másodperc eltelte után adott első választ jutalmazzák.

b. VARIABLE INTERVAL = változó időtartam, a VI30-ban az átlagosan 30 másodperc eltelte után adott első választ díjazzák.

Minden ütemezés másképp hat a viselkedésre:

FIXED INTERVAL= egy megerősítés után nagyon kevés válaszadás történik, de az arány folyamatosangyorsul és épp a következő megerősítés előtt éri el a csúcsot. Ezt nevezzük FI SCALLOP-nak. MITMOND EZ NEKÜNK AZ ÁLLATOKRÓL — MIT CSINÁLNAK? AZ IDŐT ÉRTÉKELIK — Nagyon, nagyon fontos következmények — ha óránként jutalmazunk, akkor a viselkedés csak óránként fog előfordulni.

FIXED RATIO =szünet és futás, jutalom, majd szünet, amit sok nyomkodás követ, majd jutalom.

VARIABLESCHEDULES (vagy VI vagy VR) esetén sokkal szabályosabb, mert a megerősítés bármikor bekövetkezhet — nem lehet előre megjósolni. Mit gondolsz, Las Vegas melyik ütemterv(ek)et ismeri?

Az egyik utolsó ütemterv — a FIXED-TIME SCHEDULE egy megerősítő automatikus adagolása egy adott időpontban (például 2 percenként). Ellentétben állhat a FIXED INTERVAL SCHEDULE-val, mivel a FIXED TIME SCHEDULE, a megerősítés NEM függ semmilyen reakciótól — azaz az állatot megerősítik, függetlenül attól, hogy mit csinál az adott időpontban. Skinner ezt a “véletlen” megerősítést SUPERSTITIOUSBEAVIOR-nak nevezte, mert az állat úgy viselkedik, mintha a viselkedése megerősítést eredményezne, amikor a valóságban semmi (vagy bármi), amit tesz, nem eredményezi a jutalom elérését.

5. Válasz-kimenetel-kontingenciák

Meghatározások:

APPETITIVESTIMULUS = Kellemes esemény.

AVERSIVESTIMULUS = Kellemetlen esemény.

POSITIVKONTINGENCIA = egy válasz “bekapcsol” egy ingert = a patkány megnyomhatja a sávot, ami aktiválja az élelmiszertárolót, és kap egy kis élelmet.

NEGATÍV KONTINGENCIA = egy válasz “kikapcsol” egy ingert = egy patkány ülhet a Skinner-dobozban, és a kísérletező hangos zajt adhat – ha a patkány megnyomja a sávot, a zaj kikapcsol.

Négy közös eljárás hozza össze a kétféle eseménytípusunkat (APPETITÍV és AVERZÍV) és a kétféle válasz-kimeneti kontingenciát (POSITÍV és NEGATÍV):

a.POSITÍV MEGERŐSÍTÉS = olyan eljárások, amelyekben a válasz bekapcsol egy APPETÍV STIMULUST. Ha a válaszreakció bekövetkezik, akkor az étvágygerjesztő inger kerül bemutatásra. Ha a válasz nem következik be, akkor az étvágygerjesztő inger nem kerül bemutatásra. Ez egy POSITIVECONTINGENCIA és a válaszadás mértéke növekszik.

POSITIVEREINFORCIA

APPETITIVESTIMULUS

POSITIVECONTINGENCIA

RESPONDINGINCIA

b.BÜNTETÉS = olyan eljárások, amelyekben a válasz bekapcsol egy ÁLTALÁNOS STIMULUS. Ha a válasz bekövetkezik, akkor kapja az averzív ingert. Ha a válasz nem következik be, akkor az averzív inger nem jelenik meg. Ez egy POSITIVECONTINGENCIA, és a válaszadás mértéke csökken.

POSITIVECONTINGENCIA

AVERSIVESTIMULUS

POSITIVECONTINGENCIA

VálaszadásMENNYISége csökken

c.NEGATÍV REINFORMÁCIÓ = olyan eljárások, amelyekben a válasz kikapcsolja vagymegakadályozza az AVERSÍV STIMULUS-t. Ha a válasz bekövetkezik, az AVERSIVE STIUMULUS vagy egyáltalán nem kapcsol be, vagy kikapcsol. Ha a válaszreakció nem következik be, akkor az averzív inger bekapcsol vagy bekapcsolva marad. Ez egy NEGATÍV KONTINGENCIA, és a válaszadás mértéke növekszik.

NEGATÍVREINFORCEMENT

AVERSIVESTIMULUS

NEGATÍVKONTINGENCIA

RESPONDÍCIÓNAK NÖVEKEDÉSE

2 féle NEGATÍVREINFORCEMENT — az egyik az úgynevezettESCAPE, amelyben a válasz kikapcsolja az AVERSIVESTIMULUST. Példa,egy kísérletvezető bekapcsolhat egy hangos zajt és a patkány egyszer megnyomja a sávot és kikapcsolja. A válaszreakció végrehajtásával az állat elkerüli az averzív helyzetet.

A másik pedig az AVOIDANCE, amelyben a válasz megakadályozza az AVERZÍV STIMULUST. Például egy patkányt klasszikusan kondicionálni lehet egy fény és egy lábsokk párosításával. A patkány odafut és egyszer megnyomja a rudat, és megakadályozza, hogy a sokk valaha is bekövetkezzen. Azáltal, hogy az állat végrehajtja ezt a választ, elkerüli az averzív ingert.

d.KIZÁRÓLAG KIKÉPZÉS = olyan eljárások, amelyekben a válasz kikapcsol vagy megakadályoz egy APPETÍV ISKUSZTUS-t. Ha a válaszreakció bekövetkezik, akkor az APPETITIVE STIMULUS “kihagyásra” kerül. Ha a válasz nem következik be, akkor az étvágygerjesztő inger bekövetkezik. Ez egy NEGATÍV KONTINGENCIA, és a válaszadás mértéke csökken.

OMISSIONTRAINING

APPETITIVESTIMULUS

NEGATÍV KONTINGENCIA

RESZPONDÍCIÓRESZTRÁINING

6. STIMULUSKONTROLL = Olyan jelenség, amelynél a válasz valószínűsége az adott pillanatban jelenlévő ingerek függvényében változik. Egy válasz ingerkontroll alatt van, ha előfordulási valószínűsége különböző ingerek jelenlétében eltérő.

7. GENERALIZÁCIÓ = Reagálás egy ingerre valamilyen más hasonló ingerre való gyakorlás következtében. Lásd fentebb a Klasszikus kondicionálást.

8. DISKRIMINÁCIÓ = 2 ingerre való differenciált reagálás. A DISKRIMINÁCIÓS KÉPZÉS során 2 inger kerül bemutatásra: a megerősítőt az egyik inger jelenlétében mutatják be (S+), de a másik inger jelenlétében nem (S-). Lásd fentebb a Klasszikus kondicionálást.

9. PEAK SHIFT = az általánosítási gradiens eltolódása az S-hez képest. Ha az alanyok egyetlen ingerrel történő tréninget követően generalizációs tesztet kapnak, a generalizációs gradiens csúcsa a tréning ingernél fog elhelyezkedni. Ha azonban az alanyok 2 ingert tartalmazó diszkriminációs tréninget kapnak, a generalizációs teszt során a legnagyobb válaszreakció nem az S+, hanem az S-hez képest távolabbi ingerre történik.

10. EXTINCTION = a megerősítés megszűnik. Amikor az EXTINCCIÓt először vezetik be egy megerősítési időszak után, a válaszadásnak ez a kitörése következik be – majd a válaszadás mértéke fokozatosan csökken. Várjuk meg a következő napot, és tegyük vissza az állatot a Skinner-dobozba – a klasszikus kondicionáláshoz hasonlóan SPONTÁNI JAVULÁS következik be.

11. SPONTÁN VISSZATÉRÉS = a kioltott válasz visszatérése az utolsó kioltási kísérletet követő bizonyos idő elteltével.

12. RÉSZES MEGERŐSÍTÉSI HATÁS (PRE) = Minél nagyobb a képzés során meg nem erősített válaszok aránya, annál tartósabb a válasz a kihalás során.

13. FRUSZTRÁCIÓ & EXTINCCIÓBAN INDUKÁLT AGGRESSZIÓ = A viselkedés élénkségének növekedése, amely közvetlenül követi egy korábban megerősített válasz meg nem erősítését; ez az érzelmi válasz, amelyet a várt megerősítő megvonása vált ki. Bizonyos körülmények között a frusztráció kellően súlyos lehet ahhoz, hogy agresszív reakciókat is magában foglaljon.

Azrin, Hutchinson & Hake (1966) 2 galambot használt, amelyeket egy Skinner-dobozban helyeztek el — az egyiket a sarokban lefogták, hogy ne tudjon reagálni, a másikat pedig arra tanították, hogy megerősítésért csipkedjen egy kulcsot. A kulcsot csipegető alapvetően figyelmen kívül hagyta a másikat, amíg megkapta a megerősítést. Amikor az EXTINCTION-t bevezették, megtámadta a lekötözöttet — FRUSTRÁCIÓ.

14. NEGATÍV REINFORCEMENT & AVOIDANCE

NEGATÍVREINFORCEMENT

AVERSIVESTIMULUS

NEGATÍVKONTINGENCIA

RESZPONDÍCIÓK

A AVOIDANCE-ra vonatkozó tanulmányok mind a Klasszikus kondicionáló, mind az Intrumentális kondicionáló eljárásokra támaszkodnak.

A diszkriminált vagy szignált AVOIDANCE diszkrét kísérleteket foglal magában.

A kísérlet egy CS – például egy hang – bemutatásával kezdődik.

Ha az állat a kívánt választ adja, például fut a ketrec egyik oldaláról a másikra,akkor sikeresen ELKERÜLTE a sokkot = ezt nevezzük AVOIDANCE kísérletnek.

Ha nem adja meg a kívánt választ, sokkot kap. A sokk addig marad, amíg nem adja meg a kívánt választ. Ha megteszi, a sokk kikapcsolódik = ezt hívják ESCAPE próbának.

A kiképzés korai szakaszában a legtöbb próba ESCAPE próba. Amint az állat megtanulja, hogy a CS előre jelzi az US-t, akkor a próbák többsége AVOIDANCE próbává válik.

A DISCRIMINATEDAVOIDANCE-ban használt legnépszerűbb eszköz az úgynevezett SHUTTLE BOX, amely egy boltíves ajtóval két részre osztott ketrec. Mindkét felén külön drótrácsos padló van, amelyen keresztül elektromos áramot tudunk vezetni. Az állatot a doboz egyik felébe helyezzük, és a CS-t bemutatjuk. Ha az állat átmegy a doboz másik felébe, elkerüli a sokkot. Egy bizonyos időintervallum (mondjuk 1 perc) után a CS-t újra bekapcsoljuk, és a patkánynak ismét át kell mennie a másik rekeszbe, hogy elkerülje az áramütést.

A kísérlet során a patkány tehát a doboz két oldala között “ingázik” ide-oda.

15. SIDMAN AVOIDANCE = Murray Sidmant által kidolgozott elkerülési eljárás, amely figyelmeztető ingerrel jár. Egy averzív esemény, mint például egy sokk, meghatározott időközönként (a sokk-sokk intervallum) történik; ha az alany ezen intervallum alatt bármikor megteszi a kívánt választ, a következő programozott sokkot egy meghatározott időre (a válasz-sokk intervallum) elhalasztják.

16. VÁLASZTÁSI ViselkedésiPÉLDÁK = nagyon ritkán működik a megerősítés egyetlen válaszra izoláltan. Ahelyett, hogy egyszerűenválasztanánk, hogy megtegyünk-e egy választ vagy sem, gyakran két vagy több válasz között kell választanunk, amelyek mindegyike saját megerősítőkkel rendelkezik. A választási viselkedési kísérletek olyanok, amelyekben egynél több válasz adható.

A válaszadást az egyes választási lehetőségek RELATÍV VÁLTOZÁSI RÁTE mérésével mérjük. Példa: egy galambot betanítanak arra, hogy vagy az A vagy a B billentyűre csipkedjen. Az A kulcsra adott válaszok relatív aránya, ami egyenlőaz A kulcsra adott válaszok és a (A kulcsra adott válaszok és a B kulcsra adott válaszok)

A kulcsra adott válaszok relatív aránya = RA/(RA+RB)

B kulcsra adott válaszok relatív aránya = RB/(RA+RB)

Mi történik, ha a galamb ugyanannyiszor csipked A-ra és B-re…., mondjuk 10 alkalommal mindkettőre. Mi az A billentyű relatív válaszadási rátája? 0,5

Milyen a B billentyű relatív válaszadási aránya? 0.5

Mi történik, ha a galamb ugyanannyiszor csipkedi az A és a B billentyűt…., mondjuk 8-szor az A-n, de csak 2-szer a B-n?

Mi az A billentyű relatív válaszadási rátája? 0.8

Mi a RELATÍV VÁLTOZÁSI RÁta a B billentyűnél? 0.2

17. HERRNSTEIN VÁLASZTÁSI TÖRVÉNYE (Herrnstein, 1961) = amikor több tevékenység közül választhatunk, akkor az idő százalékos aránya, amelyet e tevékenységek egyikére fordítunk, megegyezik a rendelkezésre álló megerősítők százalékos arányával, amelyet ebből a tevékenységből nyertünk.

1. példa = VÁLASZTÁSI VAGYON Kísérlet : mindkét kulcs (A &B) pontosan ugyanabban a VI60-as ütemtervben van. Eredmények: mindkét billentyűn egyformán gyakran csipegetnek, és ugyanannyi megerősítést kapnak az A billentyűn, mint a B billentyűn — tehát a MEGERŐSÍTÉS RÁTUSA egyenlő lesz.

2. példa = VÁLASZTÓ Viselkedési Kísérlet : az A billentyűnek VI6perces ütemterve van egy óra alatt, mennyi az abszolút maximális megerősítések száma, amit a galamb kaphat? 10 (mert egy órában 10 6 perces intervallum van). A B kulcsnak VI2 perces menetrendje van — egy óra alatt mennyi az abszolút maximális megerősítések száma, amit egy galamb kaphat? 30 (30 2 perces intervallum van egy órában). Tehát ez 3-szor annyi, mint amennyi az A kulcson lehetséges.

Eredmények: A galamb a válaszok számát az erősítés valószínűségéhez fogja illeszteni — a B kulcson 3-szor olyan gyakran fog válaszolni, mint az A kulcson.

18. KONTRASZT HATÁSOK = Egy megerősítő hatékonyságának megváltozása más megerősítőkkel kapcsolatos korábbi tapasztalatok miatt (általában egy megerősítőt “eltolnak” egy másikkal, amelynek más a pozitív vagy negatív valenciája). A jutalom eltolódásának hatásait eredetileg Crespi mutatta ki – valójában a jutalom eltolódását követő viselkedésváltozásokat együttesen “CRESPI-EFEKTUS”-nak nevezték el. Egy újabb vizsgálatot Mellgren (1972) végzett.

Mellgren patkánycsoportokat vitt egy kifutóba

Az 1. fázisban– az 1. és 2. csoport minden alkalommal, amikor lefutottak a kifutón, 2 szem ételt kapott. A 3. csoport & 4 csoport 22 pellet élelmet kapott.

A 2. fázis során– a patkányok felét “eltolták”. Tehát az 1. csoport = változatlan maradt és 2 pelletet kapott (Kicsi-Kicsi); a 2. csoport = felfelé tolódott és 22 pelletet kapott (Kicsi-Nagy); a 3. csoport = változatlan maradt és 22 pelletet kapott (Nagy-Nagy); és a 4. csoport = lefelé tolódott és 2 pelletet kapott (Nagy-Kicsi)

Eredmények:

A Kicsi-Kicsi csoport nem sokat változott

A Nagy-Nagy csoport nem sokat változott.

De a Kicsi jutalomról Nagy jutalomra váltó patkányok gyorsabban futottak a nagy jutalomra, mint azok, akik végig a nagy jutalmat kapták. Ezt nevezik POSITÍV Viselkedési Kontrasztnak — tehát a POSITÍV Viselkedési Kontrasztot úgy definiálják, hogy egy kedvező jutalomra való fokozott reagálás a kevésbé vonzó eredménnyel kapcsolatos korábbi tapasztalat miatt.

A nagy jutalomról a kis jutalomra váltó patkányok pedig lassabban futottak a kis jutalomra, mint azok, amelyek mindvégig a kis jutalmat kapták. És ezt NEGATÍV Viselkedési Kontrasztnak nevezik — tehát a NEGATÍV Viselkedési Kontrasztot úgy definiálják, mint egy kedvezőtlen jutalomra adott depresszív válaszreakciót a jobb kimenetelű korábbi tapasztalat miatt.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.