INSTRUMENTEL KONDITIONERING

1. THORNDIKE’S PUZZLE BOX = sultne katte skulle lære at flygte for at få en skål med mad — Thorndike målte LATENCITETEN til at flygte. Resultater = over forsøg, LATENCY faldt

Den gradvise karakter af kurven overbeviste Thorndike om, at dyrene ikke havde dannet en rationel forståelse af situationen, men snarere at MÆNGELBETALINGEN FOR MÆNGDET STAMPEDE I EN ASSOCIATION MELLEM KUPER I PUSELKASSEN OG UDDRAGELSE. Han formaliserede sin overbevisning i sin “LAW OF EFFECT”

“WHEN ARESPONSE IS REPEATEDLY FOLLOWED BY A SATISFYING STATE OF AFFAIRS OF AFFAIRS, THAT RESPONSEWILL INCREASE IN FREQUENCE”

2. DISKRETISKE PRØVNINGSPROCEDURER = under træningen 1) slutter hvert forsøg, når man fjerner dyret fra apparatet, og 2) den instrumentelle respons udføres kun én gang i løbet af hvert forsøg. Normalt anvendes der ved diskrete forsøgsprocedurer en eller anden form for labyrint.

Brugen af labyrinter blev indledt af W.S. SMALL på Clark University, så han kunne studere læring hos rotter.

Han blev inspireret af en artikel i Scientific American, der beskrev, hvordan rotter levede i underjordiske huler og hele tiden måtte finde vej gennem “labyrintlignende” passager – så han lånte fra naturen – dvs. han bragte naturen ind i laboratoriet og opstillede, hvad han troede var det, der svarede til disse underjordiske labyrinter.

Måling 1) LØBEHURTIGHED = hvor hurtigt et dyr kan komme fra startboksen til målboksen — stiger normalt i løbet af forsøgene — dyrene bliver hurtigere; eller 2) LØBEHURTIGHED = den tid det tager dyrene at forlade startboksen og begynde at bevæge sig ned ad gangen — bliver normalt kortere i løbet af forsøgene — dyrene bliver hurtigere.

3. FRIOPERANTPROCEDURER = procedurer, der indebærer, at dyret reagerer i et tempo, som det selv bestemmer (dvs, de er “frie” til at handle på deres omgivelser ved at reagere, når de ønsker det, og hvor ofte de ønsker det). Skinner eliminerede labyrinten helt og aldeles og konstruerede et kammer, hvor startboksen og målboksen var placeret samme sted, så dyret ikke behøvede at løbe nogen steder hen, og byggede “Skinner-boksen” – eller operantkammeret.

trin i træningen:

1. TRIN =MAGAZIN-TRÆNING = lyd af mad, der bliver leveret (klassisk konditionering signtracking!)

2. TRIN =SHAPING = belønning af successive tilnærmelser til den ønskede adfærd

Måling af dyrets adfærd ved hjælp af en CUMULATIVE RECORDER.

Dette er et apparat, der har en roterende tromle, der trækker papir ud med en konstant hastighed — en penne står på papiret. Hvis der ikke sker nogen reaktion, står pennen stille og tegner en flad, vandret linje, efterhånden som papiret kommer ud af maskinen. Hvis et dyr udfører et tryk på en løftestang, bevæger pennen sig et trin op på papiret og forbliver oppe – den næste reaktion bevæger pennen et trin mere op og så videre og så videre – det kaldes kumulativt, fordi man kan måle det samlede antal reaktioner ved blot at se på den lodrette afstand mellem det sted, hvor pennen startede, og det sted, hvor pennen stoppede, efter at dyret holdt op med at reagere.

LETALDISTANCE = det samlede antal reaktioner

HORIZONTALDISTANCE = hvor meget tid der er gået

LINJENS HALS = reaktionshastighed (hvor hurtigt dyret trykkede på stangen)

4. FORSTÆRKNINGSSCHEMAER =Regler, der bestemmer, hvornår en respons skal forstærkes.

KONTINUERLIG FORSTÆRKNING (CRF) = hver respons forstærkes.

PARTIEL ellerINTERMITTENT FORSTÆRKNING — 2 typer: Ratio & Interval

1. RATIO SCHEDULE =forstærkning afhænger af antallet af afgivne reaktioner, f.eks. “stykkevis” arbejde, hvor folk bliver betalt efter hvor mange ting de laver(IKKE efter hvor lang tid det tager at lave dem)

a. FIXED RATIO = fast antal, i FR30 belønnes hver 30. respons.

b. VARIABLE RATIO = variabelt antal, i VR30 belønnes i gennemsnit 30 svar.

2. INTERVAL SKEMA =forstærkning afhænger af, hvor lang tid der er gået siden den sidste forstærkning,eksempelvis at få post, hvor du kan besøge postkassen en zillion gange om dagen, men du får stadig ikke noget før 24 timer efter dagens batch.

a. FIXED INTERVAL = fast tidsrum, i FI30 belønnes det første svar, der gives efter at der er gået 30 sekunder.

b. VARIABLE INTERVAL = variabel tidsperiode, i VI30 belønnes det første svar, der gives, efter at der er gået i gennemsnit 30 sekunder.

Hvert skema har forskellig virkning på adfærden:

FIXED INTERVAL= man får meget lidt respons efter en forstærkning, men hastigheden accelererer støt og når et højdepunkt, lige før den næste forstærkning er påkrævet. Dette kaldes en FI SCALLOP. HVAD FORTÆLLER DETTE OS OM DYR – HVAD LAVER DE? DE VURDERER TID — meget, meget vigtige konsekvenser — hvis man belønner hver time, vil adfærden kun forekomme hver time.

FIXED RATIO = man får pause og løb, belønning, derefter pause efterfulgt af mange tryk og derefter belønning.

Med VARIABLESCHEDULER (enten VI eller VR) får man meget mere regelmæssige, fordi forstærkning kan forekomme når som helst — det kan ikke forudsiges. Hvilke skemaer tror du, at Las Vegas kender alt til?

Et sidste skema – FIXED-TIME SCHEDULE – er den automatiske udlevering af en forstærker på et givet tidspunkt (f.eks. hvert andet minut). Den kan sammenlignes med en FIXED INTERVAL SCHEDULE, idet forstærkning ved en FIXED TIME SCHEDULE IKKE er betinget af nogen respons – det vil sige, at dyret forstærkes, uanset hvad det foretager sig på det pågældende tidspunkt. Skinner kaldte denne “tilfældige” forstærkning for SUPERSTITITIOUSBEHAVIOR, fordi dyret opfører sig, som om dets adfærd giver forstærkning, når intet (eller noget som helst), det gør, i virkeligheden vil resultere i, at det får belønningen.

5. RESPONS-OUTCOME-KONTINGENCER

Somdefinitioner:

APPETITIVESTIMULUS = en behagelig begivenhed.

AVERSIVESTIMULUS = en ubehagelig begivenhed.

POSITIVKONTINGENCY = en respons “tænder” en stimulus = en rotte kan trykke på stangen, som vil aktivere madmagasinet, og den vil få noget mad.

NEGATIV KONTINGENCITET = en respons “slukker” for en stimulus = en rotte kan sidde i Skinner-kassen, og eksperimentatoren kan afgive en høj lyd – hvis rotten trykker på stangen, slukkes lyden.

Fire fællesprocedurer samler vores 2 typer begivenheder (APPETITIVE og AVERSIVE) og vores 2 typer respons-udfaldskontingenser (POSITIVE og NEGATIVE):

a.POSITIVE FORSTÆRKNINGER = procedurer, hvor reaktionen tænder på enAPPETITIV STIMULUS. Hvis der opstår en reaktion, præsenteres den appetitlige stimulus. Hvis responsen ikke forekommer, præsenteres den appetitvækkende stimulus ikke. Dette er en POSITIVECONTINGENCY, og responsraten øges.

POSITIVEREINFORCEMENT

APPETITIVESTIMULUS

POSITIVECONTINGENCY

RESPONSIVECONTINGENCY

RESPONSIVINCREASES

b.STRAFNING = procedurer, hvor responsen tænder for en AVERSIV STIMULUS. Hvis responsen forekommer, modtager den den aversive stimulus. Hvis responsen ikke indtræder, får den aversive stimulus ikke. Dette er en POSITIVECONTINGENCY, og reaktionshastigheden falder.

BESTRAFNING

AVERSIVESTIMULUS

POSITIVECONTINGENCY

RESPONSERENDEREDSKABER

c.NEGATIV REINFORCERING = procedurer, hvor responsen slukker ellerforhindrer en AVERSIV STIMULUS. Hvis responsen indtræder, bliver den AVERSIVE STIUMULUS enten slet ikke tændt eller slukkes. Hvis responsen ikke indtræder, bliver den aversive stimulus tændt eller forbliver tændt. Dette er en NEGATIV CONTINGENCY, og responshastigheden stiger.

NEGATIVEREINFORCERING

AVERSIVESTIMULUS

NEGATIV KONTINGENCITET

RESPONSIVTSTYRKET

2 typer af NEGATIV KONTINGENCITET — den ene kaldesESCAPE, hvor responsen slukker for den AVERSIVE STIMULUS. Eksempel,en forsøgsleder kan tænde for en høj lyd, og rotten trykker på stangen en gang og slukker for den. Ved at udføre en reaktion har dyret undsluppet den aversive situation.

Og den anden kaldes AVOIDANCE, hvor reaktionen forhindrer en AVERSIV STIMULUS. Eksempel: En rotte kan konditioneres klassisk ved at parre et lys med et fodchok. Præsenterer man lyset, løber rotten over og trykker på stangen én gang og forhindrer, at stødet nogensinde sker. Ved at udføre denne reaktion har dyret undgået den aversive stimulus.

d.OMISSIONSTRÆNING = procedurer, hvor reaktionen slukker eller forhindrer en APPETITIV STILLING. Hvis der opstår en reaktion, bliver den appetitlige stimulus “udeladt”. Hvis responsen ikke forekommer, forekommer den appetitlige stimulus. Dette er en NEGATIV KONTINGENCITET, og responsraten falder.

OMISSIONTRAINING

APPETITIVESTIMULUS

NEGATIV KONTINGENCITET

RESPONSORERENDEREDUKTIONER

6. STIMULUSKONTROL = Et fænomen, hvor sandsynligheden for en reaktion varierer alt efter de stimuli, der er til stede på det pågældende tidspunkt. En reaktion er under stimuluskontrol, hvis dens sandsynlighed for at opstå varierer ved tilstedeværelse af forskellige stimuli.

7. GENERALISERING = Reaktion på en stimulus som følge af træning med en anden lignende stimulus. Se KLASSISK KONDITIONERING ovenfor.

8. DISCRIMINERING = Differentieret reaktion på 2 stimuli. UnderDISKRIMINATIONSTRÆNING præsenteres 2 stimuli: forstærkeren præsenteres i nærvær af den ene stimulus (S+), men ikke i nærvær af den anden (S-). Se KLASSISK KONDITIONERING ovenfor.

9. PEAK SHIFT = et skift i generaliseringsgradienten væk fra S-. Hvis forsøgspersoner får en generaliseringstest efter træning med en enkelt stimulus, vil toppen af generaliseringsgradienten være placeret ved træningsstimulusen. Hvis forsøgspersonerne imidlertid får diskriminationstræning med 2 stimuli, vil den største reaktion under generaliseringstesten ikke ske til S+, men til en stimulus, der er længere væk fra S-.

10. EXTINCTION = forstærkning afbrydes. Når EXTINCTION først indføres efter en periode med forstærkning, er der denne BURST af respons – derefter aftager responsraten gradvist. Vent til næste dag og sæt dyret tilbage i Skinner-boksen – man får SPONTAN GENOPTAGELSE i lighed med klassisk konditionering.

11. SPONTAN GENOPTAGELSE = tilbagevenden af en udslukt respons efter et tidsrum efter det sidste udslettelsesforsøg.

12. PARTIAL REINFORCEMENT EFFEKT (PRE) = Jo større andel af de reaktioner, der ikke forstærkes under træningen, jo mere vedvarende er responsen under udslettelse.

13. FRUSTRATION & EXTINCTION-INDUCERET AGGRESSION = En stigning i adfærdens styrke, der følger umiddelbart efter ikke-forstærkning af en tidligere forstærket respons; det er den følelsesmæssige reaktion, der fremkaldes af tilbagetrækningen af en forventet forstærker. Under visse omstændigheder kan frustrationen være tilstrækkelig alvorlig til at omfatte aggressive reaktioner.

Azrin, Hutchinson & Hake (1966) brugte 2 duer placeret i en Skinner-boks — den ene blev fastholdt i et hjørne, så den ikke kunne reagere, og den anden blev trænet til at hakke på en nøgle for at få forstærkning. Nøglepickeren ignorerede stort set den anden, så længe han fik sin forstærkning. Da EXTINCTION blev introduceret, angreb han den fastholdte – FRUSTRATION.

14. NEGATIV FORSTÆRKNING & AFVIKLING

NEGATIVEREFORSTÆRKNING

AVERSIVESTIMULUS

NEGATIVKONDITIONERING

RESPONERING

Studier om AFVIKLING bygger på både KLASSISK KONDITIONERING og INSTRUMENTAL KONDITIONERINGsprocedurer.

DISKRIMINERET, eller SIGNALERET AFVIKLING omfatter diskrete forsøg.

Et forsøg begynder med præsentation af en CS — f.eks. en tone.

Hvis dyret giver den ønskede respons, f.eks. løber fra den ene side af buret til den anden, har det med succes undgået chok = dette kaldes et AVOIDANCE-forsøg.

Hvis det ikke giver den ønskede respons, får det et chok. Chokket forbliver på, indtil han foretager den ønskede reaktion. Når han gør det, slukkes chokket = dette kaldes en ESCAPE-prøve.

I den tidlige del af træningen er de fleste af prøverne ESCAPE-prøver. Når dyret først har lært, at CS forudsiger US, bliver de fleste forsøg til AVVIDANCE-forsøg.

Det mest populære apparat, der anvendes ved DISCRIMINERET AFVIDANCE, kaldes en SHUTTLE BOX, som er et bur, der er adskilt i to halvdele af en bueformet dør. Hver halvdel har et separat trådgittergulv, hvorigennem vi kan lade en elektrisk strøm passere. Dyret sættes i den ene side af boksen, og CS præsenteres. Hvis dyret krydser over i den anden side af boksen, undgår det chokket. Efter et eller andet interval (f.eks. 1 minut) tændes CS igen, og rotten skal igen krydse over i det modsatte rum for at undgå stødet.

Så i hele forsøget vil rotten “pendle” frem og tilbage mellem de to sider af kassen.

15. SIDMAN AVOIDANCE = En undgåelsesprocedure, der er udtænkt af Murray Sidmanth, og som indebærer en advarselsstimulus. En aversiv hændelse som f.eks. et stød er planlagt til at indtræffe med faste tidsintervaller (stød-stød-intervallet); hvis forsøgspersonen foretager det krævede svar på et hvilket som helst tidspunkt i dette interval, udskydes det næste programmerede stød i en fast periode (svar-stød-intervallet).

16. VÆLGNINGSBEHOLDNINGSEXPERIMENTER = meget sjældent virker forstærkning på en enkelt reaktion i isolation. I stedet for blot at vælge, om vi skal reagere eller ej, står vi ofte over for et valg mellem to eller flere reaktioner, der hver især har deres egne forstærkere. Eksperimenter med valgadfærd er eksperimenter, hvor der kan foretages mere end ét svar.

Måling af responsen ved hjælp af en RELATIVE RATE OF RESPONDING-måling for hvert valg. Eksempel: En due er trænet til at hakke på enten nøgle A eller nøgle B. Den relative svarprocent for nøgle A er lig med svarene på A divideret med det samlede antal (svar på A plus svar på B)

Relativ svarprocent for nøgle A = RA/(RA+RB)

Relativ svarprocent for nøgle B = RB/(RA+RB)

Hvad sker der, hvis duen prikker det samme antal gange på A og B…., f.eks. 10 gange på hver. Hvad er den RELATIVE RATE OF RESPONDING for nøgle A? 0,5

Hvad er den relative svarprocent for tast B? 0,5

Hvad sker der, hvis duen prikker det samme antal gange på A og B…., f.eks. 8 gange på A, men kun 2 gange på B?

Hvad er den relative svarhastighed for tast A? 0,8

Hvad er den relative svarhastighed for nøgle B? 0.2

17. HERRNSTEIN’S MATCHING LAW (Herrnstein, 1961) = når du har et valg mellem flere aktiviteter, vil den procentdel af den tid, du bruger på en af disse aktiviteter, svare til den procentdel af de tilgængelige forstærkere, som du har fået fra denne aktivitet.

Eksempel 1 = VALGBEHOLDNINGSFORSØVELSE : begge nøgler (A &B) er på nøjagtig samme VI60-skema. Resultater: de vil hakke lige ofte på hver af tasterne, og de vil få lige så mange forstærkninger på tast A som på tast B — så FORSTÆRKNINGSHURTIGHEDEN vil være lige stor.

Eksempel 2 = VÆLG FORHOLDSFORSØGELSE : Tast A har et VI6min skema i en time, hvad er det absolut maksimale antal forstærkninger, som en due kan få? 10 (fordi der er10 6-minutters intervaller i en time). Nøgle B har et VI2-minutters skema – hvad er det absolut maksimale antal forstærkninger, som en due kan få i en time? 30 (der er 30 2-minutters intervaller i en time). Det er altså 3 gange det antal, der er muligt på nøgle A.

Resultater: duen vil MATCHE antallet af svar til sandsynligheden for at blive forstærket — den vil svare 3 gange så ofte på nøgle B sammenlignet med nøgle A.

18. KONTRAST EFFEKTER = En ændring i en forstærkeres effektivitet på grund af tidligere erfaringer med andre forstærkere (normalt “skiftes” en forstærker ud med en anden, der har et andet niveau af positiv eller negativ valens). Virkningerne af et skift i belønning blev oprindeligt påvist af Crespi – faktisk blev adfærdsændringer efter skift i belønning samlet set kaldt “CRESPI EFFEKTEN”. En nyere undersøgelse blev foretaget af Mellgren (1972).

Mellgren tog grupper af rotter i en løbebane

I fase 1– Gruppe 1 og 2 fik 2 foderpiller, hver gang de løb ned ad løbebanen. Gruppe 3 & 4 fik 22 pellets mad.

I fase 2– halvdelen af rotterne blev “skiftet”. Så gruppe 1 = forblev den samme og fik 2 pellets (Small-Small); gruppe 2 = blev flyttet opad og fik 22 pellets (Small-Large); gruppe 3 = forblev den samme og fik 22 pellets (Large-Large); og gruppe 4 = blev flyttet nedad og fik 2 pellets (Large-Small)

Resultater:

Gruppen Small-Small ændrede sig ikke meget

Gruppen Large-large ændrede sig ikke meget.

Men rotter, der skiftede fra en lille til en stor belønning, løb hurtigere for den store belønning end de rotter, der hele tiden havde modtaget den store belønning. Dette kaldes en POSITIV BEHOLDNINGSKONTRAST – så en POSITIV BEHOLDNINGSKONTRAST defineres som øget respons for en gunstig belønning på grund af tidligere erfaring med et mindre attraktivt resultat.

Og rotter, der skiftede fra en stor til en lille belønning, løb langsommere for den lille belønning end de rotter, der hele tiden havde modtaget den lille belønning. Og dette kaldes en NEGATIV BEHAVIORAL KONTRAST – så en NEGATIV BEHAVIORAL KONTRAST er defineret som en deprimeret reaktion på en ugunstig belønning på grund af tidligere erfaring med et bedre resultat.

Virtual world

INSTRUMENTEL KONDITIONERING

Skriv et svar Annuller svar

Seneste indlæg