CONDIȚIONAREA INSTRUMENTALĂ

1. THORNDIKE’S PUZZLE BOX = pisicile flămânde trebuiau să învețe să evadeze pentru a obține un castron cu mâncare — Thorndike a măsurat LATENȚA de a evada. Rezultate = peste încercări, LATENȚA a scăzut

natura treptată a curbei l-a convins pe Thorndike că animalele nu și-au format o înțelegere rațională a situației, ci mai degrabă că RECOMPENSA ALIMENTARĂ a imprimat în mod gradual o asociere între CUVINTELE DIN CUTIA DE PUZZLE și EVADARE. El și-a formalizat convingerea în „LEGEA EFECTULUI”

„CÂND ARESPONDEREA ESTE URMATĂ în mod repetat de o stare de fapt satisfăcătoare, acea reacție va crește în frecvență”

2. PROCEDURI DE PROBE DISCRETE = în timpul antrenamentului, 1) fiecare probă se termină atunci când scoateți animalul din aparat și 2) răspunsul instrumental este executat o singură dată în timpul fiecărei probe. De obicei, procedurile de încercări discrete folosesc un anumit tip de labirint.

Utilizarea labirinturilor a fost inițiată de W.S. SMALL la Universitatea Clark pentru a putea studia învățarea la șobolani.

S-a inspirat dintr-un articol din Scientific American care descria cum șobolanii trăiesc în vizuini subterane și trebuie să se descurce tot timpul prin pasaje „labirintice” – așa că a împrumutat din natură – adică a adus natura în laborator și a creat ceea ce a crezut că este echivalentul acestor labirinturi subterane.

Măsurăm 1)VITEZA DE CĂLĂTORIE = cât de repede poate ajunge un animal de la cutia de start la cutia de țintă –de obicei crește pe parcursul încercărilor — animalele devin mai rapide; sau 2) LATENȚA = timpul necesar pentru ca animalele să părăsească cutia de start și să înceapă să se deplaseze pe alee –de obicei se scurtează pe parcursul încercărilor — animalele devin mai rapide.

3. PROCEDURI CU OPERATOR LIBER = proceduri care implică răspunsuri date de animale în ritmul stabilit de acestea (de ex, ele sunt „libere” să opereze asupra mediului în care se află, răspunzând oricând doresc și oricât de des doresc). Skinner a eliminat cu totul labirintul și a proiectat o cameră care avea cutia de start și cutia de scop în același loc, astfel încât animalul nu trebuia să alerge nicăieri și a construit „cutia Skinner” – sau camera operantă.

etape în cadrul antrenamentului:

PRIMUL PAS =Încadrarea în metaforă = sunetul de livrare a hranei (condiționarea clasică de urmărire a semnelor!)

2EA ETAPĂ =SHAPING = recompensarea apropierilor succesive ale comportamentului dorit

Măsurați comportamentul animalului cu ajutorul unui ÎNREGISTROR CUMULATIV.

Este un dispozitiv care are un tambur rotativ care scoate hârtia la o rată constantă – un pix pe hârtie. Dacă nu apare nici un răspuns, stiloul rămâne nemișcat și desenează o linie orizontală, plată, pe măsură ce hârtia iese din aparat. Dacă un animal execută o apăsare de pârghie, stiloul urcă o treaptă pe hârtie și rămâne așa – următorul răspuns urcă stiloul încă o treaptă și așa mai departe – se numește cumulativ pentru că se poate măsura numărul total de răspunsuri prin simpla observare a distanței verticale dintre locul de unde a pornit stiloul și locul unde s-a oprit după ce animalul a încetat să mai răspundă.

DISTANȚA VERTICALĂ = numărul total de răspunsuri

DISTANȚA ORIZONTALĂ = cât timp s-a scurs

PICIORUL LINIII = rata de răspuns (cât de repede a apăsat animalul bara)

4. SCHEMELE DE REFORȚARE =Reguli care determină când un răspuns va fi întărit.

REFORȚARE CONTINUĂ (CRF) = fiecare răspuns este întărit.

REFORȚARE PARȚIALĂ sau INTERMITENTĂ — 2 tipuri: Raport & Interval

1. RATIO SCHEDULE =reforțarea depinde de numărul de răspunsuri emise, exemplu munca „la bucată” unde oamenii sunt plătiți în funcție de numărul de articole pe care le fac(NU în funcție de cât timp le ia să le facă)

a. FIXED RATIO = număr fix, în FR30 fiecare al 30-lea răspuns este recompensat.

b. VARIABLE RATIO = număr variabil, în VR30 o medie de 30 de răspunsuri sunt recompensate.

2. INTERVAL SCHEDULE =reforțarea depinde de cât timp a trecut de la ultima întărire,exemplu primirea corespondenței unde poți vizita cutia poștală de un miliard de ori pe zi dar tot nu vei primi nimic până la 24 de ore după lotul de azi.

a. FIXED INTERVAL = perioadă fixă de timp, în FI30 se recompensează primul răspuns dat după ce s-au scurs 30 de secunde.

b. VARIABLE INTERVAL = perioadă de timp variabilă, în VI30 se recompensează primul răspuns dat după ce a trecut o medie de 30 de secunde.

Care program are un efect diferit asupra comportamentului:

INTERVALOARE FIXĂ= se obține un răspuns foarte mic după o întărire, dar rata de răspuns accelerează în mod constant și atinge un vârf chiar înainte de următoarea întărire. Acest lucru se numește un SCALOP FI. CE NE SPUNE ACEST LUCRU DESPRE ANIMALE – CE FAC ELE? EI JUDICĂ TIMPUL — Implicații foarte, foarte importante — dacă recompensezi la fiecare oră, atunci comportamentul va apărea doar la fiecare oră.

Raportul FIZIC =obțineți pauză și fugă, recompensă, apoi pauză urmată de mai multe apăsări, apoi recompensă.

Cu REGULI VARIABILE (fie VI, fie VR) obțineți mult mai multă regularitate, deoarece întărirea poate avea loc în orice moment — nu poate fi prezisă. Despre care program(e) credeți că Las Vegasul știe totul?

Un ultim program – PROGRAMUL CU TIMP FIXE este livrarea automată a unui întăritor la un moment dat (de exemplu, la fiecare 2 minute). Poate fi comparat cu un PROGRAM FIXE DE INTERVALURI FIXE în sensul că la un PROGRAM FIXE DE TIMP,întărirea NU este condiționată de nici un răspuns – adică animalul estereforțat indiferent de ceea ce face în acel moment. Skinner a numit această întărire „accidentală” SUPERSTITIOUSBEHAVIOR pentru că animalul se comportă ca și cum comportamentul său produce întărire când, în realitate, nimic (sau nimic) din ceea ce face nu va duce la obținerea recompensei.

5. CONTINGENȚE RESPONZII – REZULTATE

Somedefiniții:

APPETITIVITATE = Un eveniment plăcut.

AVERSIVITATE = Un eveniment neplăcut.

CONTINGENȚĂ POSITIVĂ = un răspuns „pornește” un stimul = un șobolan poate apăsa bara care va activa magazia de mâncare și va primi mâncare.

CONTINGENȚĂ NEGATIVĂ = un răspuns „dezactivează” un stimul = un șobolan poate sta în cutia Skinner și experimentatorul poate emite un zgomot puternic – dacă șobolanul apasă pe bară, zgomotul va fi dezactivat.

Cele patru proceduri comune reunesc cele 2 tipuri de evenimente (APPETITIVE și AVERSIVE) și cele 2 tipuri de contingențe răspuns-rezultat (POSITIVE și NEGATIVE):

a.RĂSPUNSUL POSITIV = procedee în care răspunsul pornește un STIMULENT APPETITIV. Dacă se produce răspunsul, atunci este prezentat stimulul apetisant. Dacă nu apare răspunsul, atunci stimulul apetisant nu este prezentat. Aceasta este o CONTINGENȚĂ POSITIVĂ și rata de răspuns crește.

INFORMAȚIE POSITIVĂ

STIMULUS APPETITIV

CONTINGENȚĂ POSITIVĂ

INCREȘTEREA RĂSPUNSULUI

b.PEDEAPSĂ = proceduri în care răspunsul pornește un STIMULENT AVERSIV. Dacă se produce răspunsul, acesta primește stimulul aversiv. Dacă răspunsul nu se produce, atunci stimulul aversiv nu este prezentat. Aceasta este o CONTINGENȚĂ POSITIVĂ, iar rata de răspuns scade.

PUNCTURĂ

STIMULUL AVVERSIV

CONTINGENȚĂ POSITIVĂ

RĂSPUNSULDECREȘTE

c.RĂSPUNS NEGATIV = proceduri în care răspunsul oprește sauprevine o STIMULARE AVERSIVĂ. În cazul în care se produce răspunsul, STIUMUL AVERSIV fie nu se activează deloc, fie se oprește. Dacă răspunsul nu se produce, atunci stimulul aversiv se activează sau rămâne activat. Aceasta este o CONTINGENȚĂ NEGATIVĂ și rata de răspuns crește.

INFORMAȚIE NEGATIVĂ

STIMULUL NEGATIV

CONTINGENȚĂ NEGATIVĂ

REACȚIE DE RĂSPUNS CREȘTE

2 tipuri de CONTINGENȚĂ NEGATIVĂ – una se numește ESCAPE în care răspunsul oprește STIMULULUL AVERSIV. Exemplu,un experimentator poate porni un zgomot puternic, iar șobolanul apasă o dată pe bară și îl oprește. Prin efectuarea unui răspuns, animalul a EVADAT din situația aversivă.

Și cealaltă se numește EVITARE, în care răspunsul previne STIMULULAREA AVERSIVĂ. Exemplu, un șobolan poate fi condiționat în mod clasic prin asocierea unei lumini cu un șoc la picior. Prezentați lumina, iar șobolanul aleargă și apasă o dată pe bară și împiedică șocul să se producă vreodată. Efectuând acest răspuns, animalul a EVITAT stimulul aversiv.

d.ÎNVĂȚĂMÂNTAREA PRIN OMISIUNE = proceduri în care răspunsul oprește sau previne un STIMUL APPETITIV. Dacă se produce răspunsul, atunci STIMULUL APPETITIV este „omis”. Dacă răspunsul nu apare, atunci stimulul apetisant apare. Aceasta este o CONTINGENȚĂ NEGATIVĂ și rata de răspuns scade.

Învățarea prin omisiune

STIMULUL APPETITIV

CONTINGENȚĂ NEGATIVĂ

Răspunsul scade

6. CONTROLUL STIMULILOR = Fenomen în care probabilitatea unui răspuns variază în funcție de stimulii prezenți în acel moment. Un răspuns este sub controlul stimulilor dacă probabilitatea de apariție a acestuia diferă în prezența unor stimuli diferiți.

7. GENERALIZARE = Răspunsul la un stimul datorită antrenamentului care implică un alt stimul similar. A se vedea CONDIȚIONAREA CLASICĂ de mai sus.

8. DISCRIMINAREA = Răspunsul diferențiat la 2 stimuli. În timpul ÎNVĂȚĂMÂNTĂRII DE DISCRIMINAȚIE, sunt prezentați 2 stimuli: întăritorul este prezentat în prezența unui stimul (S+), dar nu și în prezența celuilalt (S-). A se vedea CONDIȚIONAREA CLASICĂ de mai sus.

9. PEAK SHIFT = o deplasare a gradientului de generalizare în afara lui S-. Dacă subiecții sunt supuși unui test de generalizare în urma antrenamentului cu un singur stimul, vârful gradientului de generalizare va fi localizat la stimulul de antrenament. Cu toate acestea, dacă subiecții sunt supuși unui antrenament de discriminare care implică 2 stimuli, cel mai mare răspuns în timpul testului de generalizare are loc nu la S+, ci la un stimul mai îndepărtat de S-.

10. EXTINCERE = întărirea este întreruptă. Când EXTINCȚIA este introdusă pentru prima dată după o perioadă de întărire,există această EXPLOZIE a răspunsului – apoi rata de răspuns scade treptat. Așteptați până a doua zi și puneți animalul înapoi în cutia Skinner – veți obține o RECUPERARE SPONTANĂ asemănătoare condiționării clasice.

11. RECUPERAREA SPONTANĂ = revenirea unui răspuns stins după o perioadă de timp de la ultima încercare de stingere.

12. EFECTUL REFORȚĂRII PARȚIALE (PRE) = cu cât este mai mare proporția de răspunsuri care nu sunt întărite în timpul antrenamentului, cu atât mai persistent este răspunsul în timpul extincției.

13. FRUSTRAREA & AGRESIUNE INDUCUTĂ DE EXTINCȚIE = O creștere a vigorii comportamentului care urmează imediat după neforțarea unui răspuns întărit anterior; este răspunsul emoțional indus de retragerea unui întăritor așteptat. În anumite circumstanțe, frustrarea poate fi suficient de severă pentru a include reacții agresive.

Azrin, Hutchinson & Hake (1966) a folosit 2 porumbei plasați într-o cutie Skinner – unul a fost imobilizat într-un colț astfel încât să nu poată răspunde, iar celălalt a fost antrenat să ciugulească o cheie pentru întărire. Practic, cel care ciugulea cheia l-a ignorat pe celălalt atâta timp cât primea întărirea. Când a fost introdusă EXTINCȚIA, el l-a atacat pe cel imobilizat — FRUSTRAȚIE.

14. REINFORȚAREA NEGATIVĂ & AVOIDENȚA

REFORȚAREA NEGATIVĂ

AVERSIVESTIMULUS

REINFORȚAREA NEGATIVĂ

REINFORȚAREA NEGATIVĂ

REINFORȚAREA NEGATIVĂ

Studiile privind AVOIDENȚA se bazează atât pe procedurile de CONDIȚIONARE CLASICĂ cât și pe cele de CONDIȚIONARE INSTRUMENTALĂ.

AVOIDENȚA DISCRIMINATĂ,sau SEMNALIZATĂ implică încercări discrete.

Un proces începe cu prezentarea unui CS – cum ar fi un ton.

Dacă animalul dă răspunsul dorit, cum ar fi să fugă dintr-o parte în alta a cuștii, atunci a EVITAT cu succes șocul = acesta se numește proces de EVITARE.

Dacă nu dă răspunsul dorit, primește un șoc. Șocul rămâne până când el dă răspunsul dorit. Când o face, șocul este oprit = aceasta se numește încercare de EVADARE.

În prima parte a antrenamentului, majoritatea încercărilor sunt încercări de EVADARE. Odată ce animalul învață că CS prezice US, atunci majoritatea încercărilor devin încercări de EVADARE.

Cel mai popular aparat folosit în EVADAREA DISCRIMINATĂ se numește SHUTTLE BOX, care este o cușcă separată în 2 jumătăți de o ușă cu arcadă. Fiecare jumătate are o podea separată cu grilă de sârmă prin care putem trece un curent electric. Animalul este așezat într-o parte a cutiei, iar CS este prezentat. Dacă animalul trece în cealaltă parte a cutiei, el evită șocul. După un fel de interval intertrial (să zicem 1 minut), CS va fi pornit din nou și șobolanul va trebui să treacă din nou în compartimentul opus pentru a evita șocul.

Astfel, pe tot parcursul experimentului, șobolanul va face „naveta” înainte și înapoi între cele 2 părți ale cutiei.

15. SIDMAN AVOIDANCE = O procedură de evitare concepută de Murray Sidmant care implică un stimul de avertizare. Un eveniment negativ, cum ar fi un șoc, este programat să apară la intervale de timp fixe (intervalul șoc-șoc); dacă subiectul dă răspunsul cerut în orice moment în timpul acestui interval, următorul șoc programat este amânat pentru o perioadă fixă (intervalul răspuns-șoc).

16. EXPERIMENTE DE ALEGERE A COMPORTAMENTULUI = foarte rar întărirea acționează asupra unui singur răspuns în izolare. În loc să alegem pur și simplu dacă să dăm sau nu un răspuns, ne confruntăm adesea cu o alegere între două sau mai multe răspunsuri, fiecare cu un set de întăriri proprii. Experimentele de alegere a comportamentului sunt cele în care se poate da mai mult de un răspuns.

Măsurați răspunsul folosind o măsură a RATEI RELATIVE DE RĂSPUNS pentru fiecare alegere. Exemplu, un porumbel este antrenat să ciugulească fie la tasta A, fie la tasta B. Rata relativă de răspuns pentru cheia A, care ar fi egală cu răspunsurile de pe A împărțite la totalul (răspunsurilor de pe A plus răspunsurile de pe B)

Rata relativă de răspuns pentru cheia A = RA/(RA+RB)

Rata relativă de răspuns pentru cheia B = RB/(RA+RB)

Ce se întâmplă dacă porumbelul ciugulește de același număr de ori pe A și B…., să zicem de 10 ori pe fiecare. Care este RITMUL RELATIV DE RĂSPUNS pentru cheia A? 0.5

Ce este rata relativă de răspuns pentru tasta B? 0.5

Ce se întâmplă dacă porumbelul ciugulește de același număr de ori pe A și B…., să zicem de 8 ori pe A, dar numai de 2 ori pe B?

Care este RATA RELATIVĂ DE RĂSPUNS pentru tasta A? 0.8

Care este rata relativă de răspuns pentru tasta B? 0.2

17. LEGEA DE CORESPONDENȚĂ A LUI HERRNSTEIN (Herrnstein, 1961) = atunci când aveți de ales între mai multe activități, procentul de timp pe care îl dedicați uneia dintre aceste activități va corespunde procentului de întăriri disponibile pe care le-ați obținut din această activitate.

Exemplu 1 = EXPERIMENT DE ALEGERE A COMPORTAMENTULUI: ambele chei (A &B) sunt pe exact același program VI60. Rezultate: vor ciuguli la fel de des pe fiecare dintre chei și vor primi la fel de multe întăriri pe cheia A ca și pe cheia B — deci rata de întărire va fi egală.

Exemplul 2 = EXPERIMENT DE ALEGERE A COMPORTAMENTULUI : Cheia A are un program VI6min într-o oră, care este numărul maxim absolut de întăriri pe care le poate primi porumbelul? 10 (pentru că sunt 10 intervale de 6 minute într-o oră). Cheia B are un program VI2 min – într-o oră, care este numărul maxim absolut de întăriri pe care le poate primi un porumbel? 30 (există 30 de intervale de 2 minute într-o oră). Deci este de 3 ori mai mare decât numărul posibil la cheia A.

Rezultate: porumbelul va COORDONA numărul de răspunsuri cu probabilitatea de a fi întărit — el va răspunde de 3 ori mai des la cheia B în comparație cu cheia A.

18. EFECTE DE CONTRASTE = O modificare a eficacității unui întăritor datorităexperienței anterioare cu alte întăritori (de obicei un întăritor este „schimbat „cu un altul care are un nivel diferit de valență pozitivă sau negativă). Efectele unei schimbări de recompensă au fost demonstrate inițial de Crespi – de fapt, schimbările de comportament în urma schimbărilor de recompensă au fost denumite colectiv „EFECTUL CRESPI”. Un studiu mai recent a fost realizat de Mellgren (1972).

Mellgren a luat grupuri de șobolani pe o pistă

În timpul fazei 1– Grupul 1 și 2 au primit câte 2 pelete de mâncare de fiecare dată când au alergat pe pistă. Grupul 3 & 4 a primit 22 de pelete de hrană.

În timpul fazei 2– jumătate dintre șobolani au fost „mutați”. Astfel, Grupul 1 = a rămas la fel și a primit 2 pelete (Small-Small); Grupul 2 = a fost mutat în sus și a primit 22 de pelete (Small-Large); Grupul 3 = a rămas la fel și a primit 22 de pelete (Large-Large); și Grupul 4 = a fost mutat în jos și a primit 2 pelete (Large-Small)

Rezultate:

Grupul Small-Small nu s-a schimbat prea mult

Grupul Large-large nu s-a schimbat prea mult.

Dar, șobolanii schimbați de la o recompensă mică la una mare au alergat mai repede pentru recompensa mare decât cei care au primit recompensa mare tot timpul. Acest lucru se numește un CONTRAST COMPORTAMENTAL POSITIV – deci un CONTRAST COMPORTAMENTAL POSITIV este definit ca un răspuns crescut pentru o recompensă favorabilă din cauza unei experiențe anterioare cu un rezultat mai puțin atractiv.

Și șobolanii trecuți de la o recompensă mare la una mică au alergat mai încet pentru recompensa mică decât cei care au primit tot timpul recompensa mică. Și acest lucru se numește un CONTRAST COMPORTAMENTAL NEGATIV – deci un CONTRAST COMPORTAMENTAL NEGATIV este definit ca răspuns deprimat pentru o recompensă nefavorabilădin cauza experienței anterioare cu un rezultat mai bun.

Lasă un răspuns

Adresa ta de email nu va fi publicată.