Condiționarea operantă, denumită uneori condiționare instrumentală, este o metodă de învățare care folosește recompense și pedepse pentru comportament. Prin condiționarea operantă, se face o asociere între un comportament și o consecință (negativă sau pozitivă) pentru comportamentul respectiv.
De exemplu, atunci când șobolanii de laborator apasă o pârghie atunci când este aprinsă o lumină verde, primesc o peletă alimentară ca recompensă. Când apasă maneta când este aprinsă o lumină roșie, primesc un șoc electric ușor. Drept urmare, ei învață să apese maneta atunci când lumina verde este aprinsă și să evite lumina roșie.
Dar condiționarea operantă nu este doar ceva care are loc în medii experimentale în timpul antrenamentului animalelor de laborator. De asemenea, joacă un rol puternic în învățarea de zi cu zi. Întărirea și pedepsirea au loc tot timpul în medii naturale, precum și în medii mai structurate, cum ar fi sălile de clasă sau sesiunile de terapie.
Istoria condiționării operante
Condiționarea operantă a fost descrisă pentru prima dată de comportamentistul BF Skinner, motiv pentru care s-ar putea să-l auzi ocazional denumit condiționare skinneriană. . În schimb, a sugerat el, ar trebui să ne uităm doar la cauzele externe, observabile ale comportamentului uman.
Prin prima parte a secolului XX, conductismul a devenit o forță majoră în cadrul psihologiei. Ideile lui John B. Watson au dominat această școală de gândire încă de la început. Watson s-a concentrat pe principiile condiționării clasice, sugerând cândva că ar putea lua orice persoană indiferent de fondul său și să-i antreneze să fie orice a ales.
Primii comportamentaliști și-au concentrat interesele asupra învățării asociative. Skinner era mai interesat de modul în care consecințe a acțiunilor oamenilor le-a influențat comportamentul.
Skinner a folosit termenul operant să se refere la orice „comportament activ care operează asupra mediului pentru a genera consecințe”. Teoria lui Skinner a explicat modul în care dobândim gama de comportamente învățate pe care le prezentăm în fiecare zi.
Teoria sa a fost puternic influențată de munca psihologului Edward Thorndike, care propusese ceea ce el numea legea efectului. Conform acestui principiu, acțiunile care sunt urmate de rezultate dezirabile sunt mai susceptibile de a fi repetate în timp ce cele urmate de rezultate nedorite. sunt mai puțin probabil să se repete.
Condiționarea operantă se bazează pe o premisă destul de simplă: acțiunile care sunt urmate de întărire vor fi consolidate și mai susceptibile de a se repeta în viitor. Dacă spuneți o poveste amuzantă în clasă și toată lumea râde, probabil că veți avea mai multe șanse să spuneți din nou acea poveste în viitor.
Dacă ridici mâna pentru a pune o întrebare și profesorul tău laudă comportamentul tău politicos, vei fi mai probabil să ridici mâna data viitoare când ai o întrebare sau un comentariu. Deoarece comportamentul a fost urmat de întărire sau de un rezultat dezirabil, acțiunea precedentă este întărită.
În schimb, acțiunile care duc la pedepse sau consecințe nedorite vor fi slăbite și mai puțin probabil să se repete în viitor. Dacă povestiți din nou aceeași poveste în altă clasă, dar nimeni nu râde de data aceasta, veți fi mai puțin probabil să repetați povestea din nou în viitor. Dacă strigi un răspuns la clasă și profesorul tău te certă, atunci este mai puțin probabil să întrerupi din nou cursul.
Tipuri de comportamente
Skinner a făcut distincția între două tipuri diferite de comportamente
- Comportamentele respondentului sunt cele care apar automat și reflex, cum ar fi să vă trageți mâna înapoi de pe o sobă fierbinte sau să vă smuciți piciorul atunci când medicul vă atinge genunchiul. Nu trebuie să înveți aceste comportamente. Ele apar pur și simplu automat și involuntar.
- Comportamente operantepe de altă parte, sunt cei aflați sub controlul nostru conștient. Unele pot apărea spontan și altele în mod intenționat, dar consecințele acestor acțiuni influențează apoi dacă acestea apar sau nu din nou în viitor. Acțiunile noastre asupra mediului și consecințele acțiunii respective alcătuiesc o parte importantă a procesului de învățare.
În timp ce condiționarea clasică ar putea explica comportamentele respondenților, Skinner și-a dat seama că nu poate explica o mare parte a învățării. În schimb, Skinner a sugerat că condiționarea operantă deținea o importanță mult mai mare.
Skinner a inventat diferite dispozitive în copilărie și a pus aceste abilități în funcțiune în timpul studiilor sale de condiționare operantă. El a creat un dispozitiv cunoscut sub numele de cameră de condiționare operantă, adesea denumită astăzi ca o cutie Skinner. Camera ar putea deține un animal mic, cum ar fi un șobolan sau un porumbel. Cutia conținea și o bară sau o tastă pe care animalul o putea apăsa pentru a primi o recompensă.
Pentru a urmări răspunsurile, Skinner a dezvoltat și un dispozitiv cunoscut sub numele de înregistrator cumulativ. Dispozitivul a înregistrat răspunsurile ca o mișcare ascendentă a unei linii, astfel încât ratele de răspuns să poată fi citite, uitându-se la panta liniei.
Componentele condiționării operante
Există mai multe concepte cheie în condiționarea operantă.
Armare în condiționarea operantă
Întărirea este orice eveniment care întărește sau mărește comportamentul pe care îl urmează. Există două tipuri de armături. În ambele cazuri de întărire, comportamentul crește.
- Armături pozitive sunt evenimente sau rezultate favorabile care sunt prezentate după comportament. În situațiile de întărire pozitivă, un răspuns sau un comportament este întărit prin adăugarea de laudă sau o recompensă directă. Dacă faci o treabă bună la locul de muncă și managerul tău îți oferă un bonus, acel bonus este un întăritor pozitiv.
- Armături negative implică înlăturarea unor evenimente sau rezultate nefavorabile după afișarea unui comportament. În aceste situații, un răspuns este întărit prin eliminarea a ceva considerat neplăcut. De exemplu, dacă copilul tău începe să țipe în mijlocul unui restaurant, dar se oprește odată ce le-ai înmânat o delicatese, acțiunea ta a dus la eliminarea stării neplăcute, întărindu-ți negativ comportamentul (nu copilul tău).
Pedeapsă în condiționarea operantă
Pedeapsa este prezentarea unui eveniment sau rezultat advers care determină o scădere a comportamentului pe care îl urmează. Există două tipuri de pedepse. În ambele cazuri, comportamentul scade.
- Pedeapsă pozitivă, denumit uneori pedeapsă prin cerere, prezintă un eveniment sau un rezultat nefavorabil pentru a slăbi răspunsul pe care îl urmează. Spankingul pentru comportament greșit este un exemplu de pedeapsă prin aplicare.
- Pedeapsă negativă, cunoscută și sub numele de pedeapsă prin îndepărtare, apare atunci când un eveniment sau un rezultat favorabil este eliminat după apariția unui comportament. Scoaterea jocului video al unui copil în urma unui comportament necorespunzător este un exemplu de pedeapsă negativă.
Programele de întărire
Întărirea nu este neapărat un proces simplu și există o serie de factori care pot influența cât de repede și cât de bine se învață lucrurile noi. Skinner a constatat că cand și cât de des comportamentele au fost întărite au jucat un rol în viteza și puterea de achiziție. Cu alte cuvinte, momentul și frecvența întăririi au influențat modul în care au fost învățate comportamentele noi și modul în care au fost modificate comportamentele vechi.
Skinner a identificat mai multe planuri diferite de întărire care au impact asupra procesului de condiționare operantă:
- Armare continuă implică livrarea unei întăriri de fiecare dată când apare un răspuns. Învățarea tinde să apară relativ repede, totuși rata de răspuns este destul de scăzută. De asemenea, dispariția are loc foarte repede odată ce armarea este oprită.
- Programări cu raport fix sunt un tip de armare parțială. Răspunsurile sunt întărite numai după ce au apărut un anumit număr de răspunsuri. Acest lucru duce de obicei la o rată de răspuns destul de constantă.
- Programări cu intervale fixe sunt o altă formă de întărire parțială. Întărirea are loc numai după ce a trecut un anumit interval de timp. Ratele de răspuns rămân destul de stabile și încep să crească pe măsură ce timpul de armare se apropie, dar încet imediat după livrarea armăturii.
- Programări cu raport variabil sunt, de asemenea, un tip de întărire parțială care implică un comportament de întărire după un număr variat de răspunsuri. Acest lucru duce atât la o rată de răspuns ridicată, cât și la rate de dispariție lente.
- Programări cu intervale variabile sunt forma finală de armare parțială descrisă de Skinner. Acest program implică furnizarea de armături după ce a trecut o perioadă de timp variabilă. Acest lucru tinde, de asemenea, să conducă la o rată de răspuns rapidă și o rată de dispariție lentă.
Exemple de condiționare operantă
Putem găsi exemple de condiționare operantă la locul de muncă în jurul nostru. Luați în considerare cazul copiilor care își îndeplinesc temele pentru a câștiga o recompensă de la un părinte sau profesor sau angajații care termină proiectele pentru a primi laude sau promoții. Mai multe exemple de condiționare operantă în acțiune includ:
- După ce jucați într-o piesă de teatru comunitar, primiți aplauze din partea publicului. Aceasta acționează ca un întăritor pozitiv, inspirându-vă să încercați pentru mai multe roluri de performanță.
- Îți antrenezi câinele să-l aducă, oferindu-i laude și o bătaie în cap ori de câte ori îndeplinește corect comportamentul. Aceasta este alta întăritor pozitiv.
- Un profesor le spune studenților că, dacă au o prezență perfectă tot semestrul, atunci nu trebuie să susțină examenul final complet. Prin eliminarea unui stimul neplăcut (testul final), elevii sunt întărit negativ să participi regulat la curs.
- Dacă nu reușești să predai un proiect la timp, șeful tău se enervează și îți reproșează performanța în fața colegilor tăi de muncă. Aceasta acționează ca un pedepsitor pozitiv, făcând mai puțin probabil ca în viitor să finalizați proiectele.
- O adolescentă nu își curăță camera așa cum i sa cerut, așa că părinții îi iau telefonul pentru restul zilei. Acesta este un exemplu de pedeapsă negativă în care se ia un stimul pozitiv.
În unele dintre aceste exemple, promisiunea sau posibilitatea recompenselor determină o creștere a comportamentului. Condiționarea operantă poate fi, de asemenea, utilizată pentru a reduce un comportament prin eliminarea unui rezultat dorit sau prin aplicarea unui rezultat negativ. De exemplu, unui copil i se poate spune că își va pierde privilegiile de reces, dacă vorbește la rândul său la clasă. Acest potențial de pedeapsă poate duce la scăderea comportamentelor perturbatoare.
Un cuvânt de la Verywell
În timp ce comportamentismul ar fi putut pierde o mare parte din dominația pe care o deținea la începutul secolului al XX-lea, condiționarea operantă rămâne un instrument important și adesea folosit în procesul de învățare și de modificare a comportamentului. Uneori consecințele naturale duc la schimbări în comportamentul nostru. În alte cazuri, recompensele și pedepsele pot fi repartizate în mod conștient pentru a crea o schimbare.
Condiționarea operantă este un lucru pe care l-ați putea recunoaște imediat în propria viață, indiferent dacă este vorba de abordarea dvs. de a-i învăța pe copiii voștri un comportament bun sau de a antrena câinele familiei. Amintiți-vă că orice tip de învățare necesită timp. Luați în considerare tipul de armare sau pedeapsă care poate funcționa cel mai bine pentru situația dvs. unică și evaluați ce tip de program de armare ar putea duce la cele mai bune rezultate.