Cum funcționează programele de întărire

Condiționarea operantă este un proces de învățare în care noi comportamente sunt dobândite și modificate prin asocierea lor cu consecințe. Întărirea unui comportament crește probabilitatea ca acesta să apară din nou în viitor, în timp ce pedepsirea unui comportament scade probabilitatea ca acesta să fie repetat.

În condiționarea operantă, programele de întărire sunt o componentă importantă a procesului de învățare. Când și cât de des întărim un comportament poate avea un impact dramatic asupra puterii și ratei răspunsului.

Programul de întărire

Un program de întărire este în esență o regulă care stabilește ce instanțe de comportament vor fi întărite. În unele cazuri, un comportament poate fi întărit de fiecare dată când apare. Uneori, un comportament ar putea să nu fie deloc întărit.

Fie o armare pozitivă sau o armare negativă pot fi utilizate ca parte a condiționării operante. În ambele cazuri, scopul consolidării este de a întări un comportament, astfel încât acesta să apară din nou.

Programele de întărire au loc atât în situații de învățare naturale, cât și în situații de instruire mai structurate. În setările din lumea reală, comportamentele probabil nu vor fi întărite de fiecare dată când apar. În situațiile în care încercați în mod intenționat să consolidați o acțiune specifică (cum ar fi la școală, sport sau antrenament pentru animale), urmați un program specific de întărire.

Unele programe sunt mai potrivite anumitor tipuri de situații de antrenament. În unele cazuri, antrenamentul ar putea necesita un program și apoi să treacă la altul odată ce comportamentul dorit a fost predat.

Tipuri de programe de întărire

Cele două forme fundamentale ale programelor de armare sunt denumite armături continue și armături parțiale.

Armare continuă

În armarea continuă, comportamentul dorit este întărit de fiecare dată când apare. Acest program este cel mai bine folosit în etapele inițiale ale învățării pentru a crea o asociere puternică între comportament și răspuns.

Imaginați-vă, de exemplu, că încercați să învățați un câine să vă dea mâna. În timpul etapelor inițiale de învățare, te-ai ține de un program continuu de întărire pentru a preda și a stabili comportamentul. Acest lucru ar putea implica apucarea labei câinelui, scuturarea acestuia, rostirea „agitării” și apoi oferirea unei recompense de fiecare dată când efectuați acești pași. În cele din urmă, câinele va începe să efectueze singuri acțiunea.

Programele de întărire continuă sunt cele mai eficiente atunci când se încearcă predarea unui nou comportament. Denotă un model la care fiecare răspuns limitat este urmat de o consecință limitată.

Armare parțială

Odată ce răspunsul este stabilit cu fermitate, un program de armare continuă este de obicei trecut la un program de armare parțială. În armarea parțială (sau intermitentă), răspunsul este întărit doar o parte din timp. Comportamentele învățate sunt dobândite mai lent cu întărirea parțială, dar răspunsul este mai rezistent la dispariție.

Gândiți-vă la exemplul anterior în care învățați un câine să se agite și. În timp ce ați folosit inițial armarea continuă, întărirea comportamentului de fiecare dată este pur și simplu nerealistă. În timp, ați trece la un program parțial pentru a oferi întăriri suplimentare odată ce comportamentul a fost stabilit sau după ce a trecut un timp considerabil.

Există patru planuri de armare parțială:

Programe cu raport fix

Programări cu raport fix sunt acelea în care un răspuns este întărit numai după un număr specificat de răspunsuri. Acest program produce o rată ridicată și constantă de răspuns, doar cu o scurtă pauză după livrarea armatorului. Un exemplu de program cu raport fix ar fi livrarea unei pelete de alimente unui șobolan după ce apasă o bară de cinci ori.

Programe cu raport variabil

Programări cu raport variabil apar atunci când un răspuns este întărit după un număr imprevizibil de răspunsuri. Acest program creează o rată constantă ridicată de răspuns. Jocurile de noroc și loterie sunt exemple bune de recompensă bazată pe un program cu raport variabil. În cadrul unui laborator, acest lucru ar putea implica livrarea de pelete de alimente unui șobolan după o presare cu o bară, din nou după patru apăsări pe bară și apoi din nou după două apăsări pe bară.

Programe cu intervale fixe

Programările cu intervale fixe sunt cele în care primul răspuns este recompensat numai după ce a trecut un anumit timp. Acest program determină cantități mari de răspunsuri aproape de sfârșitul intervalului, dar reacții mai lente imediat după livrarea armatorului. Un exemplu de acest lucru într-un cadru de laborator ar fi întărirea unui șobolan cu o peletă de laborator pentru prima presă de bare după ce a trecut un interval de 30 de secunde.

Programe cu intervale variabile

Programările cu intervale variabile apar atunci când un răspuns este recompensat după ce a trecut un timp imprevizibil. Acest program produce o rată lentă și constantă de răspuns.

Un exemplu în acest sens ar fi livrarea unei pelete de alimente unui șobolan după prima presare cu bara după un interval de un minut; o a doua peletă pentru primul răspuns după un interval de cinci minute; și o a treia peletă pentru primul răspuns după un interval de trei minute.

Utilizarea programului adecvat

A decide când să consolidați un comportament poate depinde de o serie de factori. În cazurile în care încercați în mod specific să predați un nou comportament, un program continuu este adesea o alegere bună. Odată ce comportamentul a fost învățat, trecerea la un program parțial este adesea preferabilă.

În viața de zi cu zi, programele parțiale de întărire apar mult mai frecvent decât cele continue. De exemplu, imaginați-vă dacă ați primit o recompensă de fiecare dată când ați apărut la lucru la timp. De-a lungul timpului, în loc ca recompensa să fie o consolidare pozitivă, negarea recompensei ar putea fi considerată ca o consolidare negativă.

În schimb, recompense ca acestea sunt de obicei distribuite într-un program de armare parțială mult mai puțin previzibil. Acestea nu numai că sunt mult mai realiste, dar au și tendința de a produce rate de răspuns mai mari, fiind în același timp mai puțin susceptibile la dispariție.

Programele parțiale reduc riscul de satisfacție odată ce a fost stabilit un comportament. Dacă o recompensă este dată fără sfârșit, subiectul poate înceta să mai îndeplinească comportamentul dacă recompensa nu mai este dorită sau necesară.

De exemplu, imaginați-vă că încercați să învățați un câine să stea. Dacă folosiți mâncarea drept recompensă de fiecare dată, câinele ar putea să nu mai funcționeze odată ce este plin. În astfel de cazuri, ceva de genul laudă sau atenție poate fi mai eficient în consolidarea unui comportament deja stabilit.

Un cuvânt de la Verywell

Condiționarea operantă poate fi un instrument puternic de învățare. Programul de întărire utilizat în timpul procesului de instruire și întreținere poate avea o influență majoră asupra cât de repede este dobândit un comportament, puterea răspunsului și cât de des este afișat comportamentul.

Pentru a determina ce program este preferabil, trebuie să luați în considerare diferite aspecte ale situației, inclusiv tipul de comportament care este predat și tipul de răspuns dorit.