Tipi di concetto di rinforzo e indici di rinforzo
Skinner, quando ha a che fare con le risposte operanti, dirà: "Un operante è una parte identificabile del comportamento da cui può essere detto, non che è impossibile trovare uno stimolo che lo provoca (...) ma, nelle occasioni in cui si osserva la sua presenza , non è possibile rilevare alcuno stimolo correlato.
Il formatore della legge di effetto era E. L. Thorndike (1874-1949). Thorndike sostiene che in quelle situazioni in cui la scomparsa di una stimolazione avversiva produce uno stato "Soddisfacente", gli effetti rinforzanti di questo tipo di situazione dovrebbero essere interpretati come la prima formulazione della legge di effetto; cioè, quelli in cui la scomparsa della stimolazione avversiva è gratificante, dovrebbero essere interpretati come una ricerca nella scomparsa di questa stimolazione.
Potresti anche essere interessato: Concept and Theories of Motivation Index- Introduzione al problema del rinforzo
- Concetti di base, tipi di rinforzo
- Indici di rinforzo
- Relazioni empiriche con rinforzo positivo
Introduzione al problema del rinforzo
Al prossimo fatto lo chiameremo il legge empirica di effetto: empiricamente, la conseguenza che una risposta porta con sé è un potente fattore determinante se la risposta sarà corretta o meno B.F. Skinner (1904) è stato colui che è stato più sistematicamente impegnato a sfruttare al meglio la formulazione empirica della legge di effetto dalla fine degli anni '30 con una posizione teorica che è stata talvolta descritta come "empirismo descrittivo sistematico". Comportamento di fronte "Resistente ' (controllato dal condizionamento classico), Skinner propone il "Operante", emesso dall'organismo spontaneamente. L'approccio Skinner al problema del rinforzo non lo è teorico nel senso tradizionale ma empirica descrittivo.
A livello descrittivo, alcuni eventi che seguono le risposte hanno l'effetto di aumentare la probabilità che queste risposte si ripeteranno. Questi eventi sono definiti e identificati come rinforzi o rinforzi, a seconda dei loro effetti osservabili e non dipendono dall'effetto che possono avere sui meccanismi e sui processi "interni" dell'organismo, siano essi neuronali o meno. Questi eventi, chiamati rinforzi o rinforzi, possono essere di due tipi:
- Rinforzo positivo: "Colui la cui presenza rafforza o aumenta la probabilità che un'azione compaia in futuro".
- Rinforzo negativo: "Colui la cui scomparsa rafforza o aumenta la probabilità che un'azione compaia in futuro (proprio quella che è stata con o correlata alla scomparsa della stimolazione avversiva)".
Sia in Skinner che in Thorndike, l'azione di rinforzo è automatica e, in linea di principio, al di fuori dell'attività cosciente e / o cosciente dell'organismo. Il rinforzo agisce automaticamente.
Concetti di base, tipi di rinforzo
È studiato come un evento che appare spontaneamente con una determinata frequenza. "Le risposte operative possono essere suddivise in strumentale e consummatory:
- Risposta strumentale: "Quando viene eseguito da un'organizzazione e mira a raggiungere un obiettivo".
- Compendio risposte: "Quelle risposte che un organismo giusto fa nel raggiungimento dell'obiettivo (mangiare, copulare, bere, ecc.)".
Per effettuare l'analisi delle risposte ci interessa distinguere due concetti:
- tasso: È il numero di risposte date per unità di tempo e viene solitamente presentato da gradienti di acquisizione o di estinzione (si dice che una risposta ha una frequenza o una pendenza più accelerata o più pronunciata di un'altra).
- Livello di risposta asincrona: È il livello massimo di acquisizione e non aumenta con i tentativi successivi.
Un'altra divisione che possiamo fare riguardo ai rinforzi è questa:
- Rinforzi primari: Quelli che hanno un valore rinforzante biologicamente determinato e non dall'apprendimento, come accade nel caso dell'aria, del cibo e delle bevande.
- Rinforzi secondari: Coloro che hanno acquisito il loro valore apprendendo come ricompensa sociale (lode) o denaro.
Condizionamento strumentale Esistono quattro tipi di condizionamento strumentale (uno positivo e tre negativi)
L'allenamento della ricompensa: Il rinforzo utilizzato è positivo e non è presente prima della realizzazione della risposta desiderata. Non appena viene visualizzata la risposta, viene applicato il rinforzo. Ad esempio: ogni volta che un topo premeva una leva, una pillola o un granello di cibo veniva presentato in una cannula..
Allenamento per punizione: Il rinforzo (stimolo punitivo) non è presente. Se il soggetto esegue un'azione prefissata, appare il rinforzo negativo (stimolo punitivo). P. ejem: un figlio di cinque anni rompe un prezioso vaso per la madre e lei gli dà uno schiaffo.
I disegni di evasione: Il rinforzo avversivo è assente prima dell'esecuzione del comportamento, la realizzazione della risposta appropriata implica che il rinforzo non si verifica. P. ejem: progetto di evasione di Sidman in cui l'applicazione di una scarica elettrica è prevista in una casella Skinner ogni 5 secondi, a meno che l'animale (di solito un topo) schiaccia una leva. La risposta di premere la leva disconnette il circuito e l'animale non riceve lo shock.
I progetti di fuga: Il rinforzo avversivo è presente prima della realizzazione della risposta, la realizzazione di questa risposta comporta la scomparsa della stimolazione avversiva. P. ejem: in una navetta l'animale si trova in uno scompartimento con una griglia elettrificata, compare la scarica elettrica e la risposta dell'animale (saltando sopra la barriera che separa i due compartimenti) comporta l'eliminazione della stimolazione avversiva.
Indici di rinforzo
Indici di rinforzo Gli indici di rinforzo si riferiscono ai modi di presentare questi rinforzi all'interno di un esperimento. Possiamo dividerli in:
Indici non intermittenti: l'applicazione continua di rinforzi per ogni risposta che appare (sia che acquisti o sia estinta).
- Rinforzo continuo: Ogni risposta emessa da un organismo è rinforzata.
- l'estinzione: Nessuna risposta è rinforzata ed è un processo simile a quello dell'estinzione sperimentale nel condizionamento classico.
Indici intermittenti: l'applicazione di un minor volume o numero di rinforzi rispetto alle risposte fatte. Per ragioni di spazio, commenteremo solo i semplici indici intermittenti; Questi sono indici relazionali tra risposte e rinforzo o tra tempo e rinforzo. Nel caso di prendere in considerazione il numero di risposte che parliamo di un indice di rapporto e se viene preso in considerazione un periodo temporaneo, parliamo di un indice di intervallo.
- Indice di rapporto fisso (RF): La risposta corretta data dall'organismo è rinforzata, dopo che ne ha fatto un certo numero.
- Indici a rapporto variabile (RV): A differenza del caso precedente, il rapporto risposta / rinforzo è una serie casuale attorno a un valore centrale e con un piccolo intervallo di variazione.
- Indici a intervallo fisso (IF): La prima risposta corretta che appare dopo un dato intervallo di tempo è rinforzata (di solito in minuti).
- Indice dell'intervallo variabile (IV): I rinforzi sono presentati secondo una serie casuale di intervalli di tempo e solo l'intervallo medio è reso esplicito.
Relazioni empiriche con rinforzo positivo
Una delle principali teorie sull'estinzione è quella dell'estinzione come interferenza delle risposte. In queste teorie l'idea di base è che "il estinzione non si verifica a causa di un'inibizione e / o soppressione di risposte, ma perché il soggetto impara a risposta alternativa che interferisce con o compete con quello precedente. "L'alternativa teorica più comune è la cosiddetta ipotesi di frustrazione..
L'idea centrale è che durante il periodo di acquisizione il soggetto impari la risposta appropriata e, inoltre, attenda la ricompensa che segue la risposta. Nel processo di estinzione, l'esperienza di non ricevere la ricompensa è ciò che produce frustrazione. Questa frustrazione sarebbe responsabile per il soggetto di impegnarsi nella realizzazione di altre risposte. Attraverso diverse dimostrazioni sperimentali è stato verificato che:
- La frustrazione derivante dalle risposte non intenzionali agisce positivamente come a energizzante del comportamento.
- C'è un relazione diretta tra la quantità di frustrazione (misurata in base a criteri come la velocità di corsa) e la riduzione della ricompensa corrispondente a questo tentativo.
- Esiste una relazione tra l'intensità della frustrazione, il ritardo nel ricevere la ricompensa e il numero di tentativi di acquisizione.
- La frustrazione ha componenti avversive che alcuni autori hanno assimilato a disegni di punizione.