Teoria di risposta all'articolo - Applicazioni e test

Teoria di risposta all'articolo - Applicazioni e test / Psicologia sperimentale

Nel campo di Teoria dei test psicometrici Sono apparse denominazioni diverse che attualmente prendono il nome di "Teoria della risposta agli oggetti" (F. Lord, 1980). Questa denominazione presenta alcune differenze rispetto al modello classico: 1.- la relazione tra il valore atteso dei punteggi del soggetto e il tratto (caratteristica responsabile dei valori), di solito non è lineare. 2.- intende fare previsioni individuali senza bisogno di riferirsi alle caratteristiche del gruppo normativo.

Potrebbe interessarti anche: teoria dei test classici Indice
  1. Teoria della risposta all'elemento o ai modelli del tratto latente nella teoria dei test
  2. Modelli di teoria della risposta degli oggetti (tri)
  3. Stima dei parametri
  4. Test di costruzione
  5. Applicazioni della teoria della risposta dell'articolo
  6. Interpretazione dei punteggi

Teoria della risposta all'elemento o ai modelli del tratto latente nella teoria dei test

Vediamo, quindi, che questa Teoria della Risposta all'oggetto fornisce la possibilità di descrivere separatamente gli oggetti così come gli individui; Ritiene inoltre che la risposta data dal soggetto dipenda dal livello di abilità che ha nell'intervallo considerato. L'origine di questi modelli è dovuta a Lazarsfeld, 1950, che ha introdotto il termine "tratto latente" .

Da qui si considera che ogni individuo ha un parametro individuale che è responsabile delle caratteristiche del soggetto, chiamato anche "tratto". Questa caratteristica non è direttamente misurabile, quindi il singolo parametro è chiamato la variabile latente. Quando si applicano i test è possibile ottenere due cose diverse, il punteggio vero e la scala di fitness; Questo risultato è ottenuto se passiamo due test sulla stessa idoneità allo stesso gruppo.

Nella Teoria dei Trait latente o Teoria della risposta all'articolo Il vero punteggio è quel valore che ci si aspetta dal punteggio osservato. Secondo Lord, il vero punteggio e la forma fisica sono la stessa cosa ma espressi in diverse scale di misura.

Modelli di teoria della risposta degli oggetti (tri)

Modelli di errore binomiale: sono stati introdotti da Lord (1965), che presuppone che il punteggio osservato corrisponda al numero di risposte corrette ottenute nel test (i cui elementi hanno la stessa difficoltà e hanno indipendenza locale, cioè la probabilità rispondere correttamente ad un oggetto non è influenzato dalle risposte date ad altri oggetti).

Modelli di Poisson: questi modelli sono appropriati per quei test che hanno un numero elevato di articoli e in cui la probabilità di una risposta corretta o errata è piccola. All'interno di questo gruppo, a turno, abbiamo diversi modelli:

  1. Modello di Rasch di Poisson, le cui ipotesi sono: ogni test ha un gran numero di elementi binari che sono localmente indipendenti. la probabilità di errore in ogni articolo è piccola. La probabilità che il soggetto commetta un errore dipende da due fattori: la difficoltà del test e l'attitudine del soggetto. l'additività delle difficoltà, intesa come il risultato della miscelazione di due test equivalenti in un singolo test la cui difficoltà è la somma delle difficoltà dei due test iniziali.
  2. Modello di Poisson per valutare la velocità: Questo modello è stato proposto anche da Rasch ed è caratterizzato dal fatto che viene presa in considerazione la velocità nell'esecuzione del test. Il modello può essere proposto in due modi: conta il numero di errori commessi e le parole lette in un'unità di tempo. conta il numero di errori commessi e il tempo trascorso completando la lettura del testo. La probabilità di realizzazione di un certo numero di parole di un test (i) da un soggetto (j), durante un tempo (t)
  3. Ojiva Modelli normali: è un modello proposto da Lord (1968), che viene utilizzato nei test con elementi dicotomici e con una sola variabile in comune.Il suo grafico sarebbe il seguente: I presupposti di base che caratterizzano questo modello sono:
  • lo spazio della variante latente è unidimensionale (k = 1).
  • indipendenza locale tra gli intems.
  • la metrica per la variabile latente può essere scelta in modo che la curva di ogni oggetto sia la normale testata.

Modelli logistici; È un modello molto simile al precedente ma ha anche più vantaggi rispetto al suo trattamento matematico. La funzione logistica ha la seguente forma: Esistono diversi modelli logistici in base al numero di parametri che hanno:

  • Modello logistico a 2 parametri, Birnbaum 1968, tra le sue caratteristiche citiamo che è unidimensionale, c'è l'indipendenza locale, gli elementi sono dicotomici, ecc.
  • Modello logistico a 3 parametri, Signore, è caratterizzato dal fatto che la probabilità di indovinare giusto è un fattore che influenzerà le prestazioni del test. 4.3. Modello logistico a 4 parametri: modello proposto da McDonald 1967 e Barton-Lord nel 1981, il cui scopo è quello di spiegare quei casi in cui i soggetti che hanno un livello di fitness elevato non rispondono correttamente all'oggetto.
  • Modello logistico di Rasch: Questo modello è quello che ha generato il maggior numero di posti di lavoro pur avendo uno svantaggio, questo è che il suo adattamento ai dati reali è più difficile, ma al contrario il vantaggio che lo rende così usato è che non richiede grandi Dimensioni del campione per la regolazione.

Stima dei parametri

Il metodo che è stato utilizzato di più è Maximum Likelihood, accanto a questo metodo vengono utilizzate le procedure di approssimazione numerica, come Newton-Raphson e Scoring (Rao). Il metodo di massima verosimiglianza si basa sul principio di ottenere stimatori dei parametri sconosciuti che massimizzano la probabilità di ottenere detti campioni. Oltre alla massima verosimiglianza, viene utilizzata anche la stima bayesiana, basata sul teorema di Bayes, che consiste nell'incorporare tutte le informazioni conosciute, a priori, rilevanti per il processo di inferenza. Uno studio più approfondito del metodo bayesiano per la stima dei parametri di fitness è quello realizzato da Birnbaum (1996) e Owen (1975). .

FUNZIONI DI INFORMAZIONE

Il miglior test che può essere costruito è quello che fornisce la maggior parte delle informazioni sul tratto latente. La quantificazione di queste informazioni avviene attraverso le "funzioni di informazione". La formula della funzione di informazione, Birnbaum 1968, è la seguente: Si deve tener conto che le informazioni ottenute in un test sono la somma delle informazioni di ciascun elemento, oltre al contributo di ciascun elemento non dipende dal resto degli elementi che compongono il test. In termini generali possiamo dire che l'informazione, in tutti i modelli:

  • varia con i livelli di fitness.
  • Maggiore è la pendenza della curva, maggiore è l'informazione.
  • dipende dalla varianza dei punteggi, più questo è alto, meno informazioni.

Test di costruzione

Il primo compito e uno dei più importanti al momento della costruzione di un test è la scelta degli elementi, accordo precedente degli assunti teorici che devono definire la caratteristica che il test intende misurare. Il concetto "analisi articoli" si riferisce all'insieme di procedure formali che vengono eseguite per selezionare quegli elementi che alla fine formeranno il test. Le informazioni considerate più rilevanti rispetto agli articoli sono:

  1. Difficoltà dell'oggetto, percentuale di individui che lo correggono.
  2. Discriminazione, correlazione di ogni articolo con il punteggio totale del test.
  3. Distrattori o analisi degli errori, la sua influenza è rilevante, influenza la difficoltà dell'articolo e rende sottostimati i valori della discriminazione.

Al momento di stabilire gli indicatori dei diversi indici, le statistiche o gli indici vengono solitamente utilizzati, il più utilizzato è il seguente:

Indice di difficoltà Indice di discriminazione Indice di affidabilità Indice di validità Indici noti che devono essere presi in considerazione per la selezione degli articoli che costituiranno il test, vedremo quali passaggi sono necessari per la costruzione di un test:

  1. Specifica del problema.
  2. Enuncia una vasta serie di elementi e esegui il debugging.
  3. Scelta del modello.
  4. Prova gli oggetti preselezionati.
  5. Seleziona gli articoli migliori.
  6. Studia le qualità del test
  7. Stabilire le norme di interpretazione del test finale ottenuto.

Dai punti precedenti si dovrebbe notare che la scelta del modello, punto 3, dipenderà dagli obiettivi perseguiti dal test, dalle caratteristiche e dalla qualità dei dati e dalle risorse disponibili. Quando si sceglie un modello, date le condizioni teoriche in cui può essere applicato, no nonostante le sue virtù deve essere analizzato caso per caso e circostanze specifiche. Le proprietà attribuibili a quei modelli che compongono il Teoria della risposta all'articolo (TRI), può essere influenzato da:

  • la dimensionalità del test la scarsa disponibilità di mancanza del campione di risorse del computer Ci sono un certo numero di preferenze quando si usano uno o l'altro modello, vediamoli: i normali modelli di testate non sono solitamente usati nelle applicazioni, il loro valore è teorico.
  • Rasch: adatto per il confronto orizzontale (test comparabili su livelli di difficoltà con distribuzioni di fitness simili). avere forme diverse dello stesso test * 2 e 3 parametri: sono quelli che meglio si adattano a una varietà di problemi.
  • per rilevare modelli di risposta errati. per l'equalizzazione verticale dei test (confrontare test con diversi livelli di difficoltà e diverse distribuzioni per il fitness).

1 e 2 parametri:

  • adatto a costruire una scala unica, in modo da poter confrontare le abilità a diversi livelli.

La scelta del modello, oltre alla fine perseguita, può essere influenzata dalla dimensione del campione; Nel caso in cui il campione sia ampio e rappresentativo, non ci saranno problemi né nel modello classico né nel tratto latente. Ma nel TRI ( teoria della risposta dell'articolo ) un piccolo campione ti obbliga a scegliere i modelli con un numero limitato di parametri, persino il modello uniparametrico.

Applicazioni della teoria della risposta dell'articolo

Vediamo quali sono le applicazioni più comuni: a) Equalizzazione dei test, a volte è necessario mettere in relazione i punteggi ottenuti in diversi test, con due possibili scopi:

  • Equalizzazione orizzontale: si cerca di ottenere diverse forme dello stesso test.
  • Equalizzazione verticale: l'obiettivo è quello di costruire una scala di attitudine con diversi livelli di difficoltà. Per quanto riguarda l'equalizzazione dei test, Lord (1980) introduce il concetto di "equità", che implica che per ciascun soggetto due test possono essere intercambiabili poiché si applica che l'uno o l'altro non cambierà il livello di attitudine che era stato stimato. per il soggetto.

Studio della distorsione degli oggetti, un oggetto è distorto quando, in media, dà punteggi significativamente diversi in gruppi specifici che dovrebbero far parte della stessa popolazione.

Test adattati o medi , Attraverso il TRI, possono essere costruiti test individualizzati che permettono di dedurre in modo più preciso il vero valore del tratto in questione. Gli oggetti saranno amministrati in sequenza, la preimpostazione di un oggetto o dell'altro dipenderà dalle risposte fornite sopra. Esistono diversi tipi di test adattati, segnaliamo quanto segue:

  • procedura a due stadi, Lord 1971; Bertz e Weiss 1973 - 1974. Un test viene superato per primo e in base ai risultati viene somministrato un secondo test.
  • La procedura in più fasi, è la stessa della precedente, solo il processo include più fasi.
  • Corretto il modello di ramificazione, Lord 1970, 1971, 1974; Mussio 1973. Tutti i soggetti risolvono lo stesso oggetto, a seconda della risposta, un insieme di elementi è risolto.
  • Il modello a diramazione variabile, si basa sull'indipendenza tra gli elementi e le proprietà degli stimatori di massima verosimiglianza.

Banca degli articoli, Avere una vasta serie di elementi è qualcosa che migliorerà la qualità del test ma per questo gli oggetti devono prima passare attraverso un processo di debug. Per classificare gli articoli, è necessario tenere conto di quale funzione è destinata a misurare il test di cui questo articolo farà parte..

Interpretazione dei punteggi

bilancia: il suo scopo è offrire un continuum per ordinare, classificare o sapere qual è la grandezza relativa della caratteristica valutata; questo ci permetterà di stabilire differenze e somiglianze nelle persone rispetto a quel tratto. Le scale utilizzate in Psicologia sono: nominale, ordinale, intervallo e ragione; queste scale sono costruite dai risultati dei test, i risultati chiamati "punteggi diretti" .

caratterizzare : tipizzare un test è trasformare i punteggi diretti in altri che sono facilmente interpretabili in quanto il punteggio tipizzato rivelerà la posizione del soggetto rispetto al gruppo e ci permetterà di effettuare confronti intra e intersoggettivi. Esistono due tipi di digitazione:

  1. Lineare, mantiene la forma della distribuzione e non modifica la dimensione delle correlazioni.
  2. Non lineare, non conservano la distribuzione o la dimensione delle correlazioni .

FITNESS SCALE Nel TRI, la scala che viene costruita è quella scala che corrisponde ai livelli di fitness; Questa scala è caratterizzata dal fatto che le stime e i riferimenti sono fatti direttamente rispetto all'atteggiamento e alla sua scala. Inoltre, questa attitudine che viene stimata dipende solo dalla forma della curva caratteristica degli oggetti. All'interno delle possibili scale, ne indichiamo due:

  1. Scale, proposto da Woodcock (1978) ed è definito dalla seguente formula:
  2. Scala WITS, proposta da Wright (1977), questa scala è una modifica della precedente ed è data dalla seguente relazione: