Teoria classica del test
Un test è a strumento scientifico nella misura in cui misura ciò che intende, vale a dire, è valido e misura bene, cioè è preciso o affidabile. Se troviamo uno strumento dal quale non possiamo fidarci delle misure che forniscono, poiché variano di volta in volta quando misuriamo lo stesso oggetto, diremo che non è affidabile. Uno strumento, per misurare correttamente qualcosa, deve essere preciso, perché altrimenti, misurare ciò che si misura, misurarlo sbagliato. Pertanto, essere precisi è una condizione necessaria ma non sufficiente. Inoltre, deve essere valido, cioè, ciò che misura esattamente sarà ciò che è destinato a misurare, e nient'altro.
Potresti anche essere interessato: Articolo Teoria di risposta - Applicazioni e testaffidabilità:
Affidabilità assoluta e relativa: possiamo affrontare il problema dell'affidabilità di un test in due modi diversi, anche se sullo sfondo coincidono.
Affidabilità come inesattezza delle sue misurazioni: quando un soggetto risponde a un test, ottiene un punteggio empirico, che è influenzato da un errore. Se non ci fossero errori, il soggetto otterrebbe il suo vero punteggio. Il test è impreciso perché il punteggio empirico non corrisponde al vero punteggio vero. Questa differenza tra i due punteggi è l'errore di campionamento, l'errore di misurazione. il errore di misura tipico sarà la deviazione standard degli errori di misura. il errore di misura tipico indica la precisione assoluta del test, poiché consente di stimare la differenza tra la misurazione ottenuta e quella che si otterrebbe se non ci fosse errore.
Affidabilità come stabilità delle misure: un test sarà più affidabile, più costante o stabile i risultati che fornisce quando viene ripetuto. Più i risultati sono stabili in due occasioni, maggiore è la loro correlazione. Questa correlazione è chiamata coefficiente di affidabilità. Questo ci esprime, non la quantità dell'errore, ma la coerenza del test con se stesso e la costanza delle informazioni che offre. il coefficiente di affidabilità esprime la relativa affidabilità del test.
Il coefficiente di affidabilità e l'indice di affidabilità: - Il coefficiente di affidabilità di un test è la correlazione del test con se stesso, ottenuto ad esempio in due forme parallele: rxx. - L'indice di precisione è la correlazione tra i punteggi empirici di un test ei suoi veri punteggi: rxv L'indice di precisione sarà sempre maggiore del coefficiente di affidabilità Per scoprire il coefficiente di affidabilità questi tre metodi classici sono degni di nota:
- Trova la correlazione tra il test e la sua ripetizione: il metodo di ripetizione o test-test: consiste nell'applicare lo stesso test allo stesso gruppo in due occasioni e viene calcolata la correlazione tra le due serie di punteggi. Questa correlazione è il coefficiente di affidabilità. Questo metodo di solito fornisce un coefficiente di affidabilità più elevato rispetto a quelli ottenuti con altre procedure e può essere contaminato da fattori di disturbo.
- Trova la correlazione tra due forme parallele del test: Il metodo delle forme parallele: Prepara due forme parallele dello stesso test, cioè due forme equivalenti che danno le stesse informazioni e si applicano allo stesso gruppo di soggetti. La correlazione tra le due forme è il coefficiente di affidabilità. Con questo metodo, evitando di ripetere lo stesso test, si evitano fonti disturbanti di affidabilità re-test.
- Trova la correlazione tra due metà parallele del test: Il metodo delle due metà: dividi il test in due metà equivalenti e trova la correlazione tra di esse. È il metodo preferibile, poiché è semplice e ignora i limiti delle procedure precedenti. Puoi scegliere gli elementi dispari del test, costituire una metà e gli elementi pari per costituire l'altro.
Il coefficiente di affidabilità e la correlazione tra test paralleli
il coefficiente di affidabilità di un test indica la proporzione che la vera varianza è della varianza empirica: gráfico33 Il coefficiente di affidabilità di un test varia tra 0 e 1. Ad esempio: se la correlazione tra due test paralleli è rxx´ = 0.80, significa che l'80% della varianza del test è dovuta alla misurazione reale e il resto, cioè il 20% della varianza del test è dovuta all'errore. il indice di affidabilità di un test è la correlazione tra i suoi punteggi empirici e il suo indice di affidabilità dei punteggi veri = L'indice di affidabilità è uguale alla radice quadrata del coefficiente di affidabilità
Una volta sviluppate due forme parallele di un test, la procedura di analisi della varianza viene applicata per verificare l'omogeneità delle varianze e la differenza tra le misure. Se le varianze sono omogenee, la differenza tra i mezzi non è significativa e le due forme sono costruite con lo stesso numero di elementi dello stesso tipo e il contenuto psicologico, si può dire che sono paralleli. Altrimenti, devi riformarli finché non lo sono. La mancanza di affidabilità è identificata con il valore rxx´= 0 4.- L'errore tipico di misurazione: la differenza tra il punteggio empirico e quello reale è l'errore casuale, chiamato errore di misurazione. La deviazione standard degli errori di misurazione viene definita errore di misurazione tipico. il errore di misura tipico permette di fare stime sull'assoluta affidabilità del test, cioè stimare quanto errore di misura influisce su un punteggio.
Affidabilità e lunghezza: la lunghezza del test si riferisce al numero dei suoi elementi. L'affidabilità dipende da questa lunghezza. Se un test consiste di tre elementi, un soggetto può ottenere una volta il punteggio di 1 e in un altro, o in modo parallelo, un punteggio di
Da un'occasione all'altra, il punteggio è variato di un punto; un punto sopra tre è una variazione del 33%, una variazione elevata. Se i soggetti ottengono variazioni casuali di questo tipo, la correlazione del test con se stessa o con le due forme parallele del test sarà notevolmente ridotta e non può essere elevata. Se il test è molto più lungo, se si dispone, ad esempio, di 100 voci, un soggetto può ottenere 70 punti in un'occasione e 67 in parallelo. Dall'uno all'altro ha cambiato 3 punti; è una varianza relativamente piccola rispetto al test totale, in particolare del 3%. Queste piccole modifiche casuali di questa grandezza, che si verificano nei punteggi dei soggetti, quando passano da una forma all'altra, sono relativamente poco importanti e non diminuiranno tanto quanto prima della correlazione tra entrambi.
Il coefficiente di affidabilità sarà molto più alto rispetto al caso precedente. L'equazione di Spearman-Brown esprime la relazione tra affidabilità e lunghezza. La precisione di un test è zero quando la lunghezza è 0 e aumenta all'aumentare della lunghezza. Sebbene l'aumento sia relativamente minore come la lunghezza di quale parte è maggiore. Ciò significa che la precisione cresce molto all'inizio e relativamente meno tardi. Quando la lunghezza tende all'infinito, il coefficiente di affidabilità tende a
Aumentare la durata di un test aumenta la precisione perché aumenta la varianza reale ad un tasso superiore rispetto alla varianza dell'errore. Ciò significa che l'accuratezza del test aumenta poiché diminuisce la proporzione della varianza dovuta all'errore. La formula di Rulon, così come la formula di Flanagan e Guttman, sono particolarmente applicabili nel calcolo del coefficiente di affidabilità con il metodo delle due metà. Queste sono formule che vengono utilizzate per calcolare il coefficiente di affidabilità.
Affidabilità e coerenza: il coefficiente di affidabilità può anche essere trovato in un altro modo, è il cosiddetto coefficiente alfa o coefficiente di generalizzabilità o di rappresentatività (Cronbach). Questo coefficiente alfa indica l'accuratezza con cui alcuni elementi misurano un aspetto della personalità o del comportamento. Può essere interpretato come: una stima della correlazione media di tutti gli elementi possibili in un determinato aspetto. Una misura dell'accuratezza del test in base alla sua coerenza o coerenza interna (interrelazione tra i suoi elementi, in che misura gli elementi del test stanno misurando lo stesso) e la sua lunghezza. Indicare la rappresentatività del test, cioè la quantità in cui il campione di elementi che lo compone è rappresentativo della popolazione di possibili articoli dello stesso tipo e contenuto psicologico. il coefficiente alfa riflette principalmente due concetti base nell'esattezza di un test: 1. L'interrelazione tra i suoi elementi: la misura in cui tutti misurano la stessa cosa.
La durata del test: aumentando il numero di casi in un campione e eliminando gli errori sistematici, il campione rappresenta meglio la popolazione da cui viene estratto ed è più improbabile che sia coinvolto un errore accidentale. Se gli elementi test sono dicotomici, (sì o no, 1 o 0, accordo o disaccordo, ecc.), L'equazione del coefficiente alfa viene semplificata, dando origine alle equazioni di Kuder-Richardson (KR20 e KR21). Dato un certo numero di elementi, un test sarà più affidabile, quando più omogeneo. Il coefficiente alfa ci dice l'affidabilità in quanto rappresenta l'omogeneità e la coerenza o la coerenza interna degli elementi di un test.
Standard e criteri di affidabilità
Secondo il modello dello spazio campionario degli articoli, l'obiettivo del test è stimare la misura che si otterrebbe se tutti gli elementi nello spazio campione fossero utilizzati. Questa misura sarebbe il vero punteggio, a cui le misure reali si approssimano più o meno. A seconda del grado in cui un campione di articoli è correlato con i punteggi veri, il test è più o meno affidabile. In questo modello, la matrice delle correlazioni tra tutti gli elementi nello spazio campione è centrale: questo modello di esempio insiste più direttamente sulla coerenza interna e, nella misura in cui lo raggiunge, garantisce indirettamente stabilità..
Il modello lineare dei test paralleli insiste più sulla stabilità dei punteggi, e nella misura in cui raggiunge la stabilità, favorisce indirettamente la coerenza interna. Se applichiamo un test per stabilire diagnosi e previsioni individuali, il coefficiente di affidabilità deve essere compreso tra 0,90 e oltre. Nelle previsioni e nelle classificazioni collettive, la domanda non è tanto, anche se non è conveniente scappare molto da 0,90 a 0,80..
A volte, in alcuni tipi di test, come i test della personalità, è difficile ottenere coefficienti superiori a 0,70. Se si applicano le forme parallele o le metà parallele, dopo un intervallo più o meno grande, gli errori casuali possono essere più numerosi di quelli che influiscono sul coefficiente alfa. Questo perché ciò che abbassa la correlazione non sono solo gli errori casuali intrinseci al test e in una singola occasione, che sono quelli che tengono conto del coefficiente alfa, ma influenzano anche tutti gli errori che possono derivare dalle due diverse situazioni , che può differire in numerosi dettagli. Pertanto, il coefficiente alfa è solitamente più alto rispetto agli altri coefficienti.
Fatta eccezione per il coefficiente trovato ripetendo lo stesso test, poiché è più probabile che gli errori casuali della prima applicazione vengano ripetuti nel secondo, e invece di diminuire la correlazione tra i due, essi aumentano. Deve essere garantito che la seconda applicazione sia completamente indipendente dalla prima. Se otteniamo questo, questo sarà il metodo più semplice ed economico e consigliabile quando si cerca di apprezzare la stabilità dei punteggi, specialmente durante lunghi periodi di tempo e con test complessi. > Successivo: validità dei test