Psicometria

campo di studio della teoria e della tecnica della misura in psicologia

La psicometria è il campo di studio della teoria e della tecnica della misura in psicologia, incluse la misura della conoscenza, delle abilità, degli atteggiamenti e delle caratteristiche della personalità. Il campo di studio è particolarmente volto verso lo studio delle differenze fra gli individui. Coinvolge due aspetti importanti della ricerca, vale a dire:

  1. la costruzione degli strumenti e delle procedure per la misura;
  2. lo sviluppo ed il perfezionamento dei metodi teorici della misura.


Origini e retroterra culturale

Gran parte del lavoro teorico ed applicativo della psicometria è stato svolto nel tentativo di misurare l'intelligenza, sempre fallito!. L'origine della psicometria è collegata alla psicofisica. Charles Spearman, pioniere della psicometria che ha sviluppato i metodi della misura dell'intelligenza, ha studiato sotto gli insegnamenti di Wilhelm Wundt. Louis Leon Thurstone successivamente ha sviluppato ed applicato un metodo teorico della misurazione denominato come "legge di giudizio comparativo", un metodo che ha collegamenti vicini alla teoria psicofisica sviluppata da Weber e da Fechner. In più, Spearman e Thurstone hanno entrambi dato contributi importanti alla teoria ed all'applicazione dell'analisi fattoriale, un metodo matematico - statistico usato estesamente in psicometria.

Più recentemente, la teoria psicometrica è stata applicata nella misura della personalità, degli atteggiamenti e delle credenze, nel successo accademico, e nei campi correlati con la salute. La misura di questi fenomeni psicologici è difficile e gran parte della ricerca accumulata in questa disciplina, è stata sviluppata nel tentativo di definire e misurare correttamente tali fenomeni. I critici di questo approccio, compresi i professionisti delle scienze fisiche e nelle scienze sociali, hanno sostenuto che tali definizioni sono impossibili e la quantificazione è talmente difficile che tali misure sono da ritenersi invalide. Gli autori delle tecniche psicometriche rispondono, che non sempre in natura la teoria della misura è relativa a misure come la lunghezza, direttamente osservabili. Molte variabili fisiche vengono misurate senza che esse siano direttamente osservabili come ad esempio le forze o il calore. Quest'ultime si misurano mediante i loro effetti e non direttamente. In psicologia con le opportune tecniche psicometriche si effettua lo stesso tipo di misurazione. Anzi spesso nelle scienze fisiche non vengono tenuti in considerazione tutti i criteri metodologici e statistici che invece vengono utilizzati normalmente in psicometria.

Fra le figure che hanno dato contributi significativi alla psicometria si possono includere Karl Pearson, Louis Leon Thurstone, Georg Rasch ed Arthur Jensen.

Definizione della misura nelle scienze sociali

La definizione della misura nelle scienze sociali ha una lunga storia. Una definizione attualmente diffusa, proposta da Stanley Smith Stevens (1946), è che la misura sia :

«l'assegnazione dei numeri agli oggetti o degli eventi secondo una certa regola»

Questa definizione è stata introdotta nel testo in cui Stevens ha proposto le quattro scale di misura: Scala Nominale, Scala Ordinale, Scala ad Intervalli, Scala a Rapporti. Anche se ampiamente adottata, questa definizione differisce dalla definizione più classica della misura adottata le scienze fisiche, che è:

«la misura è la valutazione e l'espressione numerica della grandezza di una quantità riguardante un altro evento»

Effettivamente, la definizione data da Stevens della misura è stata proposta in risposta al comitato britannico di Ferguson, di cui il presidente (A. Ferguson) era un fisico. Il comitato è stato nominato nel 1932 dall'associazione britannica per l'avanzamento della scienza per studiare la possibilità di misurare quantitativamente gli eventi psichici. Anche se la presidenza ed altri membri della commissione erano fisici, vi erano anche parecchi psicologi. La relazione del comitato ha evidenziato l'importanza della definizione della misura. Mentre la risposta di Stevens doveva proporre una nuova definizione per ottenere un influenza considerevole, questa era di fatto l'unica risposta al rapporto. Un'altra definizione, assai differente, risposta era di accettare la definizione classica, come enunciata nella seguente dichiarazione:

«Le misure in psicologia e in fisica non sono in alcun modo differenti. I fisici possono misurare quando possono trovare i funzionamenti mediante i quali possono rispondere ai test di verifica necessari; gli psicologi anche ma non sempre. Non devono preoccuparsi delle differenze ignote fra il significato della misura nelle due scienze»

Queste risposte divergenti sono dovute largamente alle metodiche che intercorrono nel misurare un evento. Per esempio, i metodi basati sulle tabelle di covarianza sono impiegati tipicamente sui numeri di gruppi, quali i segni grezzi derivati dalle valutazioni, sono misure. Tali metodi richiedono implicitamente la definizione della misura dello Stevens, la quale richiede soltanto che i numeri siano assegnati secondo una certa regola. L'operazione principale di ricerca, allora, è considerata, generalmente, come la scoperta delle associazioni fra simboli, e fra i fattori che si presuppone siano essere alla base di tali associazioni. D'altra parte, quando la misura si adatta al modello de Rasch, i numeri non sono assegnati basandosi su una regola. Invece, in armonia con la dichiarazione del Reese di qui sopra, i test di verifica specifici per la misura, sono dichiarati e l'obiettivo è costruire le procedure o i funzionamenti che forniscono i dati che rispondono ai test di verifica relativi. Le misure sono valutate basandosi sui modelli e le prove sono effettuate per accertare che sia stato possibile rispondere ai test di verifica relativi.

Strumenti e procedure

I primi strumenti psicometrici sono stati utilizzati per misurare il concetto di intelligenza. Il metodo storicamente più conosciuto consiste nella scala Stanford-Binet per la misurazione del Quoziente di intelligenza, sviluppata originalmente dallo psicologo francese Alfred Binet. Il contrario ad un'idea sbagliata ragionevolmente diffusa, là è prova costringente che è possibile misurare l'intelligenza innata tramite tali strumenti, nel senso di una capienza imparante innata inalterata per esperienza, né era questa l'intenzione originale quando sono stati sviluppati. Tuttavia, le prove di quoziente d'intelligenza sono strumenti utili per vari scopi. Una concezione alternativa di intelligenza è che le proprietà conoscitive degli individui sono una manifestazione di un componente generale, o fattore generale di intelligenza, così come capienza conoscitiva specifica ad un dato dominio.

La psicometria è applicata ampiamente nella valutazione dell'educazione, spedificatamente alla lettura, scrittura e alla matematica. I metodi principali nell'applicazione delle prove in questi dominii sono stati modelli di teoria classica della prova e di misura più moderna di teoria e de Rasch di risposta dell'articolo. Questi metodi moderni consentono lo scaling unito delle persone e degli articoli di valutazione, che fornisce una base per il tracciato delle continuità inerenti allo sviluppo permettendo le descrizioni delle abilità visualizzate ai vari punti lungo una continuità. Tali metodi forniscono le informazioni potenti per quanto riguarda la natura di sviluppo inerente allo sviluppo all'interno di vari dominii.

Un altro fuoco principale in psicometria è sui test di personalità. C'è una vasta letteratura riguardante la concettualizzazione della personalità ela relativa misurazione. Alcuni degli strumenti meglio conosciuti includono l'inventario di personalità del Minnesota Multiphasic, il così detto MMPI, ed l'indicatore dei tipi psicologici del Myers-Briggs. Gli atteggiamenti inoltre sono stati studiati estesamente in psicometria. Un metodo comune alla misura degli atteggiamenti è l'uso della scala Likert.
In estrema sintesi, specifici test psicometrici valutano specifiche funzioni della mente:

  • Test delle aree cognitive (l'attenzione, la percezione, la memoria, il linguaggio, le capacità attitudinali.
  • Test di profitto (incentrati sui risultati di un apprendimento specifico, come per esempio dopo un momento formativo).
  • Test di personalità, indagata mediante inventari o test proiettivi).

Approcci teorici

Le teorie psicometriche derivano da una molteplicità di aree scientifiche. Primariamente gli psicometristi hanno sviluppato la gran parte delle teorie sviluppando e analizzando i test mentali. Gran parte del lavoro può essere suddiviso nella teoria del test classica (in inglese CTT) e nella teoria di risposta degli item (in inglese IRT). Un altro modello di misura simile al modello degli item è il modello di Rasch della misurazione.

Gli psicometristi hanno sviluppato metodi per lavorare con grosse matrici di correlazione e covarianza. Tecniche originali sviluppate in quest'area sono l'analisi fattoriale (trovare dei fattori sottostanti che spieghino i dati), lo scaling multidimensionale (trovare una rappresentazione semplice per una molteplicità di dati) e l'analisi dei cluster (trovare oggetti simili ad altri).

In questi modelli descrittivi multivariati lo scopo finale è quello di dare un senso logico e semplificare una grande quantità di dati. Più recentemente i modelli di equazioni strutturali e la path analysis rappresentano i modelli multivariati più sofisticati per risolvere matrici di dati molto grandi e complesse. Questi modelli prevedono sia un analisi di tipo confermativo (quanto i dati siano attenenti ad un modello teorico) sia di tipo esplorativo (determinare il modello dai dati)


Concetti chiave


Il test

Il test, lo strumento chiave di valutazione della mente come oggetto, nonché principio chiave di tutta la psicometria può essere definito come un insieme di stimoli, o item, standardizzati per tipologia, durata, ordine, sequenza e istruzioni. Questi stimoli sono cotruiti in maniera tale da rappresentare, in base al modello teorico che li ha edificati, una determinata funzione cognitiva o dipersonalità. Le risposte del soggetto vengono anch'esse codificate in maniera standardizzata ottenendo specifici punteggi assegnati in base alle indicazioni teoriche e metodologiche fornite dal manuale del test. Tali punteggi vengono sia confrontati nelle sottoaree che li compongono, sia convertiti in valori standard (vedi standardizzazione)e confrontati ad un campione normativo. Tale campione, costruito nella fase di taratura del test è di solito rappresentativo della popolazione nazionale di riferimento. In base ai punteggi ottenuti, e a tutti i confronti su di essi svolti, è possibile definire in maniera quantititativa le differenze ottenute tra i rispondenti nel test.

Validità e attendibilità

I concetti fondamentali nella teoria classica della misura sono attendibilità e validità. Una misura certa sta misurando costantemente qualcosa, mentre una misura valida sta misurando che cosa è supposto per misurare. Una misura certa può essere costante senza necessariamente essere valida, il e.g., uno strumento di misura come un righello rotto può sempre sotto-misura un la quantità dallo stesso importo ogni volta (costantemente), ma la quantità risultante è ancora errata, cioè, non valido. Per un altro esempio, un fucile certo avrà una serie di ingranaggi stretta delle pallottole nell'obiettivo, mentre valido verterà la relativa serie di ingranaggi sul centro dell'obiettivo, se o non la serie di ingranaggi è stretta. Sia l'attendibilità che la validità possono essere valutate matematicamente. La consistenza interna può essere valutata correlando le prestazioni su due metà di una prova (attendibilità split-half); il valore del coefficiente di correlazione prodotto-momento di Pearson è registrato con la formula Spearman-Marrone di previsione per corrispondere alla correlazione fra due prove integrali. Altri metodi includono la correlazione del intra-codice categoria (il rapporto della varianza delle misure di dato obiettivo alla varianza di tutti gli obiettivi). Una misura comunemente usata è l'alfa di Cronbach, equivalente alla media di tutti i coefficienti possibili di split-half. L'eccedenza di stabilità ha ripetuto le misure è valutata con il coefficiente di Pearson, come è l'equivalenza delle versioni differenti della stessa misura (forme differenti di una prova di intelligenza, per esempio). Altre misure inoltre sono usate.

La validità può essere valutata correlando le misure con una misura di test di verifica conosciuta per essere valida. Quando la misura di test di verifica è raccolta nello stesso momento in cui la misura che è convalidata l'obiettivo deve stabilire la validità simultanea; quando il test di verifica è raccolto più successivamente l'obiettivo è di stabilire la validità preventiva. Una misura ha validità della costruzione se è collegato con altre variabili secondo le esigenze della teoria. La validità soddisfatta è semplicemente una dimostrazione che gli articoli di una prova sono disegnati dal dominio che è misurato. In un esempio di selezione dei personali, il soddisfare della prova è basato su una dichiarazione o su un insieme definita delle dichiarazione di conoscenza, di abilità, di abilità, o di altre caratteristiche ottenute da un'analisi delle mansioni.

La validità preventiva o simultanea non può eccedere il quadrato della correlazione fra due versioni della stessa misura.

La teoria di risposta dell'articolo modella il rapporto fra le caratteristiche e le risposte latenti agli articoli della prova. Tra altri vantaggi, IRT fornisce una base per ottenere una valutazione della posizione di un prova-acquirente su una data caratteristica latente così come l'errore standard della misura di quella posizione. Per esempio, la conoscenza dell'allievo dell'università di storia può essere dedotta dal suo segno su una prova dell'università ed allora essere paragonata attendibilmente a conoscenza dell'allievo della High School dedotta da una prova meno difficile. I segni hanno derivato dalla teoria classica della prova non hanno questa caratteristica e la valutazione di abilità reale (piuttosto che di abilità riguardante altri prova-acquirenti) deve essere valutata confrontando i segni a quelli di un gruppo di norma scelto a caso dalla popolazione. Infatti, tutte le misure derivate dalla teoria classica della prova dipendono dal campione collaudato, mentre, in linea di principio, quelle derivate dalla teoria di risposta dell'articolo non sono.

Bibliografia

  • Introduction to psychometrics, su gentile concessione. Testo sotto licenza GFDL
  • Andrich, D. & Luo, G. (1993) A hyperbolic cosine model for unfolding dichotomous single-stimulus
  • Michell, J. (1997). Quantitative science and the definition of measurement in psychology. British Journal of Psychology, 88, 355-383.
  • Michell, J. (1999). Measurement in Psychology. Cambridge: Cambridge University Press.
  • Rasch, G. (1960/1980). Probabilistic models for some intelligence and attainment tests. Copenhagen, *Danish Institute for Educational Research), expanded edition (1980) with foreword and afterword by B.D. Wright. Chicago: The University of Chicago Press.
  • Reese, T.W. (1943). The application of the theory of physical measurement to the measurement of psychological magnitudes, with three experimental examples. Psychological Monographs, 55, 1-89.
  • Stevens, S. S. (1946). On the theory of scales of measurement. Science, 103, 667-80.
  • Thurstone, L.L. (1927). A law of comparative judgement. Psychological Review, 34, 278-286.
  • Thurstone, L.L. (1929). The Measurement of Psychological Value. In T.V. Smith and W.K. Wright (Eds.), Essays in Philosophy by Seventeen Doctors of Philosophy of the University of Chicago. Chicago: Open Court.
  • Thurstone, L.L. (1959). The Measurement of Values. Chicago: The University of Chicago Press.

Voci correlate

Collegamenti esterni

  Portale Psicologia: accedi alle voci di Wikipedia che trattano di psicologia