Archivio tag: Ricerca sperimentale

La dimensione temporale negli esperimenti

Quello che affronteremo adesso è un argomento abbastanza ampio, che, per essere trattato come si dovrebbe, meriterebbe la stesura non di un post, ma di un libro (almeno uno). Non sviscererò quindi tutti gli aspetti, ma proverò a lanciare degli input per eventuali approfondimenti.

Clessidra

Il tempo è una dimensione che non può essere trascurata in tutti quei disegni di ricerca che fanno uso di fattori within subjects, nei quali, in un modo o nell’altro, esso andrebbe tenuto in considerazione in fase di analisi dei dati (anche se, a onor del vero, non sempre questo viene fatto). Talvolta il tempo è considerato come una vera e propria variabile indipendente senza la quale lo studio non avrebbe motivo di esistere; altre volte, invece, è solo un impiccio che i ricercatori, se potessero, eliminerebbero come un qualsiasi altro fattore di disturbo.

Di seguito analizzeremo tre tipi di disegni di ricerca nei quali il tempo entra prepotentemente in gioco. Si tratta di tre disegni dalla struttura molto semplice: comunemente, una ricerca ha un assetto decisamente più articolato, ma per comprendere casi più complessi è bene partire da qualcosa di semplice (l’auspicio è che, alla fine, generalizzare sarà cosa semplice). Nel corso della trattazione farò riferimento prevalentemente alla ricerca sperimentale in campo psicologico, perché questo è il mio campo. Penso comunque che il lettore proveniente da altri albiti disciplinari avrà poca difficoltà a proiettare gli esempi nel proprio settore di interesse.

In questo post non entrerò nel merito di questioni legate all’elaborazione statistica dei dati, che saranno oggetto di prossimi interventi sul blog.

Caso #1

Immaginiamo di stare studiano l’evoluzione della condizione clinica di uno gruppo di pazienti in conseguenza a un trattamento terapeutico. I pazienti vengono valutati in quattro momenti distinti: prima dell’inizio del trattamento (t0), durante il trattamento (t1) e al termine del trattamento (t2); inoltre, per verificare il mantenimento di un eventuale miglioramento, i pazienti vengono misurati anche qualche tempo dopo la conclusione della terapia (t3).

Ho provato a schematizzare questo disegno nella figura sottostante, dove è rappresentata la linea del tempo con indicati i quattro momenti di misurazione. Mi si conceda l’assenza di un gruppo di controllo, che certamente dovrebbe essere contemplato in uno studio di questo tipo, ma che qui ho trascurato a favore della semplicità espositiva.

Schema caso 1

In uno studio come questo, la variabile “tempo” è un fattore fisso a quattro livelli, perché quattro sono le misurazioni. Inoltre, il tempo è anche un fattore within subjects, perché, per ogni livello, le misurazioni vengono effettuate sugli stessi pazienti.

In questo caso #1, il tempo è una variabile fondamentale e imprescindibile nella ricerca: si sta studiando l’evoluzione dei pazienti e il concetto di “evoluzione” presuppone il concetto di “tempo”.

Questo tipo di disegno spesso viene detto “a misure ripetute”. Come già avevo sottolineato in un precedente post, certamente su ogni paziente viene ripetuta la misurazione, ma in condizioni diverse: si suppone che, tra una misurazione e l’altra, i pazienti siano cambiati a seguito del trattamento. Le unità su cui vengono rilevati i dati sono di volta in volta le stesse (i pazienti), ma ogni misurazione è di per sé diversa, perché effettuata a seguito di un presunto cambiamento. Se ogni paziente fosse misurato più volte a t0, più volte a t1, ecc., quella sì che sarebbe una vera misura ripetuta!

Caso #2

Comunemente, in un esperimento di laboratorio si ha un fattore “condizione”, i cui livelli rappresentano le singole condizioni sperimentali. Quando questo fattore è di tipo within subjects, ogni partecipante alla ricerca affronta tutte le condizioni sperimentali, per cui viene testato per tutti i livelli del fattore, che nella figura qui sotto ho denominato A, B e C.

Schema caso 2

Questo disegno sperimentale è molto simile al precedente nella struttura, ma profondamente diverso nella filosofia. Infatti, di solito l’ordine di presentazione delle condizioni può essere alterato senza generare alcun problema. Un partecipante può essere testato prima nella condizione A, poi B e infine C, oppure prima in B, poi in C e infine in A, e così via. Addirittura, alcuni partecipanti possono affrontare le condizioni in un senso, altri in un altro senso, altri in un altro senso ancora, ecc. Il tempo non dovrebbe giocare alcun ruolo in in uno studio del genere, per cui l’ordine di presentazione delle condizioni può essere variato. Nello schema più sopra, infatti, non è rappresentata la linea del tempo.

Alterare l’ordine dei livelli del fattore non sarebbe possibile nel caso #1; un mondo nel quale è possibile effettuare una misurazione pre-trattamento anche dopo aver iniziato il trattamento, contemplerebbe l’esistenza di una macchina del tempo che il rasoio di Occam ci sconsiglia di contemplare.

Tra parentesi, il software statistico R è in grado di distinguere i fattori dai livelli ordinati come il fattore “tempo” del caso #1, dai fattori dai livelli non ordinati, come il fattore “condizione” di questo secondo caso. I primi vengono definiti con la funzione ordered, mentre i secondi con la funzione factor.

In un disegno di ricerca come questo del caso #2, il tempo è solo un impiccio. È infatti possibile che le condizioni si influenzino vicendevolmente, per cui, per esempio, il fatto di aver affrontato prima A, potrebbe alterare l’esito della successiva condizione B se non addirittura di C.

Si tratta di un problema molto sentito negli studi sperimentali in psicologia. Il caso più comune è quello dell’effetto stanchezza: nel corso dell’esperimento i partecipanti rischiano di affaticarsi. Questo affaticamento potrebbe portare a scoprire una differenza tra le condizioni da imputare non a una reale diversità tra esse, ma al semplice fatto che le prestazioni dei partecipanti sono calate a causa di un fattore (l’affaticamento), che nulla ha a che vedere con lo studio e che non è contemplato nel disegno della ricerca. L’affaticamento implica che se ho affrontato prima A, la mia performance sarà migliore in A, se ho affrontato prima B, la mia performance sarà migliore in B, e così via. Allo stesso modo, i partecipanti potrebbero impratichirsi nel corso della prova, con un effetto apprendimento che, di fatto, comporterebbe problemi analoghi. Strategie come il controbilanciamento e l’uso di sessioni di allenamento servono proprio a limitare questi effetti.

In un esperimento, effetti indesiderati legati alla pratica, all’apprendimento, alla fatica, sono raggruppati sotto l’etichetta di effetto ordine. Effetti invece legati all’influenza di una condizione sull’altra, dovuta sempre all’ordine di presentazione, sono chiamati effetto sequenza. Per esempio, in un esperimento relativo alla percezione di pesantezza, dopo aver sollevato un oggetto molto pesante (condizione A), potrei percepire molto leggero l’oggetto successivo (condizione B); se invece l’oggetto della condizione B fosse presentato di seguito a un oggetto molto leggero (condizione C), forse lo percepirei molto pesante.

Dunque, se mai fosse possibile, il ricercatore testerebbe ogni soggetto contemporaneamente su tutte e tre le condizioni, onde evitare i problemi descritti. Il tempo non è contemplato nello studio e costituisce solo un fattore di disturbo, il cui effetto deve essere controllato e, per quanto possibile, limitato.

Caso #3

Il terzo caso è un’estensione del secondo e forse si presenta anche più di frequente. Si ha sempre un fattore “condizione”, ma, a differenza di prima, ogni soggetto sperimentale viene testato più volte in una medesima condizione. Nello schema riportato qui sotto, ho immaginato un fattore condizione a tre livelli e quattro misurazioni ripetute all’interno di ogni condizione.

Schema caso 3

Le quattro misurazioni rappresentate qui sopra sono delle vere misure ripetute: ogni unità viene ripetutamente misurata nelle medesime condizioni. Bisogna considerare che, per forza di cose, tra una misura e l’altra passa un certo intervallo di tempo: la prova può essere ripetuta in intervalli anche molto ravvicinati, ma tra una rilevazione e l’altra sarà sempre trascorso un certo lasso di tempo.

La ”misurazione ripetuta“ è una pratica molto comune in psicologia (ma non solo). In psicologia si devono fare i conti con variabilità molto ampie, anche inter-individuali. Misurando un’abilità mentale, un’opinione, un fenomeno percettivo, difficilmente una stessa persona darà due volte la stessa identica risposta. Rispondendo a uno stimolo, talvolta saremo più rapidi e altre volte più lenti, anche se lo stimolo non è cambiato. Eseguendo uno stesso compito, talvolta saremo più accurati, altre volte meno. Per questo motivo, in psicologia si diffida della misurazione secca e si preferisce testare e ritestare una persona nelle medesime condizioni, in modo da poter misurare anche la variabilità delle risposte.

Ripetendo la misurazione in una stessa condizione, stiamo inserendo nel disegno un ulteriore fattore, che comunemente viene denominato trial (prova). Difatti, tecnicamente lo schema raffigurato qui sopra rappresenta un disegno sperimentale 3×4: tre condizioni per quattro misurazioni. Il trial può essere considerato come un fattore fisso (di tipo within subjects) ed essere inserito come variabile indipendente in un modello come quello di analisi della varianza, ma potrebbe anche essere considerato come un fattore casuale. Che cosa è un fattore casuale? Se non lo sapete, vi consiglio di andare a leggere questo articolo (che, ve ne sarete accorti, sto citando in continuazione dall’inizio del post).

Il trial ha tutte le caratteristiche di un fattore casuale. Vediamole.

1. Analizzare le differenze tra i livelli del fattore trial non è oggetto dello studio (perlomeno, di solito è così). Ciò che interessa è studiare le differenze tre le condizioni sperimentali: le differenze tra le varie misurazioni costituiscono “rumore“ del quale lo sperimentatore farebbe a meno.

2. Posso effettuare una, due, tre… cento, mille misurazioni, senza che cambi il senso dello studio: aumentando o diminuendo il numero di trial, la logica sottostante lo studio non cambia. Diversamente, aggiungendo o togliendo condizioni sperimentali lo studio cambierebbe eccome, perché la struttura dell’esperimento risulterebbe alterata: non posso rimuovere condizioni sperimentali senza intaccare il fondamento teorico che ha mosso la ricerca. Bisogna comunque andarci cauti: il numero di trial deve essere scelto accuratamente, nell’ottica sì di misurare ripetutamente, ma evitando di affaticare troppo i partecipanti.

Si presti attenzione a una questione importante, molto rilevante in psicologia ma anche in altre discipline. Il fatto di aver scelto di testare un soggetto oggi, a una certa ora, implica una certa risposta; se invece il soggetto fosse stato testato ieri, magari a un’ora diversa, molto probabilmente esso avrebbe fornito un’altra risposta. Ecco che la “misura 1” di oggi risulterà diversa dalla “misura 1” che avrei ottenuto ieri. Questo fenomeno è implicito nell’esistenza del tempo e non lo possiamo contrastare: possiamo solo adeguatamente tenerlo in considerazione in fase di analisi dei dati (ma questa è un’altra storia). Ricordiamoci che, in un certo senso, un livello del fattore trial è un qualcosa di irripetibile e che mai più si ripresenterà.

Possiamo vedere il caso #2 come un caso particolare del #3 in cui il fattore trial ha un solo livello.

A questo punto, mi piacerebbe raccontarvi come si gestiscono le “misure ripetute” in R… ma, per questo, datemi ancora un po’ di tempo!

Tipologie di fattori nei disegni sperimentali

Nei disegni sperimentali si ha spesso a che fare con variabili indipendenti categoriali: i fattori. Questi, comunemente, vengono suddivisi in due tipologie: quelli “between subjects” e quelli “within subjects”. Tuttavia, tale suddivisione non è l’unica possibile: in questo piccolo tutorial cercheremo di capire meglio cosa sono i fattori “fixed” e “random” di cui si sente spesso parlare e cosa si intende per fattori “nested” e “crossed”. Tali concetti sono infatti la base per comprendere al meglio alcune moderne metodologie di analisi dei dati che ormai vanno sempre più imponendosi: i modelli gerarchici/multilivello e i modelli a effetti misti.

Fattori between e fattori within

La denominazione “between” e “within” deriva direttamente dall’analisi della varianza, dove “between” indica la varianza tra i gruppi e “within” indica la varianza entro i gruppi. La differenza tra queste due tipologie di fattori è la più comune e ben documentata anche sul web, per cui eviterò di dilungarmi.

Brevemente, un fattore between è una variabile i cui livelli raggruppano delle osservazioni provenienti da unità statistiche differenti. Un esempio può essere il sesso, fattore a due livelli (maschio/femmina): se un soggetto appartiene al gruppo “maschi” non potrà, per ovvi motivi, far parte anche del gruppo “femmine”, e viceversa. Allo stesso modo, se una volta campionati dei soggetti, ad alcuni viene somministrata una terapia A, ad altri viene somministrata una terapia diversa, B, e ad altri ancora viene somministrata una terapia C, i tre livelli del fattore terapia (A, B e C) raggrupperanno osservazioni provenienti da soggetti diversi, per cui anche questo fattore sarà di tipo between.

Diversamente, in un fattore within i livelli raggruppano osservazioni provenienti dalle medesime unità statistiche. Riprendendo l’esempio fatto poco fa, se agli stessi soggetti venisse somministrato prima il trattamento A, poi il trattamento B e poi il trattamento C, allora questo fattore sarà detto within.
Questi fattori sono chiamati anche “a misure ripetute”, in quanto su ogni soggetto viene effettuata più volte la misurazione di una variabile dipendente. Personalmente trovo poco felice questa denominazione, in quanto un fattore “within” come quello descritto nell’esempio prevede sì la ripetizione della misurazione, ma in condizioni sperimentali diverse. Spesso, si preferisce chiamare “misura ripetuta” la ripetizione della misurazione nella medesima condizione sperimentale.

Fattori fissi e fattori casuali

Un fattore è detto fisso (fixed) se i suoi livelli non sono scelti casualmente ma sono stati determinati a tavolino dallo sperimentatore. Il fattore trattamento dell’esempio precedente è fisso, perché chi ha pianificato la ricerca è interessato a valutare proprio l’effetto dei trattamenti A, B e C, e non di altri trattamenti: la scelta dei livelli A, B e C non è stata casuale ma motivata da specifici interessi di ricerca, e la valutazione delle differenze che si possono presentare alla somministrazione di questi tre trattamenti costituisce uno scopo primario della sperimentazione.
Questo, si badi bene, a prescindere dal fatto che il fattore sia between o within. Il fattore trattamento potrebbe essere costruito sia come between che come within, ma comunque sarebbe di tipo fisso.
Tra i fattori fissi rientrano anche tutti quei fattori, come il sesso, per i quali i livelli considerati sono tutti quelli possibili presenti nella popolazione.

Un fattore è detto casuale (random) quando i suoi livelli sono solo un campione casuale di tutti i possibili livelli presenti nella popolazione. Per esempio, il fattore “soggetto” è di tipo casuale: lo sperimentatore, normalmente, non è interessato a valutare le differenze tra gli specifici soggetti campionati; inoltre, la variabilità che sussiste fra i diversi livelli (ovvero i singoli soggetti) normalmente non è sotto analisi sperimentale, bensì è considerata come errore.
A un fattore casuale possono essere aggiunti livelli al fine di aumentare la potenza dell’analisi statistica, mentre quest’operazione non avrebbe senso su un fattore fisso i cui livelli sono, appunto, in numero fisso.

Per fare un esempio: immaginiamo di dover valutare la differenza fra nord e sud Italia su una variabile dipendente, e scegliamo cinque città del sud e cinque città del nord da cui campionare alcune persone da intervistare. In una ricerca di questo tipo avremo tre fattori: uno fisso (l’area: nord o sud Italia) e due casuali: il fattore città (sono state scelte solo alcune città fra tutte quelle campionabili) e il fattore soggetto (all’interno di ogni città verranno intervistati solo alcuni fra tutti i possibili soggetti campionabili).

La classica analisi della varianza considera tutti i fattori come fissi, e la variabilità attribuibile alle differenze fra i livelli di fattori casuali diventa errore. Modelli statistici più sofisticati sono in grado di prendere in considerazione anche i fattori casuali, e per questo vanno sotto il nome di modelli a effetti misti, perché considerano l’effetto sia di una componente fissa che di una componente casuale.

Fattori annidati e fattori incrociati

Due fattori sono fra loro annidati (nested) quando ogni livello di uno si incrocia con un solo livello dell’altro. Nell’esempio riportato sopra, città e cittadini sono “nested”, in quanto ogni persona potrà essere residente in una sola città. Quindi, i livelli del fattore “cittadini” sono annidati all’interno del fattore “città”. I dati hanno una struttura gerarchica: i cittadini si trovano nello strato più profondo e le città nello strato più superficiale.

Due fattori si dicono invece incrociati (crossed) quando tutti i livelli di uno si presentano in concomitanza di tutti i livelli dell’altro; è quello che succede di solito negli studi di laboratorio, quando vengono incrociati i livelli dei fattori per delineare tutte le possibili condizioni sperimentali.

Non solo i fattori fissi possono essere incrociati, ma anche quelli casuali (e, viceversa, anche i fattori fissi possono essere annidati). Per esempio, in un test per la valutazione della memoria, immaginiamo di somministrare una lista di parole delle persone: avremo sia il fattore casuale “soggetto” che il fattore casuale “lista”, i cui livelli sono le singole parole. A ogni soggetto viene chiesto di ricordare ogni parola, per cui i due fattori risulteranno incrociati.