La dimensione temporale negli esperimenti

Quello che affronteremo adesso è un argomento abbastanza ampio, che, per essere trattato come si dovrebbe, meriterebbe la stesura non di un post, ma di un libro (almeno uno). Non sviscererò quindi tutti gli aspetti, ma proverò a lanciare degli input per eventuali approfondimenti.

Clessidra

Il tempo è una dimensione che non può essere trascurata in tutti quei disegni di ricerca che fanno uso di fattori within subjects, nei quali, in un modo o nell’altro, esso andrebbe tenuto in considerazione in fase di analisi dei dati (anche se, a onor del vero, non sempre questo viene fatto). Talvolta il tempo è considerato come una vera e propria variabile indipendente senza la quale lo studio non avrebbe motivo di esistere; altre volte, invece, è solo un impiccio che i ricercatori, se potessero, eliminerebbero come un qualsiasi altro fattore di disturbo.

Di seguito analizzeremo tre tipi di disegni di ricerca nei quali il tempo entra prepotentemente in gioco. Si tratta di tre disegni dalla struttura molto semplice: comunemente, una ricerca ha un assetto decisamente più articolato, ma per comprendere casi più complessi è bene partire da qualcosa di semplice (l’auspicio è che, alla fine, generalizzare sarà cosa semplice). Nel corso della trattazione farò riferimento prevalentemente alla ricerca sperimentale in campo psicologico, perché questo è il mio campo. Penso comunque che il lettore proveniente da altri albiti disciplinari avrà poca difficoltà a proiettare gli esempi nel proprio settore di interesse.

In questo post non entrerò nel merito di questioni legate all’elaborazione statistica dei dati, che saranno oggetto di prossimi interventi sul blog.

Caso #1

Immaginiamo di stare studiano l’evoluzione della condizione clinica di uno gruppo di pazienti in conseguenza a un trattamento terapeutico. I pazienti vengono valutati in quattro momenti distinti: prima dell’inizio del trattamento (t0), durante il trattamento (t1) e al termine del trattamento (t2); inoltre, per verificare il mantenimento di un eventuale miglioramento, i pazienti vengono misurati anche qualche tempo dopo la conclusione della terapia (t3).

Ho provato a schematizzare questo disegno nella figura sottostante, dove è rappresentata la linea del tempo con indicati i quattro momenti di misurazione. Mi si conceda l’assenza di un gruppo di controllo, che certamente dovrebbe essere contemplato in uno studio di questo tipo, ma che qui ho trascurato a favore della semplicità espositiva.

Schema caso 1

In uno studio come questo, la variabile “tempo” è un fattore fisso a quattro livelli, perché quattro sono le misurazioni. Inoltre, il tempo è anche un fattore within subjects, perché, per ogni livello, le misurazioni vengono effettuate sugli stessi pazienti.

In questo caso #1, il tempo è una variabile fondamentale e imprescindibile nella ricerca: si sta studiando l’evoluzione dei pazienti e il concetto di “evoluzione” presuppone il concetto di “tempo”.

Questo tipo di disegno spesso viene detto “a misure ripetute”. Come già avevo sottolineato in un precedente post, certamente su ogni paziente viene ripetuta la misurazione, ma in condizioni diverse: si suppone che, tra una misurazione e l’altra, i pazienti siano cambiati a seguito del trattamento. Le unità su cui vengono rilevati i dati sono di volta in volta le stesse (i pazienti), ma ogni misurazione è di per sé diversa, perché effettuata a seguito di un presunto cambiamento. Se ogni paziente fosse misurato più volte a t0, più volte a t1, ecc., quella sì che sarebbe una vera misura ripetuta!

Caso #2

Comunemente, in un esperimento di laboratorio si ha un fattore “condizione”, i cui livelli rappresentano le singole condizioni sperimentali. Quando questo fattore è di tipo within subjects, ogni partecipante alla ricerca affronta tutte le condizioni sperimentali, per cui viene testato per tutti i livelli del fattore, che nella figura qui sotto ho denominato A, B e C.

Schema caso 2

Questo disegno sperimentale è molto simile al precedente nella struttura, ma profondamente diverso nella filosofia. Infatti, di solito l’ordine di presentazione delle condizioni può essere alterato senza generare alcun problema. Un partecipante può essere testato prima nella condizione A, poi B e infine C, oppure prima in B, poi in C e infine in A, e così via. Addirittura, alcuni partecipanti possono affrontare le condizioni in un senso, altri in un altro senso, altri in un altro senso ancora, ecc. Il tempo non dovrebbe giocare alcun ruolo in in uno studio del genere, per cui l’ordine di presentazione delle condizioni può essere variato. Nello schema più sopra, infatti, non è rappresentata la linea del tempo.

Alterare l’ordine dei livelli del fattore non sarebbe possibile nel caso #1; un mondo nel quale è possibile effettuare una misurazione pre-trattamento anche dopo aver iniziato il trattamento, contemplerebbe l’esistenza di una macchina del tempo che il rasoio di Occam ci sconsiglia di contemplare.

Tra parentesi, il software statistico R è in grado di distinguere i fattori dai livelli ordinati come il fattore “tempo” del caso #1, dai fattori dai livelli non ordinati, come il fattore “condizione” di questo secondo caso. I primi vengono definiti con la funzione ordered, mentre i secondi con la funzione factor.

In un disegno di ricerca come questo del caso #2, il tempo è solo un impiccio. È infatti possibile che le condizioni si influenzino vicendevolmente, per cui, per esempio, il fatto di aver affrontato prima A, potrebbe alterare l’esito della successiva condizione B se non addirittura di C.

Si tratta di un problema molto sentito negli studi sperimentali in psicologia. Il caso più comune è quello dell’effetto stanchezza: nel corso dell’esperimento i partecipanti rischiano di affaticarsi. Questo affaticamento potrebbe portare a scoprire una differenza tra le condizioni da imputare non a una reale diversità tra esse, ma al semplice fatto che le prestazioni dei partecipanti sono calate a causa di un fattore (l’affaticamento), che nulla ha a che vedere con lo studio e che non è contemplato nel disegno della ricerca. L’affaticamento implica che se ho affrontato prima A, la mia performance sarà migliore in A, se ho affrontato prima B, la mia performance sarà migliore in B, e così via. Allo stesso modo, i partecipanti potrebbero impratichirsi nel corso della prova, con un effetto apprendimento che, di fatto, comporterebbe problemi analoghi. Strategie come il controbilanciamento e l’uso di sessioni di allenamento servono proprio a limitare questi effetti.

In un esperimento, effetti indesiderati legati alla pratica, all’apprendimento, alla fatica, sono raggruppati sotto l’etichetta di effetto ordine. Effetti invece legati all’influenza di una condizione sull’altra, dovuta sempre all’ordine di presentazione, sono chiamati effetto sequenza. Per esempio, in un esperimento relativo alla percezione di pesantezza, dopo aver sollevato un oggetto molto pesante (condizione A), potrei percepire molto leggero l’oggetto successivo (condizione B); se invece l’oggetto della condizione B fosse presentato di seguito a un oggetto molto leggero (condizione C), forse lo percepirei molto pesante.

Dunque, se mai fosse possibile, il ricercatore testerebbe ogni soggetto contemporaneamente su tutte e tre le condizioni, onde evitare i problemi descritti. Il tempo non è contemplato nello studio e costituisce solo un fattore di disturbo, il cui effetto deve essere controllato e, per quanto possibile, limitato.

Caso #3

Il terzo caso è un’estensione del secondo e forse si presenta anche più di frequente. Si ha sempre un fattore “condizione”, ma, a differenza di prima, ogni soggetto sperimentale viene testato più volte in una medesima condizione. Nello schema riportato qui sotto, ho immaginato un fattore condizione a tre livelli e quattro misurazioni ripetute all’interno di ogni condizione.

Schema caso 3

Le quattro misurazioni rappresentate qui sopra sono delle vere misure ripetute: ogni unità viene ripetutamente misurata nelle medesime condizioni. Bisogna considerare che, per forza di cose, tra una misura e l’altra passa un certo intervallo di tempo: la prova può essere ripetuta in intervalli anche molto ravvicinati, ma tra una rilevazione e l’altra sarà sempre trascorso un certo lasso di tempo.

La ”misurazione ripetuta“ è una pratica molto comune in psicologia (ma non solo). In psicologia si devono fare i conti con variabilità molto ampie, anche inter-individuali. Misurando un’abilità mentale, un’opinione, un fenomeno percettivo, difficilmente una stessa persona darà due volte la stessa identica risposta. Rispondendo a uno stimolo, talvolta saremo più rapidi e altre volte più lenti, anche se lo stimolo non è cambiato. Eseguendo uno stesso compito, talvolta saremo più accurati, altre volte meno. Per questo motivo, in psicologia si diffida della misurazione secca e si preferisce testare e ritestare una persona nelle medesime condizioni, in modo da poter misurare anche la variabilità delle risposte.

Ripetendo la misurazione in una stessa condizione, stiamo inserendo nel disegno un ulteriore fattore, che comunemente viene denominato trial (prova). Difatti, tecnicamente lo schema raffigurato qui sopra rappresenta un disegno sperimentale 3×4: tre condizioni per quattro misurazioni. Il trial può essere considerato come un fattore fisso (di tipo within subjects) ed essere inserito come variabile indipendente in un modello come quello di analisi della varianza, ma potrebbe anche essere considerato come un fattore casuale. Che cosa è un fattore casuale? Se non lo sapete, vi consiglio di andare a leggere questo articolo (che, ve ne sarete accorti, sto citando in continuazione dall’inizio del post).

Il trial ha tutte le caratteristiche di un fattore casuale. Vediamole.

1. Analizzare le differenze tra i livelli del fattore trial non è oggetto dello studio (perlomeno, di solito è così). Ciò che interessa è studiare le differenze tre le condizioni sperimentali: le differenze tra le varie misurazioni costituiscono “rumore“ del quale lo sperimentatore farebbe a meno.

2. Posso effettuare una, due, tre… cento, mille misurazioni, senza che cambi il senso dello studio: aumentando o diminuendo il numero di trial, la logica sottostante lo studio non cambia. Diversamente, aggiungendo o togliendo condizioni sperimentali lo studio cambierebbe eccome, perché la struttura dell’esperimento risulterebbe alterata: non posso rimuovere condizioni sperimentali senza intaccare il fondamento teorico che ha mosso la ricerca. Bisogna comunque andarci cauti: il numero di trial deve essere scelto accuratamente, nell’ottica sì di misurare ripetutamente, ma evitando di affaticare troppo i partecipanti.

Si presti attenzione a una questione importante, molto rilevante in psicologia ma anche in altre discipline. Il fatto di aver scelto di testare un soggetto oggi, a una certa ora, implica una certa risposta; se invece il soggetto fosse stato testato ieri, magari a un’ora diversa, molto probabilmente esso avrebbe fornito un’altra risposta. Ecco che la “misura 1” di oggi risulterà diversa dalla “misura 1” che avrei ottenuto ieri. Questo fenomeno è implicito nell’esistenza del tempo e non lo possiamo contrastare: possiamo solo adeguatamente tenerlo in considerazione in fase di analisi dei dati (ma questa è un’altra storia). Ricordiamoci che, in un certo senso, un livello del fattore trial è un qualcosa di irripetibile e che mai più si ripresenterà.

Possiamo vedere il caso #2 come un caso particolare del #3 in cui il fattore trial ha un solo livello.

A questo punto, mi piacerebbe raccontarvi come si gestiscono le “misure ripetute” in R… ma, per questo, datemi ancora un po’ di tempo!

Print Friendly, PDF & Email
Print Friendly, PDF & Email

Lascia un commento