Home Forum Statistica con R Problema: confrontare linee guida a un database

This topic contains 4 replies and has 3 voices.

Viewing 5 posts - 1 through 5 (of 5 total)
  • Author
    Posts
  • #4964

    Giuseppe12
    Participant

    Ciao,

    come faccio a confrontare delle linee guida di alcuni farmaci con un database che contiene dati di real-world?
    Secondo voi è possibile confrontarli in modo da vedere quanto i dati reali si discostano dalle linee guida? E’ possibile fare una cosa del genere con R? Se s, vi sarei grado se poteste indicarmi in linea generale come procedere.

    Grazie
    Giuseppe

    #5004
    AntopRet1
    AntopRet1
    Participant

    Caro Giuseppe, la domanda non consente una risposta.
    R è sia un linguaggio di programmazione che un programma di analisi statistica.
    Come tale è stato creato, e si sviluppa, per rispondere a problemi specifici.

    Di primo acchito ti direi: sì, è possibile.
    Per trovare una soluzione al tuo quesito, però, è necessario specificare nel dettaglio i problemi del caso.

    Ad esempio;
    - dal punto di vista della programmazione, come gestire le due informazioni, quelle definite dalle linee guida (ad esempio, usare non più di due farmaci e a dosi comprese tra x e y) e quelle contenute nel database del real-world (non saprei come dare esempio, questo tipo di informazioni sono registrate nei modi più impensabili);
    - dal punto di vista statistico (cosa analizzare e come).

    Senza un esempio di come i dati sono definiti, è impossibile anche solo pensare a una soluzione.

    Ad un livello elementare, una informazione è definita da un sistema di coordinate, che nell’universo ‘tidy’, cioè “pulito”, promosso dagli attuali sviluppatori di R, si riducono ad una matrice di righe e colonne.

    Il confronto da te richiesto prevede il confronto tra una matrice di informazioni in un database (le “linee-guida”) e la matrice di informazioni di un secondo database (i dati del real-world).

    Il primo database può anche essere “virtuale”, una serie di regole cui assoggettare i dati del real-world: ad esempio, assegna ‘True’ a tutti i casi per i quali sono prescritti non più di due farmaci, assegna ‘True’ a tutte le prescrizioni con dose da x a y, etc.

    Per rispondere sensatamente alla domanda, quindi, il quesito è: di cosa si dispone?
    Quale è il tipo di informazione cui si ha accesso (R consente di fare ‘ web scraping’ su praticamente tutto quanto abbia un sistema di accesso)?

    Ma soprattutto, cosa si vuole ottenere in uscita?
    Chi tipo di informazione è attesa dopo l’analisi?

    Consigliabile la consultazione preliminare con uno statistico. Come diceva Sir Ronald (Ronald Aylmer Fisher, uno dei padri della statistica moderna, ed anche della genetica moderna): “To consult the statistician after an experiment is finished is often merely to ask him to conduct a post mortem examination. He can perhaps say what the experiment died of”…

    • This reply was modified 2 months, 1 week ago by AntopRet1 AntopRet1.
    #5008

    Giuseppe12
    Participant

    Grazie AntoRet1 per la risposta.
    Lo scopo è comprendere come i trattamenti del database (dati real world) si distribuiscono secondo le raccomandazioni delle linee guida (le raccomandazioni espresse possono essere OTTIMALI,SUBOTTIMALI e SCONSIGLIATE). In questo modo si valuta l’appropriatezza prescrittiva.
    Le linee guida dei farmaci per l’epatite C sono in formato pdf, e sono composte da “macrocategorie” (che riguardano il genotipo, lo stadio della malattie e alcune altre variabili) sotto le quali ci sono le associazioni di trattamenti che vengono valutate con una raccomandazione OTTIMALE, SUBOTTIMALE e SCONSIGLIATO.
    Il dataset riguarda invece i pazienti trattati con tutte le variabili utili a classificarli.
    In sostanza dovrei:
    1. creare una matrice che contenga tutti i trattamentI, il periodo di validità della linea guida stessa e la classificazione della raccomandazione
    2. cercare ogni caso della matrice di cui sopra nel dataset dei dati di RW.
    3. come faccio il match?

    #5012
    Davide Massidda
    Davide Massidda
    Moderator

    Salve Giuseppe,
    concordo con quanto scritto da AntoPret1. Non è possibile sbrigare la faccenda lanciando uno o due comandi in R, e questa cosa vale anche per qualsiasi altro software statistico. Adesso non so quali siano le richieste nello specifico, ma di sicuro c’è da sviscerare punto per punto le linee guida e tradurle in passaggi sequenziali da affrontare. Ma non pensare che ogni passaggio si risolva con una riga di codice… per poterti aiutare veramente dovremmo sviscerare molto dettagliatamente le linee guida.

    Anche risolvere i tre punti che elenchi non è banale. Per esempio:

    1. creare una matrice che contenga tutti i trattamentI, il periodo di validità della linea guida stessa e la classificazione della raccomandazione

    Cosa vuol dire “matrice di trattamenti”? Intendi dire una matrice che contiene i dati dei soggetti che sono stati sottoposti a dei trattamenti? Quanti trattamenti? Quanti soggetti? Come sono organizzati i dati, in formato “wide” oppure in formato “long”? Sono in Excel? In CSV? O come?

    Oppure:

    2. cercare ogni caso della matrice di cui sopra nel dataset dei dati di RW.

    Chi è RW?

    Non mi è chiaro poi fra che cosa dovresti fare il match…

    Scusa per tutte queste domande, ma per me resta tutto troppo astratto per riuscire a darti una mano concretamente :)

    #5013

    Giuseppe12
    Participant

    Cari,
    proverò a spiegare più chiaramente il problema.
    Da una parte ho un dababase in excel di circa 11 mila pazienti con epatati C. Di questi, considerando il periodo di mio interesse 1/5/15-31/12/16- circa 4500 hanno terminato il trattamento e sono oggetto di analisi. Il database contiene molte variabili cliniche, oltre a quelle anagrafiche, che consentono di sapere quale trattamento è stato prescritto al paziente, se ha terminato il trattamento e se la risposta al trattamento è stata positiva.

    Dall’altra parte ho i diversi aggiornamenti delle linee guida dell’Associazione italiana per lo studio del Fegato (in formato pdf). In ogni documento, sono presenti diverse macrocategorie di pazienti (come per esempio 1. pazienti con Cirrosi ed epatocarcinoma CHILD A non operabile 2. pazienti con epatite Cronoca con Metavir F3 e tante altre) a cui corrispondono diversi trattamenti. Per ogni associazione terapeutica viene espressa una raccomandazione di prescrizione,(Ottimale, subottimale,Sconsigliata).
    Vorrei in sostanza cercare di classificare i pazienti del database secondo le raccomandazioni delle linee guida. C
    Dovrei rispondere a questa domanda: quanti sono i pazienti del database a cui è stato prescritto quel determinato trattamento raccomandato dalle linee guida come ottimale, subottimale o sconsigliato?

    Vi allego il link di una linea guida, cosi magari vi fate una idea. (i box in azzurro della linea guida contiene le variabili
    che mi servono per selezionare i pazienti. Ovviamente tali variabili sono presenti nel database excel),

    http://www.webaisf.org/media/38752/documento__hcv_07.07.2017a.pdf

    Secondo voi, come sarebbe opportuno procedere?

    Grazie e speriamo di essere stato chiaro :)
    Giuseppe

Viewing 5 posts - 1 through 5 (of 5 total)

You must be logged in to reply to this topic.