Home Forum Fuoritema Help! Mi date qualche consiglio sul "Text mining"?

Questo argomento contiene 2 risposte, ha 2 partecipanti, ed è stato aggiornato da Francesco Cabiddu Francesco Cabiddu 2 anni, 2 mesi fa.

Stai vedendo 3 articoli - dal 1 a 3 (di 3 totali)
  • Autore
    Articoli
  • #5724
    Anna
    Anna
    Partecipante

    Salve a tutti! Mi sono avvicinata a R perché ho bisogno di sottoporre ad un’analisi testuale un corpus di testi. Qual è il miglior modo per imparare ad usare le funzioni di R per questo scopo?
    Sto leggendo il manuale di Mineo e parallelamente sto familiarizzando con l’ambiente R attraverso Data Camp (https://campus.datacamp.com/courses/introduzione-a-r/capitolo-3-matrici?ex=4), ma sono un po’ spaesata. Ho un Mac, il che mi pare non faciliti molto quest’operazione dato che il manuale riporta prevalentemente esempi per gli utenti di Windows, e inoltre in Data Camp non ho trovato esempi che riguardassero specificamente il text mining.
    Sapete darmi qualche consiglio?
    Grazie! 🙂
    Anna

    #5727
    Anna
    Anna
    Partecipante

    In realtà sono riuscita anche a eseguire correttamente l’esempio riportato qui:

    https://rstudio-pubs-static.s3.amazonaws.com/265713_cbef910aee7642dc8b62996e38d2825d.html

    Per applicare a testi in italiano le stopword bisogna scaricare Snowball, giusto?

    #5729
    Francesco Cabiddu
    Francesco Cabiddu
    Amministratore del forum

    Ciao Anna,
    questo testo potrebbe fare al caso tuo.
    Dando un’occhiata veloce in rete, il pacchetto “tm” dovrebbe contenere le stopwords italiane, che provengono da Snowball.

    
    install.packages("tm")
    library(tm)
    
    tm::stopwords("italian")
    

    Avendo queste stopwords, poi puoi seguire il testo che ti ho linkato per iniziare col text mining (NOTA. probabilmente direttamente dal pacchetto tidytext è possibile scaricare le stopwords italiane ma non avendolo usato non sono sicuro)

Stai vedendo 3 articoli - dal 1 a 3 (di 3 totali)

Devi essere loggato per rispondere a questa discussione.