Home Forum Fuoritema Pareri per analizzare un dataset tramite metodi di machine learning

Questo argomento contiene 2 risposte, ha 2 partecipanti, ed è stato aggiornato da Davide Massidda Davide Massidda 1 anno, 11 mesi fa.

Stai vedendo 3 articoli - dal 1 a 3 (di 3 totali)
  • Autore
    Articoli
  • #6530

    dario_dg
    Partecipante

    Salve a tutti.. sono nuovo nel forum, spero di scrivere nel posto giusto e non infrangere qualche regola 🙂

    volevo chiedervi qualche consiglio e parere.

    Sto affrontando delle analisi per vedere quali metodo di machine learning sono più adatti per la predizione di cadute accidentali.

    Mi spiego meglio.. ho un enorme dataset pieno di valori ( sotto c’è un piccolo esempio) i quali sono stati raccolti da alcuni sensori( es: giroscopi, accelerometri, magnetometri etc..) grazie ad alcuni esperimenti e prove di laboratorio. Durante questi esperimenti sono state simulate delle azioni di vita quotidiane ( camminare, saltare, salire le scale etc..) e delle simulazioni di cadute accidentali.

    ho quindi questa variabile target (che nel Dataset è indicata con “act”, e ha valore 0 se l’azione non è una caduta, valore 1 se stiamo parlando di una caduta) e tante variabili, che si riferiscono appunto ai valori registrati dai sensori durante le suddette simulazioni

    
    subject  Gender   Age   Act  Accelerometro_Media  Acc_Dev.Stand.  Giroscopio_media ...
      101     M        22    0      9.882572             2.497603         0.022888723  ...
      102     F        22    1      9.882572             2.497603         0.022888723  ...
       .      .
       .      .
       .      .
    

    Ora devo andare ad applicare dei metodi come: SVM, K-nn, RetiNeurali o altri, per andare ad analizzare questi dati e tirare fuori qualcosa di interessante.

    Voi come procedereste? qualche consiglio?

    Spero di non essermi dilungato troppo, e che in questo forum sia possibile fare topic di questo genere, altrimenti mi scuso.

    Una buona giornata a tutti

    #6531

    dario_dg
    Partecipante

    http://archive.ics.uci.edu/ml/machine-learning-databases/00455/Information.pdf

    questo sono informazioni pure dell’argomento a cui mi riferisco.

    • Questa risposta è stata modificata 1 anno, 11 mesi fa da  dario_dg.
    • Questa risposta è stata modificata 1 anno, 11 mesi fa da  dario_dg.
    #6534
    Davide Massidda
    Davide Massidda
    Moderatore

    Avendo molti dai a disposizione e un dataset con molte osservazioni che può essere utilizzato per addestrare il modello, andrei su un metodo supervisionato.

    Essendo la variabile dipendente una dicotomica, mi concentrerei su modelli che possono gestire questo tipo di dato, che quindi si concentrano su problemi di classificazione o su stime basate su modelli logistici.

    La caratteristica di questi dati è che (almeno credo) tu hai solo in apparenza due classi. Probabilmente il caso act=1, ovvero i casi in cui avviene una caduta, avrà al suo interno una serie di osservazioni grosso modo omogenee fra loro, mentre la classe act=0 avrà al suo interno tutta una serie di dati che potrebbero essere diversissimi fra loro e che di fatto non costituiscono una classe, ma una mescolanza di tante classi.

    Il problema, quindi, non è “distinguere la classe 1 dalla classe 0”, ma “distinguere la classe 1 da qualsiasi altra cosa”. Si tratta di una differenza sottile, che potrebbe essere ininfluente, come no. Ti consiglio quindi di dare un’occhiata anche ai metodi di classificazione per singola classe.

Stai vedendo 3 articoli - dal 1 a 3 (di 3 totali)

Devi essere loggato per rispondere a questa discussione.