Risposte al Forum Create

Stai vedendo 7 articoli - dal 1 a 7 (di 7 totali)
  • Autore
    Articoli
  • in risposta a: funzione per sottoinsiemi casuali #6933

    ilaria_ballesio
    Partecipante

    Ahhh..ecco, io non inizializzavo nessun dataframe vuoto! Così funziona alla grande…Grazie mille!

    in risposta a: funzione per sottoinsiemi casuali #6910

    ilaria_ballesio
    Partecipante

    sì, il tuo ragionamento è corretto. in effetti manca il nome della colonna relativa al nome del testo. Nel frattempo, ho ripulito il dataset, perciò la dimensione ora è 2129×384 (383 termini + 1 Level).

    Rileggendo i messaggi precedenti forse mi sono spiegata male…ci sono 5 livelli e bisogna creare combinazioni rispetto a k gruppi. k perciò sta ad indicare quanto segue:

    k=1
    – sottoinsieme di 100 testi per il livello 1;
    – sottoinsieme di 100 testi per il livello 2;
    – ….

    k=2
    -sottoinsieme di 200 testi. 100 per il livello 1 e 100 per il livello 2;
    -sottoinsieme di 200 testi. 100 per il livello 1 e 100 per il livello 3;
    -sottoinsieme di 200 testi. 100 per il livello 1 e 100 per il livello 4;
    -sottoinsieme di 200 testi. 100 per il livello 1 e 100 per il livello 5;
    -sottoinsieme di 200 testi. 100 per il livello 2 e 100 per il livello 3;
    -sottoinsieme di 200 testi. 100 per il livello 2 e 100 per il livello 4;
    – …

    k=3
    – sottoinsieme di 300 testi. 100 per il livello 1, 100 per il livello 2, 100 per il livello 3;
    – …

    k=4
    – sottoinsieme di 400 testi. 100 per il livello 1, 100 per il livello 2, 100 per il livello 3 e 100 per il livello 4;

    k=5
    – sottoinsieme di 500 testi. 100 per il livello 1, 100 per il livello 2, 100 per il livello 3, 100 per il livello 4 e 100 per il livello 5;

    questo procedimento per tutte le combinazioni possibili, facilmente calcolabili facendo correre questo ciclo

    k<-c(1,2,3,4,5)
    for (i in 1:5) {comb<-combn(c(k),i)
    print(comb)} 

    Anche io, a questo punto, stavo pensando di estrarre 100 testi da ciascun livello e poi aggregarli (fatto in malo modo nel codice da te riportato).
    Tu come consiglieresti di procedere? Adesso stavo anche guardando se è possibile creare una funzione che al suo interno riporti la procedura (per ora ci sono riuscita solo per k=1), ma è più difficile di quel che immaginavo!

    in risposta a: funzione per sottoinsiemi casuali #6900

    ilaria_ballesio
    Partecipante

    AGGIORNAMENTO.

    Si crea un sottoinsieme (E) della matrice (y1), nel quale ci siano solo le righe con Levels=5. successivamente si selezionano 100 righe del sottoinsieme.

    E<-subset(y1,y1[,384]=='5')
    E1<-E[sample(nrow(E),100),]

    Nel caso di k=1 si può anche procedere senza utilizzare cicli for, ma la cosa diventa già più complicata nel caso si ponga k=2. In questo caso, il sottoinsieme dei livello 1 e 2 viene correttamente creato, ma la funzione per estrarre 100 osservazioni con Levels=1 e 100 con Levels=2, da problemi

    k12<-subset(y1,y1[,384]=='1'|y1[,384]=='2')
    K12<-k12[sample(nrow(k12[,384]=='2'),100),]&k12[[sample(nrow(k12[,384]=='2'),100),]]

    Mi sapreste dire come sistemare il comando?

    Si riuscirebbe a creare un ciclo for per rendere il tutto automatico?

    in risposta a: funzione per sottoinsiemi casuali #6896

    ilaria_ballesio
    Partecipante

    Anche io all’inizio ho utilizzato questa funzione. Il problema è che questa funzione seleziona solo size celle, non size righe. Quindi al posto di trovarmi con size=100 righe intere (per un totale di 100×490 elementi), mi ritrovo con 100 elementi.

    in risposta a: funzione per sottoinsiemi casuali #6895

    ilaria_ballesio
    Partecipante

    Giusto, hai ragione. ti invio una versione molto ridotta del dataset, per capire la sua composizione. Ad ogni riga corrisponde un testo (tot 2129) e ogni colonna ad una parola (489 termini +Levels).

    wind wuakitv young zte Levels
    text1 0 0 0 0 5
    text4 0 0 0 0 1
    text5 0 0 0 0 1
    text6 0 1 0 0 3
    text7 0 0 0 0 4

    Ovviamente è una matrice ricca di 0. Si legge nel seguente modo, ad esempio: nel text 6, la parola wuakitv appare 1 volta e così via…

    in risposta a: raggruppare i dati in classi #4961

    ilaria_ballesio
    Partecipante

    Fatto! grazie mille! ti posso ancora disturbare? Scusa se continuo a farti domande banali, me ne rendo conto, ma è la prima volta che uso R e non ho tempo di leggere i manuali perchè tra poco devo consegnare il lavoro.

    io ho questi vettori

    freq<-c(52.4,56.4,55.8,55.5,54.4,63.4,57.6)
    freq1<-c(47.6,43.6,44.2,44.5,45.6,36.6,42.4)

    Freq rappresenta la frequenza relativa delle ragazze mentre freq1 dei ragazzi.
    Dovrei creare un istogramma in cui mettere, per ciascuna colonna, sotto la frequenza dei maschi e sopra ad essa quella delle femmine, in modo tale da avere delle colonne di altezza 1 (=100%) (ovvero creare 7 colonne di questo genere:
    1°–> contiene 47.6 e 52.4
    2°–> 43.6 e 56.4
    3°–> etc…)

    che comando devo utilizzare?

    grazie ancora e scusa per il disturbo. Prometto che in futuro studierò bene come utilizzare R 🙂

    in risposta a: perdita informazioni in R #4910

    ilaria_ballesio
    Partecipante

    pazzesco ahahaha grazie mille! devo rifare da capo l’analisi perchè me ne sono accorta solo ora di sto problema, ma almeno l’ho risolto!

    grazie mille!

Stai vedendo 7 articoli - dal 1 a 7 (di 7 totali)