Come preparare i dati nel Machine Learning
Introduzione Come preparare i dati nel Machine Learning, in questo articolo analizzeremo tecniche e metodi per convertire i dati grezzi in una forma adatta alla modellizzazione. In linea di principio…
Introduzione Come preparare i dati nel Machine Learning, in questo articolo analizzeremo tecniche e metodi per convertire i dati grezzi in una forma adatta alla modellizzazione. In linea di principio…
I sistemi di raccomandazione sono un importante classe di algoritmi machine learning che offrono “rilevanti” suggerimenti per gli utenti. Si distinguono in COLLABORATIVE FILTERING o CONTENT-BASED SYSTEM. Come fa YouTube…
Un grafico a punti, o grafico a dispersione, è un tipo di rappresentazione grafica dei dati che mostra la relazione tra due variabili numeriche. In un grafico a punti, ogni…
Spesso in R, analizzando grandi dataset potremmo trovare diversi valori mancanti (missing values). L’ analisi dei valori mancanti fa parte del prepocessing dei dati. I dati mancanti possono essere causati…
CRISP-DM è l’acronimo di Cross-Industry Standard Process for Data Mining, un metodo di comprovata efficacia per l’esecuzione di operazioni di data mining.Il modello CRISP-DM è un prodotto neutrale definito da…
Prima di spiegare come effettuare un clustering in R, diamo una definizione. Il clustering (o analisi dei gruppi) è un metodo di data analisi unsupervised usato in diversi campi (pattern…
E’ possibile leggere file JSON in R utilizzando il package rjson. Installiamo il package di R per leggere il Json come list install.packages("rjson") Supponiamo di avere un semplice Json index.json…
Il grafico a torta non sono consigliati nella documentazione di R e le loro funzionalità sono piuttosto limitate. Gli autori raccomandano grafici a barre o grafici a punti perché è…
Creare un grafico a barre in R con la funzione barplot (h), dove h è un vettore o una matrice. Se h è un vettore i valori determinano l’altezza delle…
# elenca gli oggetti nell'ambiente di lavoro ls() # elenca le variabili in mydata names(mydata) # fornisce la struttura di mydata str(mydata) # dimensione di un oggetto of an object…