Big Data & Machine Learning Models

Con la rivoluzione dei Big Data, al fine di gestire la mole di dati di cui disponiamo, sia in termini di magnitudine che di tecnologie con i quali vengono raccolti, Il Machine learning si propone di trattare questa tipologia di dati a scopi predittivi attraverso metodi e tecniche.




I metodi "Supervised" e "Unsupervised"

Al primo metodo ‘’Supervised’’ compete la calibrazione dei parametri, ai secondi appartengono metodi quali clusterizzazione o PCA in cui sulla base di una serie di features (regressori) vengono creati dei gruppi omogenei ed eterogenei all'interno di ulteriori gruppi. Come nuovo metodo in via di sviluppo rientrano le reti neurali, che, nel tentativo di replicare il meccanismo di trasmissione delle info e degli input all'interno del cervello umano, cercano di trovare pattern nei dati che gli si presentano. Le applicazioni sono molteplici: dalla finanza alla diagnostica per immagini, passando per i modelli di marketing.

 




 

I modelli di Machine Learning

1) Per prevedere la direzione del prezzo di uno stock o per identificare una mail come spam: SVM (Support Vector Machine, Regressione Logistica o Regressione Lasso, Naive Bayes Classifier).
2) Per la probabilità di un evento: Regressione Logistica, Decision Trees, Random Forest.
3) Per i fattori che indicano uno stress sui mercati: Cluster analysis, PCA
4) Per Image (face) Recognition, conteggio oggetti in un'immagine, ma anche time series forecasting: Neural Networks in tutte le declinazioni; ANN; LSTM (Long Short Term Memory) , Convolutional NN, Restricted Boltzmann Machine. (Si affiancano ai modelli di serie storiche standard che personalmente ritengo più affidabili)
5) Hidden Markov Model, Soft-max Classification
6) Per analisi di regressione con dataset molto grandi e variabili altamente correlate, si possono utilizzare tutti i metodi di regressione e quelli con penalizzazione: Lasso, Ridge, Elastic net







Machine Learning con Python

Tutti questi modelli si possono implementare in Python che dispone di librerie quali Tensor Flow Scikit learn e Keras. Tutte le analisi partono dal data preprocessing su training set all'implementazione dell'algoritmo e al tuning eventuale dello stesso su validation set, fino a previsione con output tabellari e grafici su test set.

 






Sei interessato a questo servizio o vorresti maggiori informazioni?       Contattaci      Contattaci su Whastapp