Normalizzazione dei dati: nuovi modelli basati su intelligenza artificiale e machine learning
Siamo da sempre attenti alle innovazioni, non solo in ambito energetico, ma anche tecnico e metodologico. Per questo ospitiamo spesso studenti universitari volenterosi di conoscere il nostro mondo e ricchi di conoscenze fresche che possono portare nuovi spunti al nostro lavoro.
Nel 2020 abbiamo collaborato in stage con Enrico Figoni, laureando di Data Science presso l’Università di Padova, abbracciando il mondo dell’intelligenza artificiale e dei sofisticati algoritmi di machine learning. Lo stage si è concluso con la Laurea di Enrico, ma la nostra collaborazione non si è fermata.
Abbiamo chiesto proprio ad Enrico di raccontare la sua esperienza in Energia&Progetti e di presentare il lavoro svolto per la sua tesi insieme al nostro team di Energy Management.
Come mai hai scelto questo argomento per la tua tesi?
Ho sempre avuto interesse per tutto l’ambito green e credo che l’efficienza energetica sia uno dei principali spunti per aiutare l’ambiente. Quando ho visto che in Energia&Progetti cercavano uno stagista ho pensato che potesse essere un’ottima opportunità per me, visto che è un settore in pieno sviluppo, dove è possibile applicare le conoscenze legate ai miei studi e allo stesso tempo può offrirmi una visione ravvicinata del mondo dell’efficienza energetica. Per quanto riguarda il progetto seguito nella tesi, il tema è stato definito partendo da una specifica necessità espressa del team degli Energy Manager di CO2save da applicare ad un caso concreto di un loro cliente.
Qual era l’assunto di partenza e quali aspetti hai voluto far emergere nel tuo lavoro?
L’assunto di partenza era la necessità di costruire un algoritmo per valutare il comportamento di un cliente rispetto all’anno precedente, pulendo i dati da tutti quei fattori esterni (come gli orari di apertura e la temperatura) che ne condizionano l’interpretabilità e potendo offrire un resoconto più completo sul loro attuale livello di efficienza energetica. Questa esigenza si è manifestata in modo ancora più evidente in questo 2020: col suo susseguirsi di chiusure improvvise ha messo ancor più in evidenza quanto sia utile saper normalizzare i dati a nostra disposizione, riuscendo a pulirli da tutte quelle variazioni che sporcano i nostri dati impedendo di svolgere correttamente un confronto.
Che contributo ha dato Energia&Progetti per lo sviluppo della tesi?
Innanzitutto mi hanno fornito i dati. Può sembrare poco, ma in realtà è moltissimo: senza i dati su cui lavorare è impossibile costruire alcunché e più dati si hanno a disposizione più si è in grado di trarne informazioni. Mi sono stati forniti dati a cadenza oraria per diversi anni su diversi punti vendita del cliente, sia per i consumi energetici che per altre variabili. Per molti punti vendita avevamo più di 35000 osservazioni! Oltre a questo, gli Energy Manager mi hanno messo in luce aspetti che io probabilmente avrei sottovalutato, ma che loro, dopo anni di esperienza nel settore, sanno cogliere al meglio e che mi hanno così guidato nella costruzione di un algoritmo migliore.
Come hai applicato la teoria alla pratica sui dati dei clienti di Energia&Progetti?
Non è stato facile, lo ammetto. Il dataset con cui ho lavorato era enorme e i dati del mondo reale non sono “belli” come quelli che si usano nei lavori all’università. Ma proprio per questo è stata una bella sfida, che mi ha spinto a provare molti metodi diversi ad applicare tutte le mie conoscenze di statistica e di machine learning per ottenere il risultato. Per fare un esempio, Pyhton ha molte librerie contenenti dei comandi già scritti per facilitare alcuni passaggi di questi lavori, ma in alcuni casi siamo dovuti andare oltre, scrivendo i metodi da zero: questo mi ha aiutato a prendere ancora più confidenza con il linguaggio e a cogliere tutte le sfaccettature del metodo in esame, sviluppandolo su misura per il nostro progetto.
A che risultati sei arrivato e come proseguirà il lavoro?
I risultati sono incoraggianti, tanto che abbiamo deciso di continuare questa collaborazione anche ora che lo stage è finito ed io mi sono laureato. Il prossimo passo è ampliare il bacino d’utenza, passando da un solo cliente a molti clienti, appartenenti anche a settori molto diversi tra loro. Ci aspettiamo che l’algoritmo funzioni bene già con piccoli accorgimenti, per come è costruito, ma attendiamo i risultati dei test per confermare le nostre intuizioni.
Cosa vedi per il tuo futuro?
In questo periodo di pandemia è difficile vedere molto avanti nel futuro e la figura del Data Scientist non è ancora stata completamente compresa dal mondo del lavoro. Intanto per i prossimi mesi mi vedo a completare questo progetto: qui in Energia&Progetti mi trovo benissimo ed ormai mi sono affezionato tanto a questo algoritmo che sento il bisogno di portarlo a compimento. Il tema dell’efficienza energetica mi è sempre stato a cuore e ora lo è anche di più: sono convinto che guiderà anche le mie scelte per il futuro.
Ancora congratulazioni Enrico, felici ed orgogliosi del percorso fatto e che faremo insieme!