Big Data e Machine Learning in finanza ed economia: le nuove metodologie di previsione e di analisi

da | Apr 5, 2022

Perché le crisi economiche non vengono mai preannunciate dagli esperti di economia e finanza? Solo in un secondo momento, quando ormai gli effetti della crisi si sono fatti sentire, sono in molti a fornire spiegazioni e dire “si poteva prevedere ed evitare”.

Trattandosi di un argomento che interessa praticamente tutti (se non altro per salvaguardare i nostri risparmi, piccoli o grandi che siano), vediamo fino a che punto i Big Data e il Machine Learning possano realmente fornire un supporto ai decisori in campo economico nelle attività di previsione e analisi finanziaria.

PREVISIONI E DATASET INFORMATIVO

Per valutare lo stato dell’economia gli analisti economici, gli operatori finanziari e le banche centrali non hanno a disposizione dati magici e inaccessibili alle persone “normali”: si affidano in larga misura alle statistiche ufficiali oppure, in alternativa, a dati “soft” o a specifiche indagini di mercato.

Sebbene sia disponibile un’ampia gamma di dati convenzionali e ufficiali di elevata qualità, i dataset sono spesso pubblicati con ritardi che vanno da pochi giorni o settimane fino anche a diversi mesi dopo il periodo di riferimento.

E molto spesso, per questo motivo, le previsioni si rivelano inesatte alla prova dei fatti.

Le previsioni economiche che vengono fatte e le relative risposte in termini di investimenti o aiuti all’economia sono assunte sulla base di informazioni ormai non più corrispondenti alla situazione economica corrente. Spesso, il ritardo rende tali informazioni addirittura fuorvianti.

FONTI DI DATI E METODI STATISTICI INNOVATIVI PER LA FINANZA

Per fortuna, l’innovazione arriva anche nel mondo della finanza, un settore molto spesso visto come distante dalla vita “reale” delle persone.

Le problematiche sopra viste infatti stanno spingendo sempre di più gli operatori finanziari a cercare modalità alternative e più sofisticate per il reperimento dei dati, in modo da renderli più tempestivi e accurati. Solo con queste caratteristiche è possibile migliorare l’accuratezza nella previsione delle variabili rilevanti per la conduzione delle politiche economiche.

Negli ultimi anni l’interesse si è spostato in particolare su fonti innovative di dati e metodi statistici alternativi per la valutazione in tempo reale dell’attività economica.

RETI NEURALI E ALBERI DI REGRESSIONE

Dopo la crisi finanziaria si è intensificato l’impegno a utilizzare sistematicamente i dati micro e quelli ricavati dalle indagini ai fini di una stima più accurata delle variazioni dei consumi aggregati, degli investimenti e del mercato del lavoro.

Parallelamente, i progressi tecnologici hanno consentito di sperimentare fonti di dati non convenzionali, quali testi e immagini di articoli di stampa, post sui social media e informazioni numeriche provenienti dai dati sui pagamenti (in particolare quelli online).

Tali fonti di dati possono essere oggi sfruttate appieno grazie a metodi statistici avanzati, come ad esempio gli alberi di regressione, le reti neurali e le macchine a vettori di supporto.

BIG DATA E MACHINE LEARNING IN FINANZA

La pandemia di coronavirus (COVID 19) ha accelerato la tendenza sopra descritta.

La crisi collegata al virus ha mostrato come i big data, in aggiunta ai dati più tradizionali, possano fornire segnali tempestivi sullo stato dell’economia e contribuire a tenere traccia dell’andamento dell’attività economica.

Ai big data si fa solitamente riferimento con la formula delle “tre V”, poiché sono dati considerati caratterizzati da elevati livelli di volume, velocità e varietà.

Il volume elevato è dovuto alle massicce quantità di dati generati a seguito del proliferare di dispositivi, servizi e interazione umana.

L’alta velocità si riferisce alla rapidità con cui i dati vengono creati ed elaborati.

La grande varietà è connessa all’ampia gamma e complessità delle fonti e della tipologia dei dati.

“Perché le crisi economiche non vengono mai preannunciate dagli esperti di economia e finanza? Solo in un secondo momento, quando ormai gli effetti della crisi si sono fatti sentire, sono in molti a fornire spiegazioni e dire “si poteva prevedere ed evitare”

VANTAGGI E PROBLEMI DEI BIG DATA

I big data hanno il vantaggio di essere disponibili ad alta frequenza; tuttavia, spesso sono relativamente destrutturati e, per definizione, sono di grandi dimensioni. Ciò pone diversi problemi ai modelli econometrici tradizionali.

Alcuni di questi possono essere risolti grazie all’applicazione di algoritmi di apprendimento automatico (machine learning, ML), che hanno anche il beneficio di cogliere, potenzialmente, relazioni non lineari complesse.

MACHINE LEARNING PER LA FINANZA

Sebbene non vi sia un’unica definizione di apprendimento automatico, il concetto di fondo è che i computer sono in grado di imparare dai dati precedenti, individuare andamenti generali e fare previsioni utilizzando algoritmi che colgono tali tendenze. L’apprendimento automatico è pertanto un sottoinsieme dell’intelligenza artificiale.

In particolare, tali nuove fonti di dati, come i metodi legati ai big data e all’apprendimento automatico, possono integrare l’analisi standard del ciclo economico.

UN ESEMPIO DI SCHOCK ECONOMICO

La pandemia di coronavirus, improvvisa e del tutto inaspettata, rappresenta un esempio perfetto di shock economico-finanziario straordinario.

Questa crisi ha favorito la diffusione e l’affinamento delle tecniche di apprendimento automatico e dei Big Data a un ritmo senza precedenti. In particolare, ha dimostrato che fonti alternative di dati possono fornire segnali più tempestivi sullo stato dell’economia e contribuire a monitorare l’attività economica.

Ha inoltre rappresentato un’importante dimostrazione di non linearità nell’economia, che ha richiesto l’adeguamento dei modelli esistenti o lo sviluppo di nuovi approcci. A tale riguardo, i metodi di apprendimento automatico possono gestire le non linearità più facilmente dei metodi tradizionali.

LIMITI DEI NUOVI METODI

Nonostante le buone notizie, non è tutto rose e fiori. Oltre a offrire nuove opportunità, tali nuove fonti di dati e metodi alternativi pongono anche delle difficoltà.

I big data consentono di utilizzare una gamma più ampia di indicatori tempestivi per le previsioni (ad esempio indicatori basati su testi o basati su internet) anche se, in alcuni casi, ciò può comportare problemi di replicabilità e responsabilità.

Gli indicatori sul clima di fiducia basati sui testi sono particolarmente utili, ad esempio, poiché possono essere prodotti automaticamente con maggiore frequenza e a costi inferiori rispetto agli indicatori basati sulle indagini.

Mentre la costruzione dei dati economici convenzionali, come la produzione industriale, segue procedure armonizzate per assicurare l’elevata qualità, la continuità e la comparabilità nel tempo e fra i paesi, i dati alternativi non sono raccolti principalmente a fini di analisi economica, né provengono e sono convalidati da istituti di statistica indipendenti.

Pertanto, la loro applicazione nei processi decisionali espone le banche centrali a diversi rischi, dal momento che la replicabilità dei risultati e la responsabilità per il proprio operato potrebbero essere compromesse.

Poiché i dati alternativi sono raccolti per altri fini (ad esempio le transazioni con carta di credito) o derivano da un altro genere di servizi (ad esempi articoli di stampa provenienti dalla digitalizzazione dei giornali), essi spesso richiedono un attento trattamento.

Inoltre, l’esistenza di significativi problemi di accessibilità dei dati e di limitazioni alla loro condivisione potrebbe, in alcuni casi, pregiudicare la replicabilità dei risultati.

CONCLUSIONI

In conclusione, possiamo dire che tali strumenti innovativi, sebbene siano molto utili come integrazioni, al momento non possano essere considerati sostitutivi dei dati e dei metodi standard a causa dei problemi legati all’ interpretabilità e all’inferenza statistica.

In prospettiva tuttavia i Big Data, insieme ai metodi di apprendimento automatico (che possono aiutare a superare le carenze dei Big Data stessi e a sfruttare appieno il loro potenziale), sono in grado di conseguire risultati migliori dei metodi statistici tradizionali, soprattutto nel fornire un quadro accurato e tempestivo degli andamenti economici.

Sandro Pinna
Sandro Pinna
Dopo la laurea in Governo d’Impresa mi sono dedicato a molte attività, tutte di diversa tipologia, ma alla fine mi sono dedicato a quello che più mi appassionava: il digital marketing.

Potrebbe piacerti anche