I big data: opportunità e sfide
Opportunità…
La disponibilità di grandi quantità di dati, così come le possibilità di integrazione di informazioni provenienti da fonti multiple, è in rapida crescita in ciascuna delle aree di ricerca di L’EMbeDS. Ad esempio:
Utilizziamo ampi database relativi a brevetti e pubblicazioni scientifiche, che integriamo con microdati a livello di impresa in analisi empiriche volte a caratterizzare paradigmi e traiettorie tecnologiche.
Integriamo diverse fonti di microdati (incluso il web scraping) per costruire grandi dataset sui comportamenti delle imprese, combinandoli con dati provenienti da fonti tradizionali e statistiche ufficiali. Utilizziamo inoltre dati sulle interazioni tra diversi agenti economici all’interno di reti (alleanze tra imprese, commercio internazionale, ecc.) e grandi basi di dati sulle transazioni finanziarie (prezzi e quantità), sia relative a titoli sia a materie prime.
Impieghiamo dati empirici e dati generati da simulazioni su larga scala per validare e calibrare, a livello micro e macroeconomico, modelli ad agenti (Agent-Based Models, ABM) in grado di riprodurre l’evoluzione dei sistemi economici. Gli ABM richiedono capacità computazionali specialistiche, nonché approcci statistici avanzati per la progettazione di esperimenti di simulazione e l’analisi delle proprietà strutturali ed emergenti.
Analizziamo l’impatto dei cambiamenti climatici, della disponibilità delle risorse naturali e della qualità degli ecosistemi integrando fonti multiple di dati ad alta frequenza temporale e ad elevata risoluzione spaziale relativi a parametri ambientali, impatti ambientali delle materie prime e dei processi produttivi, nonché conseguenze economiche di eventi meteorologici estremi.
Raccogliamo e analizziamo grandi quantità di dati relativi ai sistemi sanitari regionali e nazionale italiani, arricchendoli attraverso nuove tecnologie di rilevazione volte a misurare l’esperienza e gli esiti per pazienti e utenti.
Collaboriamo con diversi tribunali italiani, sviluppando pipeline per la pseudonimizzazione dei testi, l’annotazione e l’interrogazione dei materiali giuridici, nonché strumenti per facilitare l’accesso agli archivi giudiziari, automatizzare la ricerca giurisprudenziale e supportare i processi decisionali.
… e sfide
La valorizzazione di tali opportunità richiede approcci di modellizzazione sofisticati e strumenti statistici e computazionali all’avanguardia. Lavoriamo su numerosi metodi e tecniche, tra cui sistemi dinamici non lineari, modelli stocastici, statistica non parametrica e semiparametrica, modelli e metodi statistici per l’analisi delle reti, tecniche di machine learning per l’emulazione e la validazione degli ABM, metodologie per la valutazione computazionale dell’inferenza statistica e della stabilità dei risultati (ad esempio tecniche di resampling, augmentation e perturbazione), metodi per l’analisi di dati ad alta dimensionalità e strutturati (quali riduzione della dimensionalità, selezione e screening delle variabili, analisi di dati funzionali), nonché metodi per l’inferenza causale.
La valorizzazione di tali opportunità richiede inoltre approcci rigorosi agli aspetti giuridici ed etici connessi alla privacy dei dati, alla protezione e alla sicurezza delle informazioni, nonché innovazione normativa e nuovi modelli di governance per i dati e le tecnologie data-driven. Le nostre attività di ricerca riguardano, tra l’altro, gli spazi europei dei dati, i processi decisionali e giudiziari, l’intelligenza artificiale human-centered e i diritti fondamentali, i mercati e le piattaforme digitali, la scienza aperta e la cultura aperta, la cybersecurity e la digitalizzazione della pubblica amministrazione e della società.