L'architettura di AMELIA si basa su tre principi fondamentali, che guideranno l'intera implementazione del progetto.
Innanzitutto, poniamo l'enfasi sull'analisi dei dati SAFE (Sostenibile, Accurata, Equa e Spiegabile) e sulla garanzia dell'apprendimento automatico (ML). Questo implica una gestione rigorosa dei dati, garantendo la loro sostenibilità nel lungo termine, precisione, equità e comprensibilità.
Il secondo principio riguarda i dati aperti FAIR (Findable, Accessible, Interoperable, and Reusable). In questo contesto, AMELIA si impegna a rendere i dati facilmente individuabili, accessibili, interoperabili e riutilizzabili, promuovendo la massima trasparenza e agevolando la condivisione di informazioni tra i vari componenti del progetto.
Un aspetto cruciale è la protezione dei dati ed etica, che assicura che ogni fase del processo rispetti rigorosi standard di sicurezza e integrità etica. Ciò garantisce che l'utilizzo dei dati sia etico e conforme alle normative vigenti.
Nel contesto dell'ampia esplorazione delle fonti di dati necessarie per i vari spokes del progetto, AMELIA dovrà gestire e armonizzare oltre 400 database esistenti, coprendo una vasta gamma di temi di potenziale interesse per i diversi spokes.
Questi dati, così come quelli raccolti da Grins, sono estremamente eterogenei. Variano per tipologia, includendo dati strutturati, semi-strutturati e non strutturati. Riguardano diversi processi di generazione, come dati IoT, dati ottenuti da web scraping (social network e altre fonti web), dati amministrativi, dati di indagine e dati statistici ufficiali. L'arco temporale, la frequenza e la copertura geografica sono altrettanto diversificati, spaziando dai dati georeferenziati in-situ e satellitari in tempo reale ai dati di indagine ad alta frequenza sulle famiglie, ai dati annuali sui bilanci delle imprese, ai dati statistici e amministrativi ufficiali, fino ai dati web non strutturati. La loro accessibilità varia da dati aperti e senza restrizioni a accesso limitato e dati sensibili.