MOTIVAZIONE
Nell’era digitale, in cui il numero di persone che utilizzano vari servizi e strumenti digitali è più alto che mai, abbondano le opportunità di raccogliere grandi quantità di dati a fini statistici e per identificare modelli comportamentali. Questi dati possono essere utilizzati per ulteriori analisi e decisioni da parte di stakeholder di diversi settori, tra cui la vendita al dettaglio, i trasporti, la sanità, le assicurazioni, i media e l’intrattenimento o i settori pubblici come la ricerca medica, le statistiche demografiche, ecc.
L’uso dei grandi volumi di dati degli utenti disponibili è molto limitato a causa delle preoccupazioni sulla privacy, motivo per cui i dati sono tenuti isolati in isole del sistema, non disponibili per l’uso e l’elaborazione secondaria. Inoltre, la pratica ha dimostrato che in molti scenari i dati vengono acceduti e condivisi con terzi in modo illecito e che, anche quando esiste il consenso al trattamento dei dati, i modelli di apprendimento incorporano proxy inesatte, parziali e spesso ingiuste.
Perché Arpocrate
Il progetto HARPOCRATES si concentra sulla creazione di sistemi di valutazione digitalmente ciechi che, per concezione, elimineranno le proxy come la geografia, il genere, la razza e altri fattori e avranno un impatto tangibile sulla costruzione di società più giuste, democratiche e imparziali. A tal fine, intendiamo progettare diversi schemi crittografici pratici (crittografia funzionale e crittografia ibrida omomorfa) per analizzare i dati in modo da preservare la privacy.
Oltre a elaborare i dati statistici in modo da preservare la privacy, vogliamo anche consentire un approccio più ricco, equilibrato e completo in cui l’analisi dei dati e la crittografia vadano di pari passo con un cambiamento verso una maggiore privacy.
Banche dati privatizzate
In HARPOCRATES mostreremo innanzitutto come combinare efficacemente la crittografia con i principi della privacy differenziale per proteggere e privatizzare i database.
Dati criptati
Successivamente, costruiremo modelli di apprendimento automatico che preservano la privacy e che sono in grado di classificare i dati criptati eseguendo previsioni di alta precisione direttamente sui testi cifrati in spazi di dati federati.
Condivisione dei dati
Infine, per dimostrare come queste soluzioni rispondano alle esigenze degli utenti, implementeremo due scenari reali di condivisione transfrontaliera dei dati relativi all’analisi dei dati sanitari per la medicina del sonno e alle informazioni sulle minacce per le autorità locali.
Ecosistema
Inoltre, Harpocrates costruirà un ecosistema sfruttando gli ecosistemi e le comunità esistenti, riducendo così al minimo la quantità di lavoro e di risorse necessarie per contribuire al rafforzamento delle capacità di cybersicurezza e della sovranità dell’UE nelle tecnologie digitali.
Obiettivi del progetto
La disponibilità di Big Data e i progressi dell’Intelligenza Artificiale (IA) consentono ampie capacità agli attori pubblici e privati. Tuttavia, la condivisione dei dati tra organizzazioni e a livello transfrontaliero in linea con il GDPR è sempre più difficile, in quanto la raccolta di dati personali granulari e multidimensionali incontra una maggiore capacità di collegare tra loro le serie di dati.
HARPOCRATES sfrutta nuovi schemi crittografici per far progredire le capacità del Privacy Preserving Machine Learning (PPML) e dell’Apprendimento Federato (FL), consentendo così l’addestramento, la validazione e la previsione decentralizzati su dati criptati. Questi servizi che preservano la privacy e il calcolo sicuro consentono agli utenti di beneficiare dell’intelligenza artificiale basata sul cloud e di mantenere il controllo sui dati.
HARPOCRATES consentirà sistemi di valutazione digitalmente ciechi dimostrati in scenari applicativi pratici, contribuendo a costruire società più giuste, democratiche e imparziali.
I nostri obiettivi
Progettare schemi efficienti di crittografia funzionale a scomparsa.
Combinare la crittografia funzionale e la privacy differenziale per ottenere database privati crittografati.
Progettazione di uno schema pratico di crittografia ibrida omomorfa multi-client.
Costruire un framework per l’apprendimento automatico che preservi la privacy combinando la crittografia funzionale e la crittografia ibrida omomorfa.
Schema di Apprendimento Federato Byzantine-robusto con garanzie di privacy dei dati.
Casi di studio reali e contributo alla scienza aperta e alla ricerca riproducibile.
Contribuire alla conformità GDPR scalabile e automatizzata.