separateurCreated with Sketch.

Riscoprire i tesori dell’Archivio Segreto Vaticano grazie all’intelligenza artificiale

VATICAN SECRET ARCHIVES
whatsappfacebooktwitter-xemailnative
Lucandrea Massaro - pubblicato il 15/05/18
whatsappfacebooktwitter-xemailnative

Intervista al professor Paolo Merialdo, coordinatore del team che ha sviluppato il software capace di interpretare i complessi “font” medievaliNel cuore del Vaticano si trova l’Archivio Segreto, un luogo che custodisce la storia della Chiesa ma che, nonostante quello che Dan Brown o i cospirazionisti sostengono, non ha nulla di oscuro. Segreto viene infatti dal latino secretum, cioè privato. In questo Archivio privato dei papi, finisce la storia di ogni pontificato, di ogni atto di governo, della sua corrispondenza privata con governanti e vescovi in giro per il mondo, i suoi diari. La prassi vuole che ogni pontefice renda pubblico in blocco un pontificato intero, con delle eccezioni. Come dice il sito stesso dell’Archivio (a riprova che di “segreto” nel senso moderno del termine c’è davvero poco):

Secondo una prassi invalsa a partire dal 1924, il papa concede il libero accesso ai documenti «per pontificati»: attualmente il limite cronologico di consultabilità è posto alla fine del pontificato di Pio XI (febbraio 1939). Nondimeno, in deroga a questa consuetudine, Paolo VI, fin dalla chiusura dei lavori conciliari nel 1965, rese accessibile agli studiosi l’Archivio del Concilio Vaticano II (1962-1965); Giovanni Paolo II ha aperto alla consultazione il fondo Ufficio Informazioni Vaticano, Prigionieri di Guerra (1939-1947), e, da ultimo sono stati messi a disposizione dei ricercatori il fondo Commissione Centrale per l’Arte Sacra in Italia (1924-1989) e il fondo Censimento degli Archivi Ecclesiastici d’Italia (1942).

Mille anni di documenti e 85 chilometri di scaffali pieni di carte e documenti, alcuni resi illeggibili dal tempo, altri dal fatto che quei caratteri e quel modo di scrivere non sono i nostri e quindi, il lettore moderno, ha difficoltà a decifrare sigle, caratteri, abbreviazioni. L’Archivio ovviamente attrae studiosi da tutto il mondo ma non è possibile accogliere e accontentare tutti primo per motivi di spazio, secondo per il rischio di rovinare i preziosi documenti. Come quindi rendere fruibile questo patrimonio a tutti e insieme conservarlo? Da tempo la Santa Sede ha avviato procedure di copia digitale di molti documenti, ma anche questo non è sufficiente:

Del contenuto di questi 85 chilometri, solo una piccola parte è stata scansionata e trasformata in formato digitale. Ancora meno pagine sono state trascritte in testo informatico e rese disponibili per la ricerca. Per poter consultare il resto occorre accedere all’Archivio segreto vaticano, sobbarcarsi il viaggio fino a Roma e sfogliare ogni singola pagina a mano.

Un nuovo progetto di ricerca, In Codice Ratio, potrebbe risolvere alcuni di questi problemi. In Codice Ratio adotta tecniche di analisi delle immagini digitali e d’intelligenza artificiale e software di riconoscimento ottico dei caratteri (ocr) per analizzare questi testi complessi e spesso di difficile lettura e rendere disponibile per la prima volta la loro trascrizione. Se dovesse funzionare, la tecnologia potrebbe aprire la strada alla trascrizione di molti altri documenti presenti negli archivi storici di tutto il mondo (Internazionale).

Un progetto tutto italiano che ha il cuore nel Dipartimento di Ingegneria dell’Università degli Studi di Roma Tre e che viene coordinato dal professor Paolo Merialdo a cui Aleteia ha rivolto qualche domanda a nome suo e del team di ricercatori con cui collabora per una sfida che è innanzi tutto tecnologica

Professor Merialdo, come è nata questa collaborazione tra l’Archivio e voi? Chi è venuto a cercare chi?

La mia ricerca scientifica si concentra sullo studio di tecniche per l’estrazione di informazioni (fatti e conoscenza) da documenti su Web. Avrei voluto applicare i risultati delle mie ricerche in un contesto diverso, per estrazione di conoscenza da fonti storiche. Sapendo che molte fonti (le piu’ interessanti dal mio punto di vista) erano su manoscritti non trascritti ho ideato una soluzione che prevedeva il coinvolgimento di studenti del liceo per la creazione di dati di training. Ne ho parlato con una amica, la professoressa Marica Ascione, del Liceo Scientifico Keplero di Roma. Oltre ad apprezzare l’idea, la prof. Ascione mi ha presentato Marco Maiorino, professore di Diplomatica Pontificia presso l’ASV, al quale ho illustrato l’idea del progetto. Inizialmente, come tutti i paleografi che ho incontrato, Marco era scettico sulla possibilità che una macchina potesse imparare a leggere testi antichi; ma piano piano si è appassionato all’idea. Uno degli aspetti che gli è piaciuto molto era la possibilità di coinvolgere studenti del liceo: ha visto nel progetto una opportunità di veicolare cultura. Con la prof. Ascione abbiamo definito un programma di Alternanza Scuola Lavoro per finalizzare la partecipazione dei ragazzi del Keplero. La professoressa si e’ fatta carico di convincere la scuola e coinvolgere i ragazzi. Successivamente grazie al suo lavoro, hanno aderito altre 24 scuole, per un totale di più di 600 ragazzi! In sostanza la collaborazione e’ nata grazie a relazioni informali e di amicizia che hanno legato i vari attori delle origini del progetto.

7d19d1191

Questo è un buon esempio di informatica umanistica? L’ausilio della vostra disciplina è diventata centrale anche in campi del sapere come l’analisi testuale, la filologia, la letteratura comparativa: che tipo di sinergie si possono immaginare e con quali altre discipline?

E’ un buon esempio di progetto di ricerca interdisciplinare. Per noi è fondamentale la collaborazione con gli umanisti. Prima ancora di contattare l’ASV ho incontrato i miei colleghi del Dipartimento di Studi Umanistici, sia per validare l’idea, sia per cercare un paleografo da coinvolgere nel team. La professoressa Serena Ammirati ha immediatamente colto le pontenzialità di quello che avremmo voluto realizzare ed è subito entrata a far parte del team. Parlando con lei e con Marco Maiorino abbiamo approfondito anche possibili scenari applicativi che vanno oltre la trascrizione. Successivamente abbiamo attivato collaborazioni con altri ricercatori umanisti. Ad esempio, con il prof. Emanuele Conte, docente di diritto medioevale, abbiamo iniziato a ragionare sulla possibilità di applicare le nostre tecniche per ricostruire codici normativi; con il prof. Alberto D’Anna stiamo valutando la possibilità di applicare le nostre soluzioni per lo studio dei manoscritti che riportano la storia di Pietro.
Sorprendentemente (?) abbiamo avviato anche progetti di trasferimento tecnologico: alcune aziende si sono rivolte a noi per risolvere problemi di trascrizione di testi da documenti fiscali e legali.

VATICAN SECRET ARCHIVES

TIZIANA FABI / VATICAN SECRET ARCHIVES / AFP

 

Avete, per addestrare i programmi che avete implementato, chiesto l’ausilio degli studenti dei licei e delle superiori. Invece da parte dei vostri colleghi di Lettere e Filosofia? Ci sono paleografi nella vostra équipe?

Come riportato sopra, la professoressa Serena Ammirati, paleografa, fa parte del team. Lei stessa ha coinvolto suoi collaboratori per aiutarci sia nella scelta dei campioni da mostrare agli studenti come esempi dei vari simboli da riconoscere, sia per produrre le trascrizioni di riferimento attraverso le quali valutiamo le prestazioni del nostro sistema. La collaborazione con la professoressa Ammirati ha avviato anche altre collaborazioni interdisciplinari: abbiamo appena presentato una proposta di progetto al MIUR con un team che comprende fisici, ingegneri, umanisti; il tema e’ lo sviluppo di tecnologie per il recupero del patrimonio storico culturale.

Quali sono i principali problemi che avete dovuto risolvere? Cosa avete imparato da questa esperienza?

La segmentazione delle parole in caratteri è il problema principale che abbiamo affrontato. E’ difficile riuscire ad individuare i confini di un carattere senza riconoscerlo, così come è difficile riconoscere una carattere senza averne individuato i confini. E’ stato molto bello coinvolgere gli studenti delle superiori. Non è stato semplice spiegare a tutti la portata del loro contributo: semplice ma fondamentale.
Questa esperienza ci ha arricchiti molto dal punto di vista culturale, ma anche personale. I rapporti tra tutti i membri del team sono ottimi. Stiamo imparando anche a interagire con la stampa: dopo l’articolo di The Atlantic ci hanno contattato decine di giornalisti.

Materialmente avete dovuto lavorare nell’Archivio? Molti di quei codici sono antichissimi e delicatissimi. Come vi siete regolati?

Non c’è stato bisogno di accedere all’ASV. Nell’ambito di un accordo di collaborazione con l’Università di Roma Tre-Facoltà di Ingegneria, l’Archivio Segreto Vaticano ci ha fornito le immagini digitali dei Registri Vaticani di Onorio III: in questo modo nessun originale è stato impegnato in alcuna fase del processo di creazione del sistema. In ogni caso, l’Archivio ci ha concesso diverse visite, sia per permetterci di capire l’entità del patrimonio dell’Archivio, sia per incontri finalizzati alla definizione dell’accordo che per incontri informativi di aggiornamento sull’andamento del progetto. Abbiamo anche visto gli originali dei manoscritti su cui stiamo lavorando: e’ stato emozionante!

VATICAN SECRET ARCHIVES

GIOVANNI CIARLO / VATICAN SECRET ARCHIVES / AFP

Ingegneria informatica rappresenta nell’immaginario collettivo una delle branche più futuristiche del sapere, siete il “domani”, l’Archivio invece rappresenta in sé forse una delle idee più vivide di “antico”. Che sensazioni avete vissuto?

L’Archivio Segreto Vaticano, negli ultimi anni, ha mostrato di sapersi avvalere delle moderne tecnologie: ad esempio per la conservazione dei propri documenti possiede uno storage di 60 Tera Byte contenente 6 milioni di immagini digitali di documenti e per la gestione delle esigenze dei ricercatori per mezzo di un sistema di richiesta informatizzata delle richieste. Non è stato difficile instaurare un dialogo fra questi due mondi dunque. ​

Quanto tempo impiegherete per completare la procedura sugli 85 km di documenti dell’Archivio?

Gli accordi con l’ASV non prevedono la progressiva applicazione della procedura di trascrizione automatica​ ​all’intero patrimonio archivistico. L’ASV ha fornito un campione rilevante, costituito dai Registri Vaticani di Onorio III, attualmente non ancora pubblicati in edizione critica completa e redatti in minuscola cancelleresca, una scrittura abbastanza chiara e omogenea, derivata dalla più antica scrittura carolina.