Come l’intelligenza artificiale ha permesso di recuperare il contenuto di 1800 rotoli di papiro carbonizzati, rinvenuti a Ercolano. E ciò che potrebbe fare domani per lo studio e la tutela dei beni culturali. Verso le digital humanities 3.0?
Leggere l’invisibile
No, non si tratta del titolo di un romanzo di fantasia. È la migliore espressione che identifica uno degli obiettivi principali degli esperti del campo delle digital humanities già dal secolo scorso, ma che solo oggi vede finalmente una possibile realizzazione. Stiamo parlando del progetto di ricerca legato ai papiri ercolanesi. Un corpus di più di 1800 rotoli rinvenuti nel ‘700 nella cosiddetta Villa dei Papiri di Ercolano. Questi reperti sono andati parzialmente persi nel corso degli anni, proprio in seguito ad alcuni tentativi di apertura e lettura. Chiusi nelle teche della Biblioteca Nazionale di Napoli, sono rimasti in attesa di una tecnologia adatta alla loro diagnosi. Fino ad oggi.
Tecnologia e cultura umanistica: un rapporto in evoluzione
La vicenda dei papiri ercolanesi ci porta ad alcune riflessioni in merito al rapporto tra tecnologie digitali e la ricerca umanistica, due elementi che mai come in tempi recenti risultano essere estremamente uniti. Nei primi anni duemila era ancora particolarmente acceso il dibattito sul ruolo della tecnologia nelle humanities. Due erano le correnti principali: il digitale come strumento e il digitale come modello di conoscenza. Nel primo caso la tecnologia è vista come semplice mezzo di approfondimento e di specializzazione dell’attività di ricerca, a supporto dell’esperto umanista. Nel secondo caso il digitale diventa una vera e propria risorsa tramite cui sviluppare nuove competenze, dare nuova vita e nuove forme di rappresentazione ai documenti e agli oggetti culturali, aprendo anche le porte a scenari di studio non considerati precedentemente. Ancora oggi nessuna delle due prospettive sembra prevalere sull’altra. Piuttosto, possiamo osservare come, nel corso del tempo, queste due correnti si siano rese complementari, arrivando a poter definire il ruolo della tecnologia in base alle esigenze di ricerca. Quel che è certo è il grande sviluppo del digitale a cui gli studi umanistici hanno deciso di non sottrarsi.
Uno dei primi tentativi di digitalizzare dei prodotti culturali in formato testuale risale agli anni ’70, quando un giovane studente dell’Università dell’Illinois, Michael Stern Hart, diede vita al Progetto Gutenberg. Protagonista era la tecnologia OCR (Optical Character Recignition), che all’epoca era ancora agli albori ma che oggi ha raggiunto una notevole specializzazione. Questa tecnologia fa uso di uno scanner in grado di riconoscere le linee e le curve degli elementi testuali che vengono riprodotti in formato digitale. Un grande inizio per rendere accessibile la tradizione culturale scritta.
Risale sempre agli anni ’70 l’introduzione di una nuova tecnologia: la tomografia computerizzata, meglio nota come TAC o TC. La TAC si fa spazio nel settore medico-scientifico come uno strumento di grandissimo ausilio all’attività diagnostica, consentendo di fare la scansione di diverse parti del corpo umano tramite vari fasci di raggi X e riprodurle in formato tridimensionale. Queste proprietà sono risultate subito sfruttabili anche nel campo delle humanities e uno dei primi settori di ricerca ad adottare la diagnostica avanzata è stata l’egittologia.
L’arrivo dell’IA: un nuovo assistente nella ricerca
A questo punto è lecita la domanda degli esperti umanisti sul dove possa davvero portare la tecnologia e quali siano i nuovi scenari di ricerca esplorabili. La risposta è contenuta nell’avvento dell’IA. Siamo nel 2015 quando Brent Seales, professore e ricercatore presso l’Università del Kentucky, insieme al suo gruppo, riesce a progettare un modello di visione artificiale in grado di decifrare un papiro ebraico rimasto ignoto per anni. Attraverso la combinazione del machine learning e della TAC è stato possibile individuare l’inchiostro presente sulla superficie del noto papiro, rilevandone il testo che è stato poi decifrato dai papirologi. Il processo di ricerca ha previsto una prima scansione del rotolo tramite raggi X. In seguito, un modello ad hoc di visione artificiale è stato addestrato a riconoscere quali dei segni e delle tracce presenti sul papiro fossero effettivamente del testo scritto, velocizzando la diagnosi.
I papiri erconalesi non sono più un segreto: la Vesuvius Challenge
Il progetto di Brent Seales è stato il penultimo gradino della risalita del campo delle humanities verso il vertice degli attuali obiettivi di ricerca: la diagnostica e la decifrazione dei testi antichi senza rischio di deturpazione dell’oggetto. O meglio, senza nemmeno toccare il manufatto.
I papiri ercolanesi non sono più sembrati inarrivabili alla luce di queste nuove scoperte, ma ancora restavano alcuni punti aperti nella loro analisi. Si tratta di un corpus di papiri carbonizzati, il cui materiale contiene del carbonio. Il punto è che lo stesso inchiostro usato probabilmente era costituito da una buona componente di questo elemento. E il carbonio risulta impenetrabile dai normali raggi X della TAC, proibendo l’applicazione della visione artificiale.
La soluzione: la cosiddetta Vesuvius Challenge. Nel 2023 Brent Seales, in collaborazione con alcuni esponenti papirologi statunitensi e italiani (tra cui uno dei punti di riferimento è rappresentato da Federica Nicolardi), ha avviato una competizione internazionale con in palio un monte premi degno di nota. L’obiettivo era chiamare a raccolta tutti i principali esponenti del mondo dell’informatica e dell’ingegneria, la cui esperienza sarebbe stata coniugata con quella degli esperti papirologi. Il risultato di questa preziosa unione di competenze è stato maggiore delle aspettative. Ma veniamo ai passaggi che hanno portato in particolare un gruppo di giovani ricercatori a svelare parole rimaste sconosciute per secoli.
Il punto di partenza è stata proprio l’attività di ricerca di Seales, che ha fornito anche il corpus ebraico su cui lui stesso ha lavorato. È stata quindi applicata inizialmente la TAC sui rotoli carbonizzati. A questa è stato aggiunto il sincrotrone, un acceleratore di particelle che ha messo in evidenza le tracce di inchiostro presenti sulla superficie. Dalla scansione a raggi X sono stati estratti anche tutti i metadati relativi alle caratteristiche di composizione di ogni porzione dei papiri: la presenza o meno di polvere, lo spessore, la densità del materiale. Questi dati torneranno utili più avanti nel processo.
Il risultato della TAC è stato poi sottoposto a segmentazione, passaggio che prevede l’estrazione dal totale della forma 3D scannerizzata delle parti singole da studiare in maniera individuale. Ciascuna di queste è stata poi appiattita (flattered nel linguaggio tecnico), trasformando la porzione in 3D nel suo formato 2D, su cui sarebbe stato possibile lavorare proprio come se si trattasse di un papiro aperto. Su ognuno di questi segmenti vengono poi applicati i corrispondenti metadati prelevati dalla scansione, e la carta d’identità della porzione è completa. Manca solo il testo, ed è il momento di far intervenire l’intelligenza artificiale.
L’algoritmo di visione artificiale progettato dalla squadra di Brent Seales è stato ulteriormente allenato sul corpus di papiri ebraici e non solo. I ricercatori della Vesuvius Challenge si sono impegnati nell’etichettatura di alcuni dei segmenti ricavati dal rotolo, cercando di identificare, laddove possibile, la presenza o meno di inchiostro. A questo punto il modello è pronto per essere coinvolto nell’analisi delle restanti porzioni, rispondendo alla semplice domanda: “C’è o non c’è inchiostro in questo punto?”. Si tratta di un’opportunità di velocizzare e precisare ulteriormente l’identificazione del testo scritto.
Ultimo intervento, non per importanza, è quello delle humanities. Sono gli esperti papirologi ad aver tradotto e interpretato i testi scritti in greco rinvenuti dalle porzioni di papiro. Una scelta di grande valore. Non è infatti l’intelligenza artificiale la responsabile della lettura dei rotoli e ciò consente, innanzitutto, di evitare conflitti e dubbi nel mondo della ricerca sulla possibile presenza di allucinazioni da parte del modello. Un altro aspetto importante è che è ancora difficile, ad oggi, avere un corpus sufficientemente completo per l’addestramento dell’IA su questi testi del tutto inediti anche agli esperti. Per questa ragione, il ruolo della cultura umanistica emerge ancora come distintivo e cruciale nella riuscita di simili progetti di ricerca.
Non più solo Ercolano: il futuro della cultura e della ricerca umanistica
Come identifichiamo quindi il peso della tecnologia su questa grande scoperta? Gli sviluppi tecnologici sono stati sicuramente fondamentali in quanto strumenti di supporto alla ricerca. Allo stesso tempo, possiamo però parlare anche di veri nuovi modelli di conoscenza, avendo consentito agli esperti di vedere aperte le porte di nuove opportunità di analisi fino ad ora impensabili e permettendo di vedere anche laddove l’occhio umano non arriva.
Forse a questo punto vi starete chiedendo che cosa contengano questi tanto acclamati papiri. Dalle prime traduzioni, i rotoli risultano essere un’opera inedita del filosofo Epicuro. Il tema principale finora osservato è una riflessione sul piacere e sulla percezione di questo nella vita quotidiana dell’uomo. In più, pare che vi siano alcuni dettagli importanti sulla vita di Platone e la località della sua sepoltura.
Avremo quindi molto di cui parlare nei prossimi anni nelle scuole, ei centri culturali e non solo, perché laVesuvius Challenge proseguirà anche nel 2024 con l’obiettivo di continuare le interpretazioni e velocizzare il processo di srotolamento del corpus. Ci aspetta un futuro di grandi svolte nel campo delle digital humanities, una disciplina ora completa e consapevole delle sue potenzialità.