La revolució digital dels manuscrits jueus medievals

  • Un projecte internacional impulsa la transcripció automàtica de centenars de milers de manuscrits jueus medievals, amb la Genizá del Caire com a eix central.
  • La Biblioteca Nacional d'Israel i la plataforma Ktiv lideren la digitalització i la publicació oberta dels textos, recolzats per finançament del Consell Europeu de Recerca.
  • La iniciativa MiDRASH combina intel·ligència artificial i humanitats per reconstruir la cultura literària jueva medieval i facilitar nous estudis acadèmics.
  • Jornades col·laboratives de transcripció i revisió permeten millorar els models d'IA i obrir l'arxiu a investigadors i al públic de tot el món.

manuscrits jueus medievals

La immensa col·lecció de manuscrits jueus medievals coneguda com la Genizà del Caire viu un moment decisiu gràcies a la intel·ligència artificial. Després de dècades en què només una part mínima del material podia consultar-se amb comoditat, la combinació de digitalització massiva i sistemes de reconeixement de text comença a obrir, de debò, aquest arxiu únic a investigadors i públic general.

El que fins fa poc semblava un somni per a filòlegs i historiadors —poder cercar, llegir i comparar centenars de milers de fragments hebreus medievals des de qualsevol ordinador— ha esdevingut un projecte concret. A través de la plataforma Ktiv de la Biblioteca Nacional d'Israel i del programa MiDRASH, s'han generat transcripcions preliminars de pràcticament tots els fragments de la Genizà, i se'n prepara ara la revisió, la millora i la publicació oberta.

Un arxiu medieval gegantí, per fi llegible

col·lecció manuscrits jueus medievals

l'anomenada Genizà del Caire es considera la col·lecció més àmplia i variada de documents jueus medievals conservada al món. Durant prop de mil anys, la comunitat jueva de la capital egípcia hi va anar dipositant textos religiosos, legals, comercials o literaris que, per la tradició de no destruir escrits amb el nom de Déu, no podien llençar-se sense més ni més. El resultat va ser un fons que avui ronda els 400.000 fragments, conservats en gran part gràcies al clima sec d'Egipte.

Tot i la seva importància, el conjunt ha estat aprofitat només de manera parcial: fins fa poc, menys d'un terç del material estava catalogat ia penes un 10-15% comptava amb transcripció llegible. La resta, encara que digitalitzat i accessible en forma d'imatge, seguia sent difícil de treballar de manera sistemàtica, ja que llegir manuscrits hebreus cursius o semicursius de l'edat mitjana exigeix ​​molta experiència i temps.

La nova fase del projecte canvia aquest panorama. Basant-se en la infraestructura de Ktiv -la base de dades digital de tots els manuscrits hebreus coneguts que gestiona la Biblioteca Nacional d'Israel-, un equip internacional ha desenvolupat sistemes de transcripció automàtica capaços de convertir aquests fragments en text digital cercable, almenys en una primera versió que després s'anirà afinant.

Segons dades difoses per la institució, ja s'han generat transcripcions preliminars per a pràcticament tots els elements de la Genizà del Caire, a més de milers de manuscrits hebreus addicionals procedents d'altres col·leccions medievals. Per a un camp que feia més d'un segle que treballava peça a peça, el salt d'escala és difícil d'exagerar.

MiDRASH: IA i humanitats al servei dels manuscrits hebreus

Al centre d'aquesta transformació se situa MiDRASH (Migracions de Textual i Scribal Traditions via Large-Scale Computational Analysis of Medieval Manuscripts in Hebrew Script), un projecte interdisciplinar que reuneix especialistes d'Israel i Europa. La iniciativa va arrencar el 2023 gràcies a una beca ERC Synergy de 10 milions d'euros concedida pel Consell Europeu de Recerca per a un període de sis anys, la primera d'aquest tipus dedicada específicament a estudis jueus.

L'objectiu de MiDRASH no es limita a passar a net textos vells. Com explica un dels seus responsables, el professor Daniel Stökl Ben Ezra, l'ambició és reconstruir la cultura literària jueva medieval del llibre, rastrejant quins autors citen altres, com circulen els comentaris rabínics (midrashim) entre comunitats musulmanes i cristianes o de quina manera es transformen les tradicions escrites al llarg dels segles.

Per fer-ho possible, l'equip ha optat per treballar dins de la plataforma de codi obert eScriptorium, dissenyada per a la transcripció automàtica de manuscrits i inscripcions. Sobre aquesta base desenvolupen models específics per a l'escriptura hebrea medieval, entrenats amb milers de transcripcions elaborades manualment per especialistes durant anys. El resultat és un sistema que pot segmentar línies i paraules en imatges antigues i convertir-les en text editable.

Els responsables subratllen que, encara que les transcripcions inicials contenen errors —cosa inevitable amb cal·ligrafies irregulars, fragments trencats o tintes esvaïdes—, la seva utilitat pràctica és enorme: permeten localitzar ràpidament passatges bíblics, seccions del Talmud, cartes, contractes o textos litúrgics, cosa que abans requeria una lectura pacient pàgina a pàgina.

Dels microfilms a les plataformes obertes: un llarg camí

digitalització manuscrits jueus medievals

L'actual revolució digital dels manuscrits jueus medievals no sorgeix del no-res. La mateixa Biblioteca Nacional d'Israel recorda que el 1950, sota l'impuls del primer ministre David Ben-Gurión, es va crear l'Institut de Manuscrits Hebreus Microfilmats. Atès que no era realista traslladar físicament tots els fons a Jerusalem, la solució va ser fotografiar en microfilm totes les col·leccions que fos possible, assentant les bases d'un gran arxiu visual.

Amb el pas de les dècades es van incorporar unes 1.500 col·leccions de diverses procedències, ia partir del 2006 el material de la Genizà del Caire es va integrar a l'anomenat Projecte Friedberg Geniza, que va accelerar la digitalització sistemàtica. El 2014, la Biblioteca Nacional va iniciar la conversió del seu arxiu fotogràfic en una col·lecció digital accessible a la web, cosa que va permetre per primera vegada que qualsevol usuari busqués i veiés en línia milers de manuscrits hebreus.

MiDRASH es recolza directament en aquest treball previ. Sobre la infraestructura de Ktiv -que ja concentrava en una sola base de dades la major part dels manuscrits hebreus coneguts-, l'equip utilitza algorismes de aprenentatge automàtic per identificar lletres, paraules i estructures textuals. Aquesta combinació de fitxer centralitzat i eines computacionals avançades evita un dels grans problemes que hi ha en altres camps, com l'estudi de manuscrits àrabs, on el material es troba molt més dispers.

La doctora Tsafra Siew, responsable de projectes de recerca a la Biblioteca Nacional, defineix MiDRASH com un autèntic punt d'inflexió per a qualsevol que treballi amb manuscrits hebreus medievals. A parer seu, el salt no consisteix només a fer més còmode l'accés, sinó a permetre tipus d'anàlisis que, per pura escala, eren impossibles quan cada document s'havia de llegir a mà i gairebé en solitari.

Col·laboració internacional i jornades de transcripció

El projecte MiDRASH funciona com un consorci internacional que combina sabers tècnics i humanístics. Entre els investigadors principals figuren el professor Nachum Dershowitz (Universitat de Tel Aviv), el doctor Avi Shmidman (Universitat Bar-Ilan) i la professora Judith Olszowy-Schlanger (Universitat d'Oxford), a més dels equips de la Universitat de Haifa, la pròpia Biblioteca Nacional d'Israel i el Princeton Geniza Project, dirigit per la professora Marina Rustow.

Lluny de limitar-se a una feina de laboratori, la iniciativa està obrint també vies de participació pública. Del 24 al 27 de novembre s'ha organitzat a Jerusalem, amb retransmissió en línia, un gran “Transcribe-a-thon” centrat en manuscrits hebreus medievals i moderns en escriptura cursiva i semicursiva. Durant aquestes jornades, els voluntaris capacitats es dediquen a revisar i corregir les transcripcions generades per la IA.

Aquest enfocament col·laboratiu persegueix un doble objectiu. D'una banda, millorar la qualitat i precisió dels textos; de l'altra, utilitzar les correccions humanes per continuar entrenant els models de reconeixement, de manera que en el futur es redueixi el nombre de fallades i es reconeguin millor fins i tot les mans més problemàtiques. La idea és que el sistema aprengui, de mica en mica, de l'experiència acumulada de filòlegs, paleògrafs i especialistes en hebreu.

La Biblioteca Nacional d'Israel ha assenyalat que les transcripcions definitives de la Genizà del Caire s'incorporaran a Ktiv i es posaran a disposició del públic juntament amb les imatges originals de cada manuscrit. D'aquesta manera, qualsevol investigador podrà acarar el que veu la màquina i allò que s'aprecia al facsímil, mantenint la transparència i permetent noves lectures o correccions futures.

Noves preguntes per a una vella història

Un cop superada la fase de transcripció massiva, els responsables del projecte aspiren a anar molt més enllà del simple accés. El pla és poder realitzar anàlisis lingüístiques i textuals a gran escala: detectar cadenes de cites, identificar paràfrasis, reconstruir itineraris didees o seguir levolució de determinats motius teològics i legals a través dels segles.

A la pràctica, això significa que els manuscrits jueus medievals deixen de ser només peces aïllades en prestatgeries o arxius digitals i passen a funcionar com una xarxa interconnectada de textos. La IA ajuda a localitzar patrons, semblances i recurrències que es perdrien en una lectura purament individual, mentre que els especialistes aporten el context històric i filològic per interpretar allò que aquestes connexions signifiquen.

Alguns dels interessos concrets de l'equip passen per seguir la trajectòria dels midrashim, els relats i els comentaris rabínics que circulaven entre comunitats jueves en territoris musulmans i cristians. Poder mapejar com varien les versions d'un mateix text segons la regió o l'època obre la porta a entendre millor els contactes culturals, els conflictes interns i les reinterpretacions doctrinals que es van donar a l'Edat Mitjana.

Els investigadors insisteixen que la transcripció automàtica, fins i tot amb les seves imperfeccions, és només el començament. Sobre aquesta capa bàsica es podran realitzar estudis comparatius de vocabulari, sintaxi o estils d'escriptura, però també anàlisis socials i econòmiques a partir de cartes, contractes comercials o documents legals que, fins ara, gairebé no s'havien explorat de manera sistemàtica.

Impacte global i oportunitats per a Europa

Tot i que el projecte neix i es coordina des d'Israel, els seus efectes arriben de ple a la comunitat acadèmica europea. La beca ERC Synergy que finança MiDRASH s'emmarca en la política de la Unió Europea de donar suport a infraestructures digitals per a les humanitats, i diversos dels investigadors principals treballen a universitats de França, Regne Unit i altres països.

Per a especialistes europeus en història de la Mediterrània, del judaisme medieval o de l'islam clàssic, tenir una base de dades tan àmplia i consultable suposa un canvi notable. Fins ara, reconstruir la vida de les comunitats jueves que vivien en territoris musulmans —on va arribar a residir-hi 90% de la població jueva medieval— exigia desplaçaments i accés restringit a fitxers. Amb l'obertura progressiva de Ktiv, bona part d'aquest material es fa accessible des de qualsevol campus o centre de recerca.

A més, la metodologia desenvolupada a MiDRASH ofereix un model que es pot estendre a altres fons documentals europeus: des de col·leccions de manuscrits llatins fins a arxius notarials o eclesiàstics. La idea de combinar digitalització, transcripció automàtica i col·laboració pública es perfila com una via replicable per preservar i estudiar altres patrimonis en risc de deteriorament.

Els responsables del projecte confien que la publicació de resultats en revistes científiques revisades per parells consolidarà aquest enfocament dins dels estàndards acadèmics. Mentrestant, el accés obert a les imatges i transcripcions promet facilitar feines conjuntes entre universitats d'Israel, Europa i Amèrica, generant xarxes de recerca més àmplies al voltant dels manuscrits jueus medievals.

L'avenç de la intel·ligència artificial aplicada a la Genizà del Caire ia altres manuscrits hebreus converteix un arxiu gairebé inabastable en una font viva i en expansió. El que abans exigia anys de lectura minuciosa ara es pot rastrejar en segons, sense que això resti pes al treball expert, sinó més aviat al contrari: allibera temps per plantejar preguntes més complexes i per interpretar en profunditat un patrimoni que, de mica en mica, deixa de ser un tresor ocult per convertir-se en un recurs compartit a escala mundial.

manuscrits-0
Article relacionat:
Noves troballes i tecnologies a l'estudi de manuscrits històrics