Open in new tab

Vatikanen löser språket med AI

NÄSTAN 10 MIL. Det sägs att det finns runt 8,5 kilometer med böcker, manuskript, brev, skriptrullar, med mera, i Vatikanens hemliga arkiv, där den äldsta texten kommer från 700-talet.

Här finns brev från europeiska kungar och drottningar, och politiska och religiösa redogörelser i drivor – och det är i detta material forskalaget som leds av Donatella Firmani vill testa sin maskininlärningsalgoritm. Till att börja med ska man sätta tänderna i det som kallas Vatikanregisterna. Det omfattar av över 18 000 sidor med korrespondens mellan katolska kyrkan och kungar, drottningar, politiker och andra religiösa institutioner från 1400-talets Europa. – Dessa texter har aldrig tidigare transkriberats, och är i ljuset av det av enastående historisk relevans, säger forskarna.

GYMNASIEELEVER TILL RÄDDNING. Det är förstås ingen lätt uppgift att söka låta en maskin transkribera och tolka ord och meningar vi människor får anstränga oss med, och där det dessutom inte finns någon tidigare data för algoritmen att träna på. Man har också valt att låta sitt system undersöka bitar med penndrag för att sedan klistra ihop dem till en helhet där den får betydelse.

Ett 'm' kan i skrift exempelvis vara likt 'iii', men det förra är rätt i ljuset av bokstäverna och orden runt omkring. För att få ordning av pusslet av pennstreck som algoritmen urskilt tog man hjälp av 120 gymnasieelever som fick sätta ihop det till ord.


Läs hela artikeln →
www.voister.se