Gervigreind les handrit og skjöl

þriðjudagur, 19. september 2023 - 11:30
  • Lestur Transkribus á dóma- og þingbók Snæfellssýslu frá árinu 1809.
    Lestur Transkribus á dóma- og þingbók Snæfellssýslu frá árinu 1809.

Á síðustu árum hafa orðið stórstígar framfarir á sviði gervigreindar. Ein birtingarmynd þessarar þróunar er stafrænn lestur handrita og skjala. Þar má nefna austurríska forritið Transkribus sem rekja má til Evrópuverkefnanna TranScriptorium frá árunum 2013-2015 og READ  frá 2016-2019. Forritið getur lesið handskrifaðan texta og skilað af sér uppskrift hans á stafrænu formi. Það styðst við líkön sem hafa verið þjálfuð í að lesa ólíkar skriftartegundir frá ólíkum tímum og mismunandi landsvæðum.  

Árið 2022 fékk Miðstöð stafrænna hugvísinda og lista (MSHL) styrk frá Innviðasjóði RANNÍS til að búa til líkön fyrir íslenska skrift og var Emil Gunnlaugsson sagnfræðingur ráðinn til að sinna því verkefni í samstarfi við Þjóðskjalasafn Íslands og Landsbókasafn Íslands - Háskólabókasafn. Afraksturinn var tvö líkön: eitt sem nota má til að lesa íslenska handskrift frá seinni hluta átjándu aldar og það síðara fyrir íslenska handskrift frá miðbiki þeirrar nítjándu. Hlaðið var upp töluverðu magni mynda af íslenskum skjölum og handritum úr Þjóðskjalasafni Íslands og handritasafni Landsbókasafns Íslands – Háskólabókasafni, forritið látið lesa textann og að því búnu leiðréttar villur. Forritið getur nú lesið og skrifað upp texta frá þessu tímabili með nokkuð góðum árangri, eða í það minnsta auðveldað lesendum lesturinn.  

Forritið er aðgengilegt á www.transkribus.eu þar sem notendur geta skráð sig og fengið 500 síðna ókeypis inneign, hlaðið upp myndum af handritum og skjölum (t.d. af handrit.is, skjalasafn.is eða notað eigin myndir) og látið forritið lesa fyrir sig illæsilegan texta. Þessi nýja tækni er í þróun en enginn vafi er á að hún mun gjörbreyta aðgengi að íslenskum menningararfi og nú þegar hafa þau íslensku líkön sem hafa verið búin til sannað gildi sitt. 

Á Þjóðskjalasafni Íslands er unnið markvisst að þróun þessara líkana með það fyrir augum að auðvelda aðgengi almennings að handskrifuðum handritum og skjölum. Á myndinni má sjá upphaf færslu úr dóma- og þingbók Snæfellssýslu frá árinu 1809 [Sýslumaðurinn í Snæfells- og Hnappadalssýslu GA/4-1. ]  og lestur Transkribus á textanum.