Inskrypcja naskalna w Delfach. Inskrypcja naskalna w Delfach. Shutterstock
Struktura

Sieć neuronowa zaczytuje się starogreckimi inskrypcjami

Do tej pory luki w uszkodzonych starożytnych tekstach były uzupełniane przez doświadczonych epigrafików. Teraz pomoże w tym sztuczna inteligencja.

Setki tysięcy dłuższych i krótszych inskrypcji pozostawionych przez starożytne cywilizacje jest dla historyków i archeologów nieocenionym oknem, przez które wnikać mogą w życie dawnych ludzi. Wiele z tych tekstów jest jednak uszkodzonych. Gdy brakuje kilku liter, uzupełnienie ubytków nie stanowi większego problemu. Znacznie gorzej jest jednak, gdy nie zachowały się całe słowa lub większe fragmenty tekstu.

Do tej pory uzupełnienie braków (fachowo nazywanych lacunae, od łacińskiego lacuna – luka) opierało się jedynie na wiedzy doświadczonych epigrafików, którzy z pamięci i swoich notatek przywoływali odpowiednie analogie. Wiadomo jednak, że nawet ludzie o świetnej pamięci i długoletnim doświadczeniu nie są w stanie ogarnąć całego ogromu materiału epigraficznego. A gdzie ludzki mózg nie może, tam sztuczną inteligencję pośle. Współpraca epigrafików i informatyków zaowocowała powstaniem głębokiej sieci neuronowej przeznaczonej specjalnie do uzupełniania brakujących fragmentów tekstów starogreckich.

Fachu Ithaca – bo tak ją nazwano – uczyła się analizując niemal 200 tys. inskrypcji greckich znajdujących się w ogólnodostępnej bazie danych Packard Humanities Institute. Aby sprawdzić, jak dobrze radzi sobie z nieznanymi sobie tekstami, autorzy artykułu, który ukazał się w ostatnim numerze „Nature”, przeprowadzili eksperyment. Z kompletnych inskrypcji usunięto fragmenty, a następie porównano, jak z uzupełnieniami radzili sobie doświadczeni epigraficy, a jak sieć neuronowa. Ludzcy eksperci osiągnęli trafność sięgającą średnio ledwie 25 proc. Ithaca zaś precyzyjnie uzupełniła aż 62 proc. luk. Epigraficy mogą jednak spać spokojnie. Sztuczna inteligencja nie prędko ich zastąpi, gdyż jeszcze lepsze rezultaty osiągnięto, gdy człowiek współpracował z maszyną. W takim przypadku trafność uzupełnień sięgnęła bowiem 72 proc.

Ithaca rzeczywiście ma szansę zrewolucjonizować studia nad inskrypcjami, w pierwszej kolejności greckimi, a w przyszłości zapewne również nad tekstami z innych regionów świata antycznego – komentuje opisywane badania dr Dominika Grzesik z Uniwersytetu Wrocławskiego, specjalistka w zakresie inskrypcji greckich. – Narzędzia takie jak Ithaca są wspaniałą pomocą i rozwinięciem klasycznych metod badań nad inskrypcjami, które dobrze sprawdzały się przez dziesięciolecia.

Fragment jednego z dekretów ateńskich.Wikipedia/NatureFragment jednego z dekretów ateńskich.

Algorytmy Ithaki nie ograniczają się jednak tylko do uzupełniania luk. Do jej bazy włączono dane Leksykonu Greckich Imion (Lexicon of Greek Personal Names), który zawiera informacje dotyczące geograficznej i chronologicznej dystrybucji imion. Dzięki temu sztuczna inteligencja jest również w stanie wskazać prawdopodobne miejsce i czas wykucia inskrypcji. Przeprowadzone przez zespół Yannisa Assaela testy wskazują, że Ithaca z 71 proc. skutecznością wskazuje, gdzie inskrypcja powstała, i zawęża ramy czasowe do 30 lat. W praktyce siłę nowego narzędzia pokazano natomiast włączając się w debatę na temat datowania kontrowersyjnych dekretów ateńskich. Jeszcze niedawno sądzono, że powstały one przed 446/445 r. p.n.e. Nowsze sugestie historyków wskazywały jednak na lata 20. V w. p.n.e. Analiza dokonana przez Ithakę wsparła nowsze datowanie sugerując, że powstały one około 421 r. p.n.e. Różnica 20-30 lat może nie wydawać się zbyt duża, ale dla historyków często ma kluczowe znaczenie dla zrozumienia wydarzeń.

Naukowcy nie spoczywają na laurach i pracują nad dostosowaniem algorytmów do pracy z materiałem epigraficznym w innych językach. Zapewniają przy tym, że już dziś Ithaca –prócz greckich – może analizować teksty zapisane w innych językach i systemach, nawet tak odległych od siebie jak akadyjskie pismo klinowe i majańskie logogramy.

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną