Sztuczna inteligencja rekonstruuje przeszłość i sugeruje scenariusze przyszłości
Z początku badacze nie wierzyli, że korzystanie z komputerów coś zmieni w naszej wiedzy o dawnych wiekach. I rzeczywiście – dopóki moc obliczeniowa była mała, maszyny nie odgrywały większej roli. Jednak cyfrowa rewolucja sprawiła, że humaniści po programy komputerowe zaczęli sięgać coraz śmielej. – Mamy do czynienia z wielkim skokiem – tłumaczy dr Sebastian Szymański, filozof i kierownik Centrum Badania Ryzyka Systemowego (CBRS) na Uniwersytecie Warszawskim, w którym modeluje się m.in. przeszłość. – Zaczęło się od prostych programów analizujących za nas duże ilości danych, a teraz systemy są tak zaawansowane, że same tworzą algorytmy, które pomagają znaleźć odpowiedź na stawiane przez nas pytania badawcze.
Kliny w rękach sztucznej inteligencji
Sztuczna inteligencja pomaga m.in. w tłumaczeniu starożytnych tekstów. Na przykład zapisanych pismem klinowym. Glinianych tabliczek z sumeryjskimi, akadyjskimi, elamickimi, hetyckimi czy staroperskimi inskrypcjami zachowało się setki tysięcy. W dodatku wiele z nich jest we fragmentach rozproszonych po muzeach. Badanie przez ekspertów, których na świecie jest garstka, trwałoby latami.
Gdy 50 lat temu zaczynano wykorzystywać komputery, problemem był stopień złożoności znaków klinowych czy trójwymiarowy kształt tabliczek, na których są odciśnięte. Dziś algorytm DeepScribe, „nakarmiony” 6 tys. tekstów z Persepolis Fortification Archive i ponad 100 tys. kombinacji znaków, radzi sobie z klinami nie gorzej niż człowiek.
W lipcu tygodnik „New Scientist” podsumował wyniki wykorzystania AI (sztucznej inteligencji) w tej dziedzinie. Użycie komputerów, których dokładność tłumaczeniowa sięga czasami aż 95 proc., umożliwiło odnalezienie brakujących fragmentów eposu o Gilgameszu i innych arcydzieł literatury „klinowej”, a także odkrycie nowych gatunków literackich – hymnu do miasta czy żartobliwych czytanek dla dzieci. To nie wszystko. Analiza tysięcy dokumentów administracyjno-handlowych pozwoliła na uzyskanie informacji o konkretnych osobach zajmujących się produkcją i handlem.
Nowa technologia sprawdza się też przy innych pismach starożytnych. Sieć neutronowa PYTHIA, opracowana przez Google DeepMind, uzupełnia braki w inskrypcjach starogreckich. A convolutional neural networks (CNN) tłumaczy chińskie starożytne znaki na skorupach żółwi i kościach.
Sztuczna inteligencja zajmuje się również analizą grafologiczną pism. Badacze izraelscy zapytali maszynę, ile osób 2,6 tys. lat temu napisało 18 paleohebrajskich inskrypcji znalezionych w twierdzy Tel Arad koło Jerozolimy. I choć algorytm uważał, że było ich 6, a grafolożka, że 12, to ogólny wniosek był ich zdaniem taki sam: w Królestwie Judy umiejętność czytania i pisania musiała być bardziej powszechna niż dotąd zakładano. Choć można oczywiście założyć, że mieszkańcy twierdzy nie są grupą reprezentatywną – mogli po prostu być wykształceni.
W marcu w „Nature” ukazał się artykuł zespołu kierowanego przez Theę Sommerschield z Ca’Foscari University of Venice i Harvard University. Dotyczy on zastosowania do badania tekstów starogreckich sieci neuronowej wykorzystującej atrybucje geograficzne i chronologiczne, czyli wytyczne, które pozwalają komputerowi wskazywać miejsce powstania i datowanie analizowanego tekstu. Program nazwany ITHAKA nauczył się 60 tys. greckich tekstów powstałych między VII w. p.n.e. a V w. n.e. – i potrafi uzupełniać luki w uszkodzonych inskrypcjach z dokładnością aż 62 proc. Umie także przypisywać je do miejsca ich powstania z dokładnością 71 proc. i datować z dokładnością ok. 30 lat.
Program testowano na ateńskich dekretach politycznych, o których sądzono, że powstały w 446/445 r. p.n.e., ale ITHAKA zasugerował, że są 25 lat młodsze. – Niedługo każdy zeskanowany starożytny tekst będzie można wrzucić do translatora AI i uzyskać przekład z uzupełnionymi lukami – przekonuje archeolożka cyfrowa z Wydziału Archeologii UW Julia Chyla. – Nawet jeśli wynik nie będzie doskonały, to fakt, że naukowcy nie będą już sami musieli tłumaczyć tysięcy standardowych tekstów i system za nich wyszuka cymelia oraz uzupełni luki w tekstach, pozwoli im zająć się analizą i wnioskami.
Ceramika w sieci neuronów
Nie tylko teksty są dla archeologów źródłem danych nie do ogarnięcia. Innym przykładem jest ceramika, która pokruszona na miliony fragmentów zalega w ziemi oraz w magazynach muzealnych. I choć jest kopalnią informacji o kulturach, technikach, życiu codziennym, kontaktach czy gospodarce w przeszłości, jest materiałem masowym, którego opracowanie jest niesłychanie żmudne i pracochłonne.
Gabriele Gattiglia i Francesca Anichini, ceramolodzy z Universitŕ di Pisa, postanowili wykorzystać do analiz sieć neuronową ArchAIDE. Rozpoznaje ona fragmenty naczyń i klasyfikuje je na różne rodzaje. Na razie radzi sobie tylko z kilkoma typami ceramiki (i to głównie tej dekorowanej), ale badacze mają nadzieję, że w miarę dodawania do bazy danych kolejnych fotografii jej możliwości będą rosły.
Przedsięwzięciu kibicuje dr Izabela Romanowska z Aarhus University, specjalistka od archeologii cyfrowej i autorka podręcznika „Agent-Based Modeling for Archaeology”. – Ze średniej wielkości wykopalisk mamy między 500 a 800 tys. fragmentów ceramiki, więc wiecznie brakuje nam zapału, pieniędzy i czasu, by je analizować – mówi. – Każda metoda, która chociażby zgrubnie opracuje te masy skorup, byłaby więc wybawieniem. Wbrew pozorom robienie fotografii i ich wprowadzanie do systemu nie jest problemem – robione z dronów zdjęcia są tak doskonałe, że AI znajduje na nich ceramikę leżącą w ziemi i jest w tym lepsza niż studenci. Co nie znaczy, że należy rezygnować z badań szczegółowych, jak mikroskopowe analizy składu gliny pojedynczych skorup. Ale dzięki narzędziom cyfrowym badania jakościowe możemy porównać z ilościowymi.
Sztuczna inteligencja radzi sobie doskonale także z przeszukiwaniem różnych obiektów archeologicznych, które kryją się pod warstwą zieleni czy w wodzie. Dla komputerów to betka, bo struktury zbudowane przez człowieka są zawsze dość regularne i schematyczne – stąd odkrycia systemu piramid i kanałów Majów dwa lata temu czy sieci osiedli w Puszczy Amazońskiej w tym roku.
Niedługo my też będziemy mieli nowe dane, bo Piotr Wroniecki z Uniwersytetu Warszawskiego „nakarmił” zdjęciami satelitarnymi z całej Polski sztuczną sieć neuronową, która weźmie pod uwagę wyróżniki roślinne (tam gdzie są podziemne obiekty archeologiczne, zieleń wygląda inaczej) i wskaże nieznane obiekty.
SI zaczyna badaczy zarzucać informacjami o tysiącach nowych stanowisk. Ale nawet jeśli się myli, łatwo to zweryfikować w terenie. I to również nieinwazyjnie, np. za pomocą metod geofizycznych. – Archeologia cyfrowa ma tę przewagę nad klasyczną, że nie niszczy stanowiska podczas wykopalisk, co uniemożliwia ich późniejszą weryfikację – mówi Chyla i dodaje, że analizy danych cyfrowych można powtarzać na okrągło i na różne sposoby.
Ogień w oku algorytmu
W czerwcu br. w PNAS ukazał się artykuł przedstawiający wyniki badań dotyczących opanowania przez naszych przodków ognia. Od lat naukowcy szacują, że umiejętność mamy od ponad miliona lat, ale twardych dowodów nie ma. Dlatego badacze z Izraela – głównie z Weizmann Institute of Science – postanowili zbadać na artefaktach znalezionych w kamieniołomie Ewron ślady w strukturze kości i kamieni.
Algorytm przeanalizował obiekty oświetlone ultrafioletem i stwierdził, że najstarsze z nich zostały poddane działaniu ognia ok. 1 mln lat temu. Oczywiście badanie to miało charakter lokalny i teraz trzeba przeprowadzić podobne eksperymenty w innych miejscach, z których pochodzą najstarsze narzędzia i kości. Ale pokazało, że komputery radzą sobie całkiem nieźle w sytuacjach, gdy dowodów materialnych nie ma zbyt wiele. Do tego badacze przeszłości wykorzystują też modelowanie agentowe.
Izabela Romanowska: Nasze badania przestały służyć jedynie zaspokajaniu ciekawości w odniesieniu do zamierzchłych czasów. Można je wykorzystać do zrozumienia tego, co dzieje się teraz, a nawet prognozować przyszłość.
Punktem wyjścia tej metody jest pytanie badawcze dotyczące jakiegoś zjawiska lub procesu z przeszłości. Algorytmowi podsuwa się dane, na podstawie których tworzy on kilka symulacji – alternatywnych odpowiedzi. Spośród modeli, jakie przedstawi, człowiek wybiera ten, który statystycznie wydaje się najbardziej prawdopodobny i zgadza się z materiałem archeologicznym lub danymi historycznymi. Nawet dysponując niewielką ilością danych, można uzyskać ciekawe wnioski, ale symulacje są trafniejsze, jeśli ich bazy są otwarte i każdy specjalista może dodać do nich nowe dane lub poprawiać błędne.
W Polsce z modelowania agentowego korzysta zeszłoroczna finalistka nagród naukowych POLITYKI dr Paulina Komar z Uniwersytetu Kardynała Stefana Wyszyńskiego w Warszawie. Sprawdza, czy dystrybucja wina w Cesarstwie Rzymskim rozwijała się na zasadach wolnego rynku, czy jak w gospodarce sterowanej. Symulacje te porównuje ze znaną z materiału archeologicznego dystrybucją amfor.
W Centrum Badania Ryzyka Systemowego naukowcy chcą się natomiast dowiedzieć, jak mogła wyglądać transmisja chorób zakaźnych, które nawiedzały antyczną i średniowieczną Europę. Podstawą do modelowania będzie starożytna sieć osadnicza oraz natężenie ruchu, które jest rekonstruowane w oparciu o dane dotyczące transportu zboża oraz ówczesnej sieci dróg i szlaków morskich. – Oczywiście wynik zależy od tego, co wrzucimy do komputera, bo program jest w stanie wyszukać korelacje między najbardziej bezsensownymi parametrami np. wielkością produkcji serów w Ohio i liczbą filmów z Nicolasem Cage’em – śmieje się dr Szymański. – Dlatego rolą człowieka jest nie tylko zadanie dobrego pytania i napisanie odpowiedniego algorytmu, ale też sensowna interpretacja stworzonych przez komputer symulacji.
Modele agentowe przedstawiają scenariusze na temat tego, jak funkcjonował świat, o którym mamy tylko bardzo mgliste pojęcie. – Niestety mają swoje ograniczenia, bo potrafią odpowiadać tylko na pytania „jak” i „dlaczego” – przyznaje dr Romanowska. – Algorytm powie nam, jak szybko mogło przebiegać zasiedlenie Nowego Świata na podstawie symulacji migracji ludzi podążających za stadami zwierząt lub przemieszczających się wraz ze zmianą stref klimatycznych, ale nie dowiemy się od niego, kiedy do tego doszło. Odpowiedź na to pytanie musi znaleźć archeolog.
Dr Szymański zwraca uwagę na jeszcze jedno ograniczenie: nie każda sztuczna inteligencja zasługuje na swoją nazwę: – Wśród badaczy toczy się dyskusja, które z metod obliczeniowych powinniśmy nazywać sztuczną inteligencją – czy tylko te algorytmy, które podejmują samodzielne decyzje, czy też wszystkie metody, dzięki którym maszyna robi to, do czego człowiekowi potrzebna jest inteligencja.
Związek nierozerwalny
Archeologia to jedna z najbardziej interdyscyplinarnych nauk, ale jej „małżeństwo” z naukami ścisłymi nie jest łatwe. Badacze ze starej szkoły nadal podchodzą do cyfrowych nowinek z dystansem. Ale młode pokolenie wie, że „rozwód” jest już dziś niemożliwy.
Co więcej, to właśnie wprowadzenie do archeologii analiz ilościowych sprawiło, że badacze przeszłości zostali zauważeni i docenieni. – Nasze badania przestały służyć jedynie zaspokajaniu ciekawości w odniesieniu do zamierzchłych czasów – przekonuje dr Romanowska. – Można je wykorzystać do zrozumienia tego, co dzieje się teraz, a nawet prognozować przyszłość. Politycy podejmujący decyzje nie słuchają pojedynczych profesorów, ale przekonują ich analizy oparte na tysiącach danych. Teraz jesteśmy gotowi brać udział w debatach o klimacie, bo możemy powiedzieć, jak jego zmiany wyglądały w przeszłości, czy wypowiadać się na temat planowania miast, ponieważ wiemy, jak one kiedyś reagowały na zmiany społeczne, geograficzne, demograficzne, ekonomiczne.
Swoją drogą zmiany klimatyczne, urbanizacja, industrializacja, wojny, wylesienie i inne konsekwencje działalności człowieka nie mają litości dla zabytków czy zalegających w ziemi i wodzie reliktów przeszłości. I tu znów przydatne są komputery. Mogą przyczynić się do zachowania wiedzy o przeszłości – stając się wielkimi archiwami wygenerowanych przez siebie cyfrowych modeli 3D zabytków i stanowisk archeologicznych. Kto wie, czy w przyszłości nie będą one jedynymi śladami po dziejach Ziemi i za tysiące lat posłużą do badań jakiejś „Sekcji Archeo”.