Reklama
Pulsar - wyjątkowy portal naukowy Pulsar - wyjątkowy portal naukowy LCM / Archiwum
Człowiek

Jan Kosiński: Naukowcy ryzykują intelektualne lenistwo

Ludzka kreatywność, zwłaszcza wspomagana przez AI, wciąż wygrywa, choć po raz pierwszy w historii ma realną konkurencję – mówi dr Jan Kosiński z Europejskiego Laboratorium Biologii Molekularnej (EMBL). [Artykuł także do słuchania]

Jan KosińskiKinga Lubowiecka/EMBL/ŻIHJan Kosiński
Dr Jan Kosiński jest biologiem i bioinformatykiem, od 2017 r. kieruje grupą badawczą w Europejskim Laboratorium Biologii Molekularnej (EMBL) w Hamburgu. Ukończył studia na Uniwersytecie Warszawskim, a doktorat uzyskał w Międzynarodowym Instytucie Biologii Molekularnej i Komórkowej. Jego zespół zajmuje się modelowaniem struktur makrocząsteczek oraz badaniem cykli infekcyjnych wirusów i pasożytów. Badania te przyczyniają się m.in. do lepszego zrozumienia przebiegu infekcji i mogą stworzyć podstawy do projektowania nowych terapii.

MARCIN ROTKIEWICZ: Bardzo łatwo pogubić się w zalewie wiadomości na temat sztucznej inteligencji, gdzie huraoptymizm i wizje rodem z science fiction mieszają się ze sceptycyzmem, a nawet katastrofizmem. Czy dotyczy to również zastosowań AI w nauce?
JAN KOSIŃSKI: Tu także mamy pewien szum informacyjny, aczkolwiek w mojej dziedzinie, czyli biologii molekularnej, AI wywołała prawdziwą rewolucję.

Kiedy się ona zaczęła?
Od międzynarodowego konkursu Critical Assessment of Protein Structure Prediction (CASP). Rywalizują w nim różne metody przewidywania trójwymiarowej struktury białek. Edycje z 2018 i 2020 r. okazały się przełomowe, gdyż AlphaFold – algorytm AI stworzony przez laboratorium Google DeepMind – zdecydowanie pokonał całą konkurencję. W 2024 r. jego główni twórcy – Demis Hassabis i John Jumper – otrzymali Nagrodę Nobla.

Czyli był to moment ChatGPT dla biologii molekularnej?
Można tak powiedzieć, choć AI wykorzystywano w bioinformatyce już wcześniej. Na przykład podczas moich studiów magisterskich i doktoranckich w Polsce używaliśmy – do uzyskiwania różnych informacji o białkach – programów bazujących na bardziej tradycyjnych metodach uczenia maszynowego.

Dlaczego kształt białek jest tak ważny?
W ich przypadku mamy do czynienia z jedną z fundamentalnych zasad biochemii i biologii molekularnej, często określaną jako zależność struktura-funkcja. Chodzi o to, że kształt białka decyduje np. o tym, czy będzie ona dla organizmu pożyteczna, obojętna czy szkodliwa. Białka zazwyczaj łączą się ze sobą, tworząc większe kompleksy. A zrozumienie, jak są ułożone przestrzennie, pozwala badać ich wzajemne oddziaływania oraz całościowe funkcjonowanie „molekularnych maszyn”. Dzięki znajomości struktury przestrzennej możemy też projektować mutacje w białkach, aby celowo zmieniać ich aktywność, np. wyłączyć jakiś enzym. Wcześniej takie badania prowadzono trochę po omacku. Obecnie możemy o wiele precyzyjniej planować eksperymenty, co znacznie przyspiesza odkrycia.

Z kolei w kontekście projektowania leków znajomość kształtu białka, np. wirusowego, pozwala zidentyfikować potencjalne miejsca, do których mogłyby się przyłączyć zaprojektowane przez nas cząsteczki chemiczne, i w ten sposób zablokować działanie patogenu.

Czytaj też: Ogłupianie na śniadanie. Czy ChatGPT naprawdę niszczy mózg? Pora na mały fact-check

Wspomniał pan o interakcjach białek z innymi cząsteczkami chemicznymi. Takie łamigłówki ma rozwiązywać AlphaFold 3, udostępniony w 2024 r.
DeepMind zdecydował się pójść w tym kierunku m.in. po konsultacjach ze środowiskiem naukowym, w tym z badaczami z naszego instytutu. To ważny krok naprzód, jednak na obecnym etapie skuteczność tego narzędzia pozostaje dość ograniczona. AlphaFold 3 jakoś sobie radzi, ale to jeszcze nie jest ten poziom, co przy przewidywaniu kształtu pojedynczych białek. Szczególnie widać to w przypadku interakcji z RNA. Co ciekawe, w tym konkretnym obszarze lepsze są programy stworzone przez wyspecjalizowane grupy akademickie – w tym dwie z Polski, Janusza Bujnickiego w Warszawie i Marty Szachniuk w Poznaniu, a nie rozwiązania od DeepMind.

AlphaFold ma też kłopoty z tzw. dynamiką białek. Chodzi o próbę zrozumienia i odtworzenia, jak zmieniają one kształt, aby pełnić swoje funkcje. Rzadko bowiem są sztywnymi, nieruchomymi strukturami. Mogą np. występować w dwóch różnych formach – otwartej i zamkniętej. Dlatego, aby związać się z inną cząsteczką chemiczną i wykonać swoje zadanie, muszą przejść ze stanu zamkniętego do otwartego. Chcemy zrozumieć przebieg tego procesu, ale AlphaFold pokazuje nam tylko jedną statyczną formę, np. zamkniętą. Jest więc mało przydatny, gdy zamierzamy odtworzyć całą trajektorię białka z jednego stanu w drugi.

Będzie to kiedyś możliwe dzięki AI?
Do tego potrzebne jest zejście na poziom cząstek subatomowych w białku, gdyż ich rozkład decyduje o jego właściwościach i dynamicznym zachowaniu. Można to policzyć metodami kwantowymi, ale tylko dla bardzo małych struktur składających się z zaledwie kilku atomów. I tu z pomocą przychodzą sztuczne sieci neuronowe będące podstawą wielu obecnych modeli AI. Najpierw używa się precyzyjnych, ale powolnych metod obliczeniowych dla wielu małych cząsteczek. Następnie, na podstawie uzyskanych wyników, uczy się sieć neuronową, która wykorzystuje uzyskaną w ten sposób wiedzę do przewidywania zachowania większych cząsteczek, w tym białek. Chociaż takie podejście znajduje się jeszcze na bardzo wczesnym etapie badań, to pierwsze publikacje naukowe wskazują, że już udało się uzyskać pewne dane dotyczące dynamiki białek.

W których z pańskich badań AlphaFold okazał się szczególnie pomocny?
Od lat zajmuję się m.in. porami jądrowymi. To ogromnie ważne struktury w naszych komórkach – kanały w otoczce jądra komórkowego działające jak precyzyjny strażnik. Kontrolujący, które cząsteczki mogą do niego wejść, a które je opuścić. To jedna z największych i najbardziej złożonych maszynerii białkowych, składająca się z około tysiąca pojedynczych białek. Przez lata wraz z moimi współpracownikami próbowaliśmy stworzyć jego kompletny biochemiczny model, co przypominało układanie trójwymiarowych puzzli, w których stale brakowało wielu kluczowych elementów. Dostarczył je właśnie AlphaFold. Łącząc nasze dane eksperymentalne z mocą obliczeniową AI, stworzyliśmy model dwukrotnie lepszy niż wszystko, co było dostępne wcześniej. Obecnie jest gotowy w ok. 70 proc.

Ciekawi mnie, jak wygląda codzienna praca naukowca z AlphaFold.
W mojej grupie badawczej korzystamy z tego programu na co najmniej trzy sposoby, w zależności od tego, jak złożony jest problem, który chcemy rozwiązać. Pierwszy i najprostszy – dostępny dla każdego – to publiczna baza danych AlphaFold Database. Powstała dzięki współpracy DeepMind z EMBL, a działa jak stosunkowo prosta strona internetowa: wpisujemy nazwę białka i otrzymujemy jego trójwymiarowy model. Jest to w rzeczywistości plik z listą atomów i ich współrzędnych w przestrzeni. Człowiek nie jest w stanie samodzielnie wyobrazić sobie kształtu białka. Dlatego używamy specjalistycznych programów wizualizujących jego strukturę – np. jako charakterystyczne kolorowe wstążki, podobne do tych, które można było zobaczyć w mediach przy okazji prezentowania fragmentów koronawirusa SARS-CoV-2. Ta baza danych ma jednak ograniczenie – zawiera tylko modele pojedynczych białek.

Po drugi sposób sięgamy, by zbadać, jak białka tworzą kompleksy lub jak łączą się z kwasami nukleinowymi, takimi jak DNA. W tym celu DeepMind udostępnił specjalny serwer internetowy. Możemy tam przesłać sekwencje cząsteczek, a komputery wykonują obliczenia i w ciągu około pół godziny dostarczają gotowy model interakcji.

Trzecia metoda jest zarezerwowana dla najbardziej zaawansowanych i wymagających obliczeniowo zadań, np. gdy modelujemy bardzo duże kompleksy białkowe lub musimy przeprowadzić tysiące symulacji. W tym celu pobraliśmy program AlphaFold i zainstalowaliśmy go na naszych instytutowych komputerach. Dodam jeszcze ważny szczegół – korzystanie z AlphaFold jest całkowicie darmowe.

Czytaj też (Polityka): AI zdobywa złoto na olimpiadzie z matematyki. Na czym się wyłożyła i co to oznacza

Czy odkrycia, których dokonano dzięki temu programowi, znalazły już jakieś praktyczne zastosowania, np. w medycynie?
Na nowe leki trzeba będzie poczekać. Proces ich wprowadzania na rynek jest długi i skomplikowany. Wiem natomiast, że powstało sporo firm, które próbują komercjalizować rezultaty użycia AlphaFold, m.in. w celu tworzenia zupełnie nowych, specjalnie zaprojektowanych białek o określonych funkcjach. Jest też inne, być może niedoceniane, ale niezwykle ważne praktyczne zastosowanie AI – ogromny wzrost wydajności badań naukowych. Nasi studenci, zamiast poświęcać lata na tworzenie hipotez badawczych metodą prób i błędów, mogą teraz uzyskać gotowy model białka i w ciągu tygodnia sformułować precyzyjną hipotezę. To fundamentalna zmiana.

Czy kolejny przełom przyniesie AI, która nie tylko przewidzi strukturę przestrzenną białka, ale na tej podstawie określi jego właściwości?
Rzeczywiście, nadal robią to ludzie, posługując się tradycyjnymi metodami, czyli przede wszystkim porównując nową strukturę z bazami danych już znanych białek, by na podstawie podobieństw wnioskować o możliwej funkcji. Czy zrobi to np. AlphaFold 4 lub 5? Zobaczymy.

DeepMind specjalizuje się również w dziedzinie tzw. dużych modeli językowych, czyli algorytmów, które są podstawą m.in. Gemini i ChatGPT. Mogą one analizować i wyciągać wnioski z ogromnych ilości tekstu. Przypuszczam więc, że zamiast tworzyć program, który podaje funkcję białka w formie prostej etykiety, np. „enzym”, DeepMind pójdzie o krok dalej. Wyobrażam sobie system, który z jednej strony „popatrzy” na trójwymiarowy model białka, a z drugiej „przeczyta” wszystko, co kiedykolwiek opublikowano na temat podobnych cząsteczek, ich roli w komórce czy chorobach itd. Łącząc te dwa źródła danych – obraz 3D i tekst – taki zaawansowany model językowy mógłby samodzielnie formułować gotowe hipotezy badawcze.

Czy dzięki AI można tworzyć zupełnie nowe białka, niewystępujące w przyrodzie?
Tak. Powstały zmodyfikowane wersje AlphaFold, można by je nazwać „odwróconymi”, które są wykorzystywane właśnie do tworzenia zupełnie nowych białek. Co więcej, jest to już na tyle rozwinięta dziedzina, że powstały firmy próbujące komercjalizować takie odkrycia. Samo projektowanie nowych białek to zresztą obszar nauki o ugruntowanej pozycji, uhonorowany w 2024 r. Nagrodą Nobla dla amerykańskiego biochemika Davida Bakera.

Mówiliśmy o jasnych stronach AI w nauce. Czy obawia się pan tych ciemnych?
Instytucje finansujące naukę mogą zacząć kierować zbyt dużą część środków na projekty związane ze sztuczną inteligencją. To groźne, ponieważ AI nie zastąpi kluczowych metod eksperymentalnych w dziedzinie badania białek, czyli takich technik, jak mikroskopia elektronowa czy krystalografia rentgenowska. Są one wciąż niezbędne do weryfikacji tego, co proponują modele komputerowe, a także do badania zjawisk, z którymi AI sobie nie radzi, np. wspomnianej dynamiki białek.

Czytaj też (Polityka): Oto nowa klasa robotnicza: humanoidy. Zabiorą nam pracę? To już nie jest science fiction

Media wspominają też o groźbie ułatwienia budowy broni biologicznej.
Nie uważam, że stanowi to większe zagrożenie niż tradycyjne metody, ponieważ istnieją prostsze i sprawdzone sposoby, by np. zwiększyć zakaźność lub szkodliwość istniejącego wirusa. Duże niebezpieczeństwo widzę natomiast w sferze samego procesu badawczego i wpływu AI na naukowców. Chodzi mi o ryzyko pewnego lenistwa intelektualnego. Narzędzia takie jak ChatGPT są świetne w wyszukiwaniu informacji, choć mogą pominąć kluczowe publikacje. Musimy zatem edukować siebie i studentów, by zawsze weryfikować wyniki, szukać źródeł i nie traktować AI jako ostatecznej wyroczni. Zauważyłem też, że teksty naukowe wygenerowane przez duże modele językowe, choć na pierwszy rzut oka wyglądają dobrze, często przy głębszej analizie okazują się puste i nie wnoszą wiele do dyskusji naukowej.

Nie boi się pan projektów, takich jak „AI labs”, gdzie niemal cały proces naukowy zostaje zautomatyzowany – od sformułowania hipotezy badawczej, poprzez jej eksperymentalne przetestowanie, aż po przygotowanie publikacji naukowej i produktu?
Wręcz przeciwnie, uważam je za niezwykle fascynujące. I nie jest to już sfera science fiction. W EMBL pracujemy nad projektem, który nazywamy „Lab in the loop”, czyli zautomatyzowanym laboratorium – chodzi o połączenie naszych zaawansowanych mikroskopów z systemami sztucznej inteligencji. Na podstawie analizy obrazów będzie ona podejmować decyzje, gdzie mikroskop ma wykonać kolejne zdjęcie, a następnie tworzyć gotowe hipotezy badawcze.

Jednak nawet w tak zautomatyzowanym świecie naukowcy wciąż będą potrzebni. Choć nasza rola chyba właśnie ewoluuje w kierunku definiowania ogólnych problemów badawczych, nadzorowania i kierowania pracą maszyn oraz podsumowywania i interpretowania wyników, które wygenerują. Ludzka kreatywność, zwłaszcza wspomagana przez AI, wciąż wygrywa, choć po raz pierwszy w historii ma realną konkurencję.

ROZMAWIAŁ MARCIN ROTKIEWICZ

Rodzina naukowych modeli AI (z laboratorium Google DeepMind)

AlphaFold (2018) – do przewidywania trójwymiarowych struktur białek. Kolejne wersje rozszerzyły zakres i dokładność przewidywań. Do 2025 r. liczba użytkowników przekroczyła milion.

AlphaGeometry (2024) – do rozwiązywania złożonych problemów geometrii euklidesowej na poziomie Międzynarodowej Olimpiady Matematycznej (IMO). Osiąga wyniki zbliżone do złotych medalistów IMO. Powstała również ulepszona wersja AlphaGeometry2.

AlphaProof (2024) – do automatycznego dowodzenia twierdzeń matematycznych i weryfikacji formalnej dowodów. W połączeniu z AlphaGeometry2 rozwiązał cztery z sześciu zadań IMO z 2024 r.

GenCast (2024) – do prognozowania pogody; podczas testów przewyższał dokładnością tradycyjne systemy, zwłaszcza w przewidywaniu ekstremalnych zjawisk atmosferycznych i wiatru.

AlphaGenome (2025) – do analizy niekodujących fragmentów ludzkiego genomu, które stanowią ok. 98 proc. całego DNA. Umożliwia przewidywanie funkcji tych regionów oraz ich wpływu na regulację genów, co ma na celu przyspieszenie badań nad zrozumieniem chorób genetycznych i nowotworowych.

AlphaEvolve (2025) – do automatycznego projektowania i optymalizacji algorytmów naukowych i inżynieryjnych. Wykorzystywany m.in. przy rozwiązywaniu otwartych problemów matematycznych i optymalizacji procesów w komputerowych centrach danych.

***

Europejskie Laboratorium Biologii Molekularnej to międzynarodowa organizacja powstała w 1974 r. Prowadzi i koordynuje badania w dziedzinie nauk o życiu. Zrzesza 29 państw członkowskich, w tym Polskę, i obejmuje sześć placówek (w Niemczech, Wielkiej Brytanii, we Francji, Włoszech i w Hiszpanii – więcej informacji: www.embl.org).

Polecamy również nasze cyfrowe wydanie specjalne „Sztuczna inteligencja”. Dostępne na stronie: sklep.polityka.pl.

Reklama

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną