AlphaFold3: awantura o kody i ograniczenia
8 maja „Nature” ogłosiło bardzo ważne wydarzenie w dziedzinie sztucznej inteligencji wspomagającej badania naukowe. Firma DeepMind (laboratorium AI należące do Google’a) zaprezentowała na łamach brytyjskiego periodyku kolejną wersję programu AlphaFold. Jest lepsza niż poprzednie, gdyż nie tylko dokładniej przeiwduje struktury białek, ale również ich interakcje z innymi molekułami, takimi jak DNA i RNA. Dzięki temu będzie nie tylko narzędziem służącym badaniom podstawowym, lecz także pomocą w odkrywaniu nowych leków.
Ta druga cecha sprawiła, że AlphaFold3 może okazać się wyjątkowo atrakcyjny komercyjnie. Dlatego DeepMind oraz Isomorphic Labs (też należy Google’a i zajmuje się zastosowaniami AI w farmaceutyce) ograniczyły transparentność publikacji o nim. W przeciwieństwie do poprzedniej wersji nie udostępniono bowiem pełnego kodu źródłowego algorytmu (czyli zestawu instrukcji napisanych w danym języku programowania), a korzystanie z narzędzia ograniczono do 10 prognoz dziennie dla jednego użytkownika.
Spotkało się to ze sprzeciwem ponad 650 naukowców, którzy wysłali do redakcji „Nature” list pełen oburzenia. Zarzucają w nim nie tylko postawienie wymienionych barier, ale również naruszenie standardów naukowych, gdyż artykuł dotyczący AlphaFold3 ich zdaniem bardziej przypomina ogłoszenie firmowe niż transparentną publikację akademicką.
Wczoraj redakcja brytyjskiego periodyku odniosła się do tych zarzutów. Pisze m.in., że wprawdzie nie udostępniono kodu źródłowego algorytmu, to jednak naukowcy mogli zapoznać się z „pseudokodem” – szczegółowym opisem działania algorytmu, choć bez pełnych danych. Deklaruje także, że czasopismo promuje otwartość, w tym wymóg udostępniania materiałów, danych, kodu i protokołów. Czasami dopuszcza jednak wyjątki z uzasadnionych powodów, takich jak ochrona poufności, bezpieczeństwa lub brak odpowiedniej infrastruktury do przechowywania danych. Stara się też balansować między potrzebami społeczności naukowej a ograniczeniami nakładanymi przez sektor prywatny. Szczególnie, że ten drugi finansuje sporą część badań, co czasami może prowadzić do ograniczeń w dostępności pełnych danych. Argument ten jest jednak dość kontrowersyjny, gdyż AlphaFold2 był trenowany na publicznie dostępnych bazach białek, takich jak Protein Data Bank (PDB). Można więc podejrzewać, że również AlphaFold3 mógł korzystać z podobnych zbiorów.
Sięgnij do źródeł
AlphaFold3 - why did Nature publish it without its code?
AlphaFold3 Transparency and Reproducibility
Na krytykę naukowców zareagował też DeepMind. Wiceprezes ds. badań, Pushmeet Kohli, ogłosił na platformie społecznościowej X, że firma pracuje nad udostępnieniem AlphaFold3 do użytku akademickiego i zrobi to w ciągu sześciu miesięcy. Ujawni nie tylko jego kod źródłowy, ale również wagi sieci neuronowej. Decydują one, jak model przetwarza wejściowe dane i generuje prognozy. Są niezwykle istotne dla jego działania, ponieważ pozwalają „uczyć się” na podstawie danych treningowych. Ich udostępnienie pozwoli naukowcom odtworzyć wyniki uzyskane przez zespół DeepMind, co będzie bardzo istotne dla weryfikacji skuteczności AlphaFold3. „Nature” zadeklarowało zaś, że zaktualizuje opublikowany artykuł, gdy tylko kod źródłowy będzie dostępny.
Historia publikacji AlphaFold to kolejny przykład rosnących napięć między sektorem prywatnym a nauką w obszarze AI. Bo gdy na horyzoncie pojawiają się potencjalnie spore zyski (w tym przypadku mogące napłynąć dzięki przyspieszeniu wynajdywania leków), cierpi transparentność. Czyli warunek dla rozwoju nauki kluczowy.
Dziękujemy, że jesteś z nami. To jest pierwsza wzmianka na ten temat. Pulsar dostarcza najciekawsze informacje naukowe i przybliża najnowsze badania naukowe. Jeśli korzystasz z publikowanych przez Pulsar materiałów, prosimy o powołanie się na nasz portal. Źródło: www.projektpulsar.pl.