AlphaEvolve: nowy przedstawiciel AI na dworze Królowej nauk
AlphaEvolve wykorzystuje rodzinę dużych modeli językowych Gemini 2.0 do generowania i udoskonalania kodu komputerowego. System działa na zasadzie „ewolucyjnej” – sam proponuje sobie setki czy nawet tysiące rozwiązań, następnie ocenia je według określonych kryteriów (np. efektywność wykorzystania zasobów obliczeniowych, dokładność wyników matematycznych, zużycie energii przez chipy), a w kolejnym kroku wybiera i dopracowuje najlepsze z nich.
Swoją skuteczność wykazał, usprawniając – pierwszy raz od 56 lat – „algorytm mnożący macierze zespolone 4×4”. O co chodzi? Wyobraźmy sobie, że macierze to liczby ułożone w rzędy i kolumny tak jak w arkuszu kalkulacyjnym. Macierz 4×4 ma więc 4 rzędy i 4 kolumny, czyli łącznie 16 liczb. Mnożenie takich macierzy to fundamentalna operacja matematyczna, która napędza niemal całą współczesną technologię: od grafiki w grach komputerowych po trenowanie sztucznej inteligencji.
Problem w tym, że to bardzo kosztowne obliczeniowo operacje. W 1969 r. niemiecki matematyk Volker Strassen zauważył, że można pomnożyć macierze 2×2 efektywniej, niż się wcześniej wydawało. Tę metodę dało się zastosować także do macierzy 4×4 – dzięki niej wystarczało 49 pomnożeń pojedynczych liczb. AlphaEvolve znalazł zaś sposób, by użyć ich 48. Może się wydawać, że różnica jest znikoma. Gdy jednak przeprowadza się miliardy takich operacji (jak podczas trenowania AI czy przekształcania danych w gotowe obrazy widoczne na ekranie), daje ona ogromne oszczędności czasu i energii.
Nie tylko mnożenie
AlphaEvolve osiągnął także spektakularne wyniki w rozwiązywaniu ponad 50 problemów matematycznych, m.in. z analizy, kombinatoryki, teorii liczb i geometrii. W niemal 80 proc. przypadków dorównał najlepszym znanym rozwiązaniom, a w 20 proc. opracował lepsze.
Google poinformował, że już stosuje AlphaEvolve we wszystkich centrach danych od ponad roku, uwalniając 0,7 proc. zasobów obliczeniowych. Choć znów: liczba ta może wydawać się niewielka, to w skali koncernu to bardzo wiele.
AlphaEvolve odkrył też, jak przyspieszyć specjalistyczne programy (nazywane kernelami), które działają jako „pośrednik” między sprzętem a oprogramowaniem i są niezbędne do trenowania Gemini. Dodatkowo zoptymalizował zużycie energii przez procesory TPU – specjalne chipy Google’a zaprojektowane do zadań związanych ze sztuczną inteligencją. Przyspieszył również o 32 proc. FlashAttention – kluczowy mechanizm większości współczesnych sieci neuronowych, czyli algorytmów będących podstawą dużych modeli językowych (m.in. Gemini) czy programu do przewidywania struktury białek AlphaFold.
Sięgnij do źródeł
Badania naukowe: AlphaEvolve: A coding agent for scientific and algorithmic discovery
Ograniczeniem systemu jest wymóg automatycznej ewaluacji rozwiązań: każde musi zostać ocenione przez AlphaEvolve pod kątem tego, czy jest lepsze od poprzednich. Może on zatem pracować wyłącznie z problemami dającymi się sprawdzić bez udziału człowieka (jak np. algorytm do mnożenia macierzy). W testowaniu np. nowego leku – gdzie często trzeba określić, co właściwie widać pod mikroskopem, czy jak interpretować niejednoznaczne dane – nie pomoże. Jak jednak „MIT Technology Review” zauważa Pushmeet Kohli, główny naukowiec DeepMind, potencjał AlphaEvolve jest ogromny: „Da się pójść znacznie dalej”.
Nie tylko zachwyty
Choć wyniki AlphaEvolve przedstawione przez Google DeepMind brzmią imponująco, część środowiska naukowego podchodzi do nich z pewną rezerwą. Głównym powodem jest fakt, że na razie cała wiedza o możliwościach nowego narzędzia opiera się na publikacji – owszem, obszernej i dość szczegółowej – samego DeepMind. System nie został jeszcze udostępniony badaczom spoza firmy, co uniemożliwia niezależną weryfikację jego działania i skuteczności.
Przedstawiciele DeepMind tłumaczą to tym, że AlphaEvolve nadal wymaga na tyle dużych zasobów obliczeniowych, że jego swobodne udostępnienie na serwerach firmy jest na razie niemożliwe. Niemniej Google deklaruje chęć współpracy ze środowiskiem naukowym i zachęca do zgłaszania potencjalnych obszarów zastosowań dla AlphaEvolve.
Dziękujemy, że jesteś z nami. Pulsar dostarcza najciekawsze informacje naukowe i przybliża wyselekcjonowane badania naukowe. Jeśli korzystasz z publikowanych przez Pulsar materiałów, prosimy o powołanie się na nasz portal. Źródło: www.projektpulsar.pl.