Shutterstock
Struktura

Przejawy kreatywnego myślenia sztucznej inteligencji mogą być iluzją

Według naukowców ze Stanford University niektóre przejawy aktywności SI są interpretowane błędnie. Niewykluczone, że rzekome przebłyski jej autonomii są artefaktem metod testowania.

Silny lęk, podobnie jak silna nadzieja mogą sprawiać, że widzimy to, co spodziewamy się zobaczyć. Sztuczna inteligencja niewątpliwie również budzi duże emocje. Jej zaawansowane modele są bacznie analizowane. Szczególne zainteresowanie budzą zachowania emergentne – nieprzewidziane aktywności w systemie bazującym na zaprogramowanych schematach zachowań elementów składowych.

Przykładowo, SI zaprogramowana do nauczenia się gry w szachy lub go może zaskoczyć odkrywczą taktyką albo śmiałym posunięciem nieobecnym w rozegranych przez ludzi partiach, których analiza służyła za materiał szkoleniowy. Te zachowania bywają traktowane jako przejawy kreatywności. Skąd tylko krok do tezy o zdolności SI do ewoluowania w autonomiczny superumysł.

Naukowcy ze Stanford University – Ryan Schaeffer, Brando Miranda i Sanmi Koyejo – opublikowali jednak artykuł, który mocno schładza te nadzieje (lub obawy). Według nich wysuwane dowody na zachowania emergentne SI bazują na statystykach, które prawdopodobnie zostały błędnie zinterpretowane przez badaczy. Są złudzeniami.

Zdolności wielkich modeli językowych – takich jak różne wersje GPT – są mierzone poprzez określenie procentu poprawnych przewidywań. Modele te układają zdania, obliczając prawdopodobieństwo wystąpienia danego słowa w danym ciągu na podstawie przepastnych baz danych złożonych z gigantycznej liczby tekstów, jakimi nakarmiono je w ramach treningu. Możliwość błędnego wyboru jest zatem wpisana w ten system.

Analizy statystyczne można jednak przedstawiać na różne sposoby. Schaeffer, Miranda i Koyejo wykazali, że przy pewnych szczególnych metodach prezentacji uzyskanych wyników analizy te mogą wykazywać istnienie zjawisk, które są błędnie interpretowane jako wskaźniki zachowań emergentnych. Gdy jednak te same dane są prezentowane w inny sposób, odstępstwa od normy nie są odnotowywane. Innym powodem ulegania złudzeniom przez badaczy jest bazowanie na niedostatecznie dużych analizach.

Naukowcy zastrzegają jednak, że ich ustalenia bynajmniej nie przesądzają o tym, że duże modele w ogóle nie mogą przejawiać zachowań emergentnych.