Science Source
Technologia

Nowe roboty uczą się starych sztuczek

Roboty różnej wielkości i kształtu coraz częściej pojawiają się w miejscach pracy – od fabryk po sale operacyjne. Wiele z nich korzysta z samouczenia się i nabywa nowych umiejętności dzięki metodzie prób i błędów. Nowo opracowana metoda umożliwia przekazywanie takich umiejętności między różnie ukształtowanymi robotami bez konieczności nauki od zera.

„W praktyce jest to istotne i stanowi atrakcyjny, podstawowy problem wart studiowania” – uważa Xingyu Liu, informatyk z Carnegie Mellon University i główny autor badań, zaprezentowanych latem na Międzynarodowej Konferencji, dotyczącej Uczenia Maszynowego.

Załóżmy, że mamy ramię robota z ludzką ręką. Wytrenowaliśmy jego pięć palców, aby podnieść młotek i wbić kołek. Teraz chcemy, aby to samo zadanie wykonał chwytak dwupalcowy. Uczeni stworzyli między nimi rodzaj mostu z robotów symulacyjnych – między każdymi dwoma z nich powoli zmienia się pierwotny kształt poleceń. Każdy robot pośredniczący wykonuje wyznaczone zadanie, dostrajając do niego sztuczną sieć neuronową, aż osiągnie progowy wskaźnik efektywności, po czym kod zadań zostaje przekazany do następnego robota w łańcuchu.

W celu przejścia między wirtualnymi robotami źródłowymi i docelowymi zespół stworzył wspólne „drzewo kinematyczne” – zestaw węzłów reprezentujących części kończyn połączonych odpowiednikami stawów. Przeniesienie umiejętności uderzania młotkiem na dwupalcowy chwytak wymagało dostosowania rozmiarów i masy węzłów ze względu na brak trzech palców. W każdym robocie pośrednim rozmiary i masa palców były nieco mniejsze, a sieć kontrolująca je musiała nauczyć się do tego dostosowywać. Naukowcy dopracowali również metodę treningu, aby skoki między robotami nie były zbyt duże lub zbyt małe.

Metoda z Carnegie Mellon, o nazwie REvolveR (od Robot-Evolve-Robot), góruje nad podstawowymi metodami, polegającymi na uczeniu robota od podstaw. Aby osiągnąć 90-procentowy wskaźnik efektywności chwytaka w zadaniu z młotkiem i w innych sytuacjach – na przykład przy poruszaniu piłki lub otwieraniu drzwi – najlepsza alternatywna metoda treningu wymaga od 29 do 108% więcej prób niż REvolveR, mimo że w metodzie alternatywnej obficiej korzysta się z treningowych informacji zwrotnych. W dalszych eksperymentach naukowcy przetestowali metodę na innych typach wirtualnych robotów, na przykład dodając nogi do robota przypominającego pająka i ponownie ucząc go stąpania.

„Myślę, że to fajny pomysł” – uważa Vitaly Kurin, informatyk z University of Oxford, który studiuje robotykę i uczenie maszynowe, ale w opisanych pracach nie uczestniczył. Choć podejmowanie prób przenoszenia umiejętności przez sztuczną inteligencję nie jest niczym nowym, to, jak twierdzi, takiego transferu, korzystającego z interpolacji między robotami, wcześniej nie rozważał.

Świat Nauki 1.2023 (300377) z dnia 01.01.2023; Skaner; s. 19
Oryginalny tytuł tekstu: "Drużyna transformerów"

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną