Ten system SI uczy roboty chodzenia

Do tej pory systemy sztucznej inteligencji wzbogaciły roboty zdolnością do chwytania i manipulowania przedmiotami z ludzką zręcznością, a teraz naukowcy twierdzą, że opracowali algorytm, dzięki któremu maszyny mogą nauczyć się chodzić samodzielnie. W artykule opublikowanym na stronie Arxiv.org, szereg naukowców z uniwersytetów i jeden z działów badawczych sztucznej inteligencji Google, opisuje system sztucznej inteligencji, który „uczył” czworonożnego robota. Za jego pomocą ten mógł przemierzyć zarówno dobrze znany, jak i nigdy wcześniej nieodwiedzony teren.

Wyzwanie projektowe było dwojakie i polegało na wykorzystywanie systemu nagród lub kar (Reinforcement learning), ogromnej ilości danych i finalnie dostrajania parametrów determinujących strukturę robota, co zwykle wymaga wielu prób, które mogą go uszkodzić. Właśnie przez to ostatnie, grupa naukowców była zmuszona użyć szkieletu uczenia wzmacniającego (RL). Ten z kolei zoptymalizował strategie uczenia w celu maksymalizacji zarówno oczekiwanego zwrotu, oczekiwanej entropii, jak i miary losowości w przetwarzanych danych. W tym „trybie” sztuczna inteligencja nieustannie poszukuje optymalnej ścieżki działań (trajektorii stanów i działań) poprzez próbkowanie działań z zasad i otrzymywanie nagród, uwzględniając nawet losowe czynniki. Tak prezentuje się finalny wynik w wykonaniu robota Minitaur:

W nieco bardziej praktycznym wydaniu – naukowcy opracowali potok danych zapewniany z jednej komputerowej stacji roboczej, która aktualizowała sieci neuronowe, pobierała dane z Minitaura i przesłała mu najnowszą „politykę”. Z kolei obecny na pokładzie robota układ Nvidia Jetson TX2 wykonał ją, zbierał dane i przesyłał z powrotem do stacji roboczej. Po 160000 krokach, nad którymi piecze stanowił algorytm przez dwie godziny „trening” robota zakończył się powodzeniem. Jest więc teraz w stanie poruszać się po płaskich terenach, nad przeszkodami, a także na zboczach i stopniach – z których żaden nie był obecny podczas szkolenia.

Czytaj też: Ten autonomiczny robot Sweeper zrywa paprykę w zaledwie 24 sekundy

Źródło: Venturebeat

Ten system SI uczy roboty chodzenia

Menu