Reklama
aplikuj.pl

Ten system SI uczy roboty chodzenia

Ten system SI uczy roboty chodzenia
Ten system SI uczy roboty chodzenia

Do tej pory systemy sztucznej inteligencji wzbogaciły roboty zdolnością do chwytania i manipulowania przedmiotami z ludzką zręcznością, a teraz naukowcy twierdzą, że opracowali algorytm, dzięki któremu maszyny mogą nauczyć się chodzić samodzielnie. W artykule opublikowanym na stronie Arxiv.org, szereg naukowców z uniwersytetów i jeden z działów badawczych sztucznej inteligencji Google, opisuje system sztucznej inteligencji, który „uczył” czworonożnego robota. Za jego pomocą ten mógł przemierzyć zarówno dobrze znany, jak i nigdy wcześniej nieodwiedzony teren. 

Wyzwanie projektowe było dwojakie i polegało na wykorzystywanie systemu nagród lub kar (Reinforcement learning), ogromnej ilości danych i finalnie dostrajania parametrów determinujących strukturę robota, co zwykle wymaga wielu prób, które mogą go uszkodzić. Właśnie przez to ostatnie, grupa naukowców była zmuszona użyć szkieletu uczenia wzmacniającego (RL). Ten z kolei zoptymalizował  strategie uczenia w celu maksymalizacji zarówno oczekiwanego zwrotu, oczekiwanej entropii, jak i miary losowości w przetwarzanych danych. W tym „trybie” sztuczna inteligencja nieustannie poszukuje optymalnej ścieżki działań (trajektorii stanów i działań) poprzez próbkowanie działań z zasad i otrzymywanie nagród, uwzględniając nawet losowe czynniki. Tak prezentuje się finalny wynik w wykonaniu robota Minitaur:

W nieco bardziej praktycznym wydaniu – naukowcy opracowali potok danych zapewniany z jednej komputerowej stacji roboczej, która aktualizowała sieci neuronowe, pobierała dane z Minitaura i przesłała mu najnowszą „politykę”. Z kolei obecny na pokładzie robota układ Nvidia Jetson TX2 wykonał ją, zbierał dane i przesyłał z powrotem do stacji roboczej. Po 160000 krokach, nad którymi piecze stanowił algorytm przez dwie godziny „trening” robota zakończył się powodzeniem. Jest więc teraz w stanie poruszać się po płaskich terenach, nad przeszkodami, a także na zboczach i stopniach – z których żaden nie był obecny podczas szkolenia.

Czytaj też: Ten autonomiczny robot Sweeper zrywa paprykę w zaledwie 24 sekundy

Źródło: Venturebeat