WRÓĆ DO STRONY
GŁÓWNEJ
Nauka

Kolejne postępy robotów w nauce chwytania

Badacze zajmujący się robotami odnieśli w ostatnich czasach duże sukcesy w kwestii zdolności ruchowych maszyn. Przez długie lata istotny problem stanowiło stworzenie kończyn zdolnych płynnie podnosić i utrzymywać przedmioty. Zeszłoroczne międzynarodowe warsztaty poświęcone autonomicznemu chwytaniu i manipulacji przyniosły dyskusje na temat nowych algorytmów wybierających, wykonujących i oceniających chwyty. Równolegle do postępów w sferze software’owej następują postępy w kwestii czujników i sensorów pracujących w zróżnicowanych środowiskach.

Jak twierdzi MIT Technology Review, umiejętności chwytania u robotów wciąż są niesamowicie słabo rozwinięte. W zasadzie każdy automat ma duże problemy z podnoszeniem rzeczy, pod które bezpośrednio nie został zaprogramowany, zwłaszcza w niekontrolowanym środowisku.

Dlatego praca dwóch badaczy, Lerrela Pinto i Abhinava Gupty z Instytutu Robotyki na Carnegie Mellon University, „Supersizing Self-Supervision: Learning to Grasp from 50K Tries and 700 Robot Hours” (50 tysięcy prób i 700 robotogodzin) przykuła szczególną uwagę pasjonatów robotyki.

Uczeni zaprezentowali automat, który sam się uczy. Baxter, robot przemysłowy, stworzony do przeprowadzania powtarzanych czynności, takich jak ładowanie, czy manipulowanie materiałami został umieszczony w „niestrukturalnym środowisku”. Czyli innymi słowy, w bałaganie.

Naukowcy zwiększyli ilość danych treningowych do wielkości 40-krotnie przewyższającej to,co zbierano poprzednio. Uzyskano 50 tysięcy punktów danych, zebranych na przestrzeni 700 godzin pracy robota. Pozwoliło to badaczom na „wytrenowanie” Konwolucjonalnej Sieci Neuronowej (CNN) zdolnej przewidywać miejsca chwytu bez „nadmiernego dopasowywania”.

Jak twierdzą naukowcy, w swoim badaniu odchodzą od metodologii manualnego oznaczania baz danych chwytów, gdyż takie podejście nie może zostać przeskalowane. Zamiast tego, zainspirowani przez naukę wzmocnieniową (i ludzką nauką doświadczeniową), zaprezentowali samonadzorujący się algorytm, który uczy się przewidywać miejsca chwytów na zasadzie prób i błędów.

Praca uczonych udowodniła, że wielkoskalowe eksperymenty na zasadzie prób i błędów są przy zagadnieniu chwytania możliwe. Skala zbierania danych – 40-krotnie większa niż w wypadku jakichkolwiek innych prób – pozwoliła ukazać przydatność wydajnych sieci neuronowych przy uczeniu maszyny uniwersalnego rozwiązania problemu.

Jak twierdzi MIT Technology Review, ostatecznym wyzwaniem dla Baxtera będzie „wyzwanie pasty do zębów” – prawidłowe ułożenie kropelki pasty wielkości ziarnka grochu na szczoteczce do zębów. Jak stwierdził autor artykułu, „być może już niedługo ludzkość straci mistrzostwo w świecie pasty do zębów, tak jak straciła mistrzostwo w świecie szachów 20 lat temu”.

deeplearning

[źródło i grafika: techxplore]