Obecne interfejsy, oprogramowania i aplikacje są naprawdę kiepskie w jednym – zrozumieniu tego, co przychodzi nam z automatu. Mowa rzecz jasna o otaczającym nas świecie, którego systemy komputerowe nie pojmują „ot tak” na poziomie zer oraz jedynek, choć oczywiście już teraz można to osiągnąć okrężną drogą. To zmienia jednak technologia EdgeConv.
Od razu warto posłużyć się tutaj autonomicznymi samochodami, w których największą rolę odgrywają czujniki LIDAR. Te wysyłają impulsy światła podczerwonego i mierzą czas, w którym odbijają się od obiektów, dzięki czemu tworzą „chmurę punktów”, która w następstwie tworzy trójwymiarowe otoczenie samochodu.
Zrozumienie tych surowych danych w postaci chmury punktów jest trudne, ale w nowej serii artykułów z laboratorium informatyki i sztucznej inteligencji MIT badacze pokazali, że mogą korzystać z mechanizmu głębokiego uczenia się (formy sztucznej inteligencji) do automatycznego przetwarzania chmur punktów dla szerokiego zakresu aplikacji do trójwymiarowego obrazowania. Wykazali też, że ich technologia „EdgeConv” pozwoliła im klasyfikować i segmentować poszczególne obiekty.
Oprócz opracowania EdgeConv zespół zbadał także inne szczególne aspekty przetwarzania chmury punktów. Jednym z nich był proces rejestracji, który łączy skany z jednej pozycji z szeregiem innych, kiedy dana platforma jest w ruchu. Nowy algorytm DCP (Deep Closest Point) usprawnia ten proces, który lepiej odszukuje rozróżniające wzory, punkty i krawędzie w celu wyrównania jej z pozostałymi pomiarami.
Ponoć oba narzędzia zostały już wdrożone przez wielu badaczy w środowisku komputerowym i nie tylko. Nawet fizycy używają ich do zastosowań z udziałem fizyki cząstek. Naukowcy mają w przyszłości nadzieję na wykorzystanie algorytmów do danych zbieranych w czasie rzeczywistym i zbadanie potencjału szkolenia swoich systemów za pomocą samokontroli uczenia się.