Pamiętacie jeszcze Mannequin Challenge sprzed kilku lat, który rozszalał się w sieci, niczym Ice Bucket Challenge? Okazuje się, że wątpliwy dorobek tego trendu nie jest aż tak bezużyteczny, bo naukowcy wzięli się za niego i wykorzystali publiczne w sieci materiały do szkolenia swojej sztucznej inteligencji, a dokładnie segmentu znanego, jako sieć neuronowa do wychwytywania informacji o dalszych planach z filmów.
Czytaj też: Sztuczna inteligencja DeepMind w Quake III pokazała pazur
Całe wyzwanie sprowadzało się do podróży z kamerą pomiędzy stojącymi w bezruchu ludźmi, co okazało się świetną pożywką dla SI. Jako że kamera porusza się, a reszta sceny jest statyczna, to działa tutaj metoda paralaksy, która umożliwia proste odtworzenie dokładnych map ludzi na oddalonych planach.
W celu wyszkolenia sieci neuronowej zespół poddał konwersji 2000 filmów na obrazy 2D z ujęciami o wysokiej rozdzielczości, które łącznie wypluły 4690 sekwencji z ponad 170000 ważnymi dla systemu parami. System nauczył się pobierać obraz wejściowy, wstępną mapę głębi i ludzką maskę, a także wprowadzać „wyrafinowaną” mapę głębokości, na której wypełniono wartości głębi ludzi.
Ponieważ cała scena jest nieruchoma, metody oparte na triangulacji – takie jak multi-view-stereo (MVS) – działają, i możemy uzyskać dokładne mapy głębokości dla całej sceny, w tym ludzi na niej.
Czytaj też: Sztuczna inteligencja wytwarza więcej CO2 niż samochody
Źródło: Techxplore