Dzięki LipNet już wkrótce nawet pozbawione mikrofonów kamery będą mogły prawidłowo rozszyfrować, o czym rozmawiamy. 

Naukowcom z Uniwersytetu Oksfordzkiego udało się stworzyć sztuczną inteligencję, która osiąga niezwykłą skuteczność w odczytywaniu zdań z ruchu warg ludzi. LipNet, bo tak nazywa się to dzieło informatyki, skupia swoją całą uwagę na analizowaniu, jak porusza się twarz człowieka, kiedy ten wymawia dane zdanie. Podstawy działania LipNet wyjaśnił jeden z badaczy, Brendan Shillingford:

LipNet jest w stanie czytać całe zdania z ruchu warg dzięki algorytmowi opartemu na uczeniu maszynowym. Neuronowa sieć analizuje każdą klatkę materiału wideo, przyporządkowując później ich sekwencję do danego zdania. Dotychczasowe próby stworzenia takiego AI opierały się o rozpoznawanie pojedynczych wyrazów, a nie całych sentencji.

Najwięksi specjaliści w czytaniu z ruchu warg mogą pochwalić się skutecznością na poziomie 52 procent, co wypada bardzo blado w porównaniu do 93 procent osiągniętych przez LipNet. Oparcie swojego algorytmu o analizę całych zdań okazało się być również kluczem do sukcesu w pobiciu poprzedniego, cyfrowego numeru jeden, którego efektywność wyniosła 79,6 procenta.

Należy uwierzyć twórcom LipNet na słowo, kiedy mówią, że głównym przeznaczeniem, jakie przewidują oni dla swojej technologii jest nie inwigilacja ludzkości na każdym kroku i przejęcie kontroli nad światem, lecz pomoc osobom nie(do)słyszącym. Statystyki wskazują, że na świecie jest około 360 milionów osób zmagających się ze znaczącymi problemami ze słuchem. LipNet mógłby pomóc takim indywiduom interpretując za nich zdania wypowiadane przez ludzi wokoło. Nano de Freitas, jeden z naukowców, którzy pracowali nad tą technologią, postanowił się jednak wypowiedzieć na temat obaw o naruszenie prywatności za pomocą LipNet:

Ludzie muszą być tego świadomi, polegając na demokratycznych instytucjach, które zajmują się tworzeniem odpowiednich praw, chroniących naszej prywatności i godności. Mamy nadzieję, że publikując naszą pracę, pomożemy w zwiększeniu świadomości w tym temacie, jednocześnie w pełni wykorzystując potencjał naszej technologii dla usprawnienia życia ludzi, którzy najbardziej ją potrzebują.

źródło: digitaltrends.com | zdjęcie: mashableasia.com

    Spodobał Ci się ten artykuł? Podaj dalej!