Zamiana tekstu na mowę wykonywana przez sztuczną inteligencję potrafi bawić do dzisiaj swoją sztucznością. W końcu wystarczy wejść na Google Translator, przetłumaczyć to samo zdanie na kilka języków i posłuchać, jakie komiczne dźwięki wydobywa z siebie komputer. Wkrótce może się to jednak zmienić i maszyny mogą zacząć mówić praktycznie tak samo, jak ludzie. Wszystko dzięki Google i ich zespołowi DeepMind.

Jeśli nie kojarzycie ludzi z DeepMind, to wystarczy, że przypomnę o tym, jak napisana przez nich sztuczna inteligencja – AlphaGo pokonała profesjonalnego gracza Go wynikiem 4-1. Tym razem jednak programiści z tego zespołu postanowili napisać program, który mówi tak naturalnie, jak człowiek. Żeby to osiągnąć, wrzucili w swoją sieć neuronową reprezentacje wizualne fal dźwiękowych kilku wcześniej nagranych kwestii. WaveNet, bo tak nazywa się to oprogramowanie, dzięki temu zyskało umiejętność tworzenia własnych fal dźwiękowych. WaveNet czasem produkuje nawet swoje własne odgłosy wdychania powietrza czy ruchów twarzy, przez co jego mowa wydaje się jeszcze bardziej naturalna.

Przyjdzie nam jeszcze trochę czekać, zanim WaveNet zostanie faktycznie wdrożony do jakichś aplikacji, ale miło widzieć postęp w tej kategorii. Wkrótce może nie będziemy w stanie odróżnić, czy rozmawiamy z komputerem, czy człowiekiem. Wszystkie próbki WaveNetu możecie znaleźć w oficjalnym oświadczeniu Google DeepMind, czyli tutaj.

[źródło: deepmind.com | zdjęcie: engadget.com]

 

Kolejny artykuł znajdziesz poniżej