Reklama
aplikuj.pl

Sieć neuronowa jest w stanie pisać artykuły naukowe

Praca dziennikarza naukowego obejmuje czytanie artykułów prasowych wypełnionych specjalistyczną terminologią techniczną i zastanawianie się, jak wyjaśnić ich treść w języku zrozumiałym dla czytelników bez wiedzy naukowej. Specjaliście z MIT opracowali sieć neuronową, która jest w stanie zrobić to samo. No dobra, może nie w takim samym stopniu, bo sztuczna inteligencja ogranicza się do zaledwie jedno/dwu-zdaniowych podsumowań. 

Nawet w tej ograniczonej formie taka sieć neuronowa może być przydatna w pomaganiu redaktorom, i naukowcom w skanowaniu dużej liczby dokumentów, aby uzyskać wstępny obraz tego, o czym traktują. Ale rozwiązanie opracowane przez zespół z MIT może również znaleźć zastosowanie w wielu innych obszarach oprócz przetwarzania języka. Mowa m.in. o tłumaczeniu maszynowym czy rozpoznawaniu mowy.

Czytaj też: Sztuczna inteligencja pozwala przewidzieć, jakie właściwości będzie miał dany materiał

Oprogramowanie powstało w wyniku niepowiązanego projektu, który obejmował opracowanie nowych metod opartych na sztucznej inteligencji i wykorzystujących sieci neuronowe. Miały one na celu rozwiązanie pewnych problemów w fizyce. Naukowcy szybko jednak zdali sobie sprawę, że to samo rozwiązanie można wykorzystać do ominięcia innych trudności obliczeniowych, w tym przetwarzania języka naturalnego.

Badacze opracowali alternatywny system, który zamiast opierać się na mnożeniu macierzy, jak większość konwencjonalnych sieci neuronowych, wykorzystuje wektory obracające się w wielowymiarowej przestrzeni. Kluczową koncepcją jest coś, co naukowcy nazywają rotacyjną jednostką pamięci (RUM). System reprezentuje każde słowo w tekście za pomocą wektora w przestrzeni wielowymiarowej. Każde kolejne słowo kieruje ten wektor w pewnym kierunku, reprezentowanym w przestrzeni teoretycznej, która może mieć tysiące wymiarów. Pod koniec procesu końcowy wektor lub zestaw wektorów jest tłumaczony z powrotem na odpowiadający mu ciąg słów.

Na koniec autorzy oprogramowania postanowili porównać jego możliwości z tym, co oferuje system oparty na LSTM. Stworzone przez niego podsumowanie było dość „jałowe” i techniczne, podczas gdy dzięki RUM udało się stworzyć znacznie czytelniejszą i bardziej przystępną konkluzję.

[Źródło: news.mit.edu] 

Czytaj też: Budżetowy robot Blue napędzany sztuczną inteligencją