To oczywiste, że komputery liczą znacznie szybciej niż ludzie. Przekopują się przez macierze danych z prędkością miliardów operacji na sekundę. By komputer jednakże wiedział co ma policzyć, musi się tego dowiedzieć od człowieka. Tylko skąd pewność, że człowiek wie czego naprawdę należy szukać, żeby odnaleźć wartościowe informacje?

Niestety, nie zawsze problemy analizowane w nauce czy ekonomii są na tyle proste, żeby od razu było wiadomo co można z czym powiązać, jakie wartości mogą z siebie wynikać i być ze sobą skorelowane. Czasem człowiek widząc ogrom danych po prostu siada, łapie się za głowę i myśli.

nie ogarniam tej kuwety.

Dlatego badacze z MIT postanowili ulżyć nieco cierpieniom ludzi analizującym duże i skomplikowane zestawy danych. Opracowali oni algorytm, nazwany Data Science Machine, który sam potrafi określić co warto policzyć i jakie dane ze sobą porównać. Wyszukuje on samodzielnie cechy, które warto ze sobą porównać. Przykładowo, mając bazy danych zawierające produkty znajdujące się w sklepie i odczyty z kas, może samodzielnie zdecydować, żeby sprawdzić jakie produkty najczęściej kupowano, jaka była średnia wartość zakupów, minimalna, itd.

Jak jednak Data Science Machine radzi sobie w porównaniu z ludźmi? Uczeni postanowili przeprowadzić porównanie. Przygotowali trzy zestawy danych i kazali komputerowi szukać w nich prawidłowości. Do rywalizacji z maszyną stanęło 906 ludzkich zespołów. Wyniki otrzymane przez komputer były w kolejnych próbach w 94, 96 i 87% tak dokładne, jak te opracowane przez najlepszy zespół. Algorytm nie okazał się więc najlepszy, jednak i tak wyprzedził… aż 615 drużyn. Jednak o ile jakość otrzymanych analiz można uznać obecnie za co najwyżej dobrą, to bardzo ważna jest szybkość ich otrzymywania. Dane, których analiza zajmuje człowiekowi kilka miesięcy, Data Science Machine opracowuje w ciągu kilku godzin.

[źródło: phys.org; grafika: phys.or, komixxy.pl]

Spodobał Ci się ten artykuł? Podaj dalej!