Podczas kiedy oczy całego świata zwrócone są na wizytę chińskiego przywódcy, Xi Jinpinga, w Polsce, Chińczycy po cichu zdominowali listę TOP500, zawierającą najpotężniejsze superkomputery na świecie. Ich nowe dzieło, Sunway TaihuLight, kompletnie zdruzgotało rywali w używanym na potrzeby rankingu benchmarku Linpack.

Kiedy w ubiegłym roku Chińczycy chcieli zamówić pachnące świeżością akceleratory Intel Xeon Phi, żeby zmodernizować swój superkomputer Tianhe-2, Amerykanie nałożyli na ich sprzedaż do Państwa Środka embargo. Choć powstrzymało to dalszy rozwój najszybszego wówczas superkomputera na świecie, to Chińczycy, jak się okazało, mieli asa w rękawie.

As ten nazywa się Sunway TaihuLight i wpisał się na pierwszą pozycję światowego rankingu osiągając wynik 93 PFLOPS, co jest wynikiem niemal trzykrotnie wyższym od osiągniętego przez Tianhe-2 (33 PFLOPS) oraz przeszło pięciokrotnie lepszym od najlepszego superkomputera z USA (Titan, 17,6 PFLOPS). Jak udało się osiągnąć tak imponujący wynik bez dostępu do amerykańskich technologii?

Chińczycy poradzili sobie opracowując własny procesor. Nazywa się on SW26010 i został zaprojektowany przez Shanghai High Performance IC Design Center. Potwór ten zawiera 260 rdzeni i składa się z 4 części, w skład których wchodzą po 64 rdzenie obliczeniowe Computing Processing Elements, po jednym rdzeniu kontrolnym Management Processing Element oraz 128-bitowy kontroler pamięci DDR3. Choć 260 rdzeni to ogromna ilość, jednak obecnie rekord ilości rdzeni w procesorze należy do projektu KiloCore.

Użyte rdzenie są proste, jednowątkowe, ale potrafią wykonywać instrukcje poza kolejnością. Każdy CPE zawiera jedną jednostkę wektorową (8 operacji podwójnej precyzji), natomiast większy MPE posiada aż dwie. Wszystkie rdzenie taktowane są przy tym zegarem 1,45 GHz.

Choć moc obliczeniowa superkomputera TaihuLight jest olbrzymia, to aby ją osiągnąć konstruktorzy poszli na kilka kompromisów. Każdy z 40960 procesorów dysponuje tylko 32GB pamięci RAM (razem daje to około 1,3PB), co nie jest ilością imponującą w 2016 roku i daje stosunkowo kiepski stosunek ilości pamięci do dostępnej mocy obliczeniowej. Niewiele pamięci znajdziemy również w samym procesorze. Każdy rdzeń dysponuje zaledwie 16kB cache instrukcji oraz 64kB pamięci ogólnego przeznaczenia (oraz 32 i 256kB cache dwóch poziomów dla MPE). Razem daje to niewiele ponad 21MB pamięci w każdym procesorze.

Z powodu wspomnianych ograniczeń trudno jednoznacznie stwierdzić, jak TaihuLight poradzi sobie w zadaniach innych od benchmarku Linpack. Niewiele wiemy też o o samych rdzeniach procesora – nie znamy innych jednostek wykonawczych, poza wektorowymi, nie mamy nawet pojęcia, jaki zestaw instrukcji obsługuje (wiemy tylko, że 64-bitowy…).  Chińczycy nie ujawnili również w jakim procesie produkcyjnym wytworzone zostały procesory.

TaihuLight, zdobywając szczyt listy TOP500, umocnił chińską dominację w zestawieniu. Obecnie nie tylko Chińczycy dysponują dwiema najwydajniejszymi maszynami na liście, ale po raz pierwszy w historii wyprzedzili w ilości komputerów na niej umieszczonych USA (167 vs 165). Pozostaje nam teraz tylko czekać na amerykańską odpowiedź.

[źródło i grafika: top500.org]

 

Spodobał Ci się ten artykuł? Podaj dalej!