60 mln USD. Dla mniej zamożnych (lub bardziej oszczędnych?) klientów rządowych i biznesowych firma
CRAY przygotowuje skromniejszą wersję systemu o nazwie X3T.
Na każdym z węzłów obliczeniowych wykonywany jest prosty program jądra
o nazwie catamount, natomiast każdy z węzłów wejścia-wyjścia i węzłów serwisowych sterowany jest systemem Linux wzbogaconym o obsługę MPI (opisywaną w dalszej
części rozdziału). Węzły RAS realizują natomiast okrojoną wersję Linuksa. Duża
część oprogramowania — alokatory procesorów, planiści, biblioteki MPI, biblioteki matematyczne i programy użytkowe — przeniesiona została z poprzedniego komputera Red ASCI.
W systemach tak dużych jak Red Storm kluczowym zagadnieniem jest osiągnięcie
dużej niezawodności. Niezawodność zapewnić też mają procesory RAS (jeden taki
procesor znajduje się na każdej płycie), zaprojektowane specjalnie na potrzeby utrzymywania pracy systemu, jego konserwacji i serwisu. Oczekuje się, że średni czas
670
ROZDZIAŁ 8. z ARCHITEKTURY KOMPUTERÓW RÓWNOLEGŁYCH
międzyawaryjny (MTBF, Mean Time Between Failures) kształtować się będzie w granicach 50 godzin. Sprzęt komputera Red ASCI cechował się średnim czasem między-
awaryjnym rzędu 900 godzin, jednakże liczne błędy w oprogramowaniu obniżały tę
wielkość do ok. 40 godzin. Tak się bowiem niedobrze składa, że mimo coraz bardziej niezawodnego sprzętu, najsłabszym elementem systemów komputerowych pozostaje
ich oprogramowanie.
Więcej informacji na temat komputera Red Storm znaleźć można w pracy (Bri-
ghtwell i in., 2005).
Porównanie komputerów BlueGene/L i Red Storm
Obydwa omawiane komputery są podobne pod wieloma względami i kompletnie różnią
się od siebie pod innymi. Interesujące będzie więc zestawienie ich wybranych cech, co uczyniliśmy w tabeli 8.5.
TABELA 8.5.
Porównanie BlueGene/L i Red Storm
Cecha
BlueGene/L
Red Storm
Procesory
32-bitowy PowerPC
64-bitowy Opteron
Częstotliwość zegara
700 MHz
2 GHz
Liczba procesorów obliczeniowych
65 536
10 368
Liczba procesorów na płycie
32
4
Liczba procesorów w szafce
1024
96
Liczba szafek obliczeniowych
64
108
Moc obliczeniowa
71 TF/s
41 TF/s
Pamięć jednego procesora
512 MB
2 – 4 GB
Całkowita pamięć
32 TB
10 TB
Router
PowerPC
Seastar
Liczba routerów
65 536
10 368
Sieć połączeniowa
Trójwymiarowy torus 64
Trójwymiarowy torus 27
× 32 × 32
× 16 × 24
Inne sieci
Ethernet gigabitowy
Fast Ethernet
Partycjonowalny
Nie
Tak
System operacyjny procesorów
Specyficzny
Specyficzny
obliczeniowych
System operacyjny węzłów
Linux
Linux
wejścia-wyjścia
Producent
IBM
CRAY Research
Cena
Bardzo wysoka
Bardzo wysoka
Obydwa komputery zostały zbudowane mniej więcej w tym samym czasie, za-
tem różnice między nimi nie mają uwarunkowań technologicznych, a wynikać mogą
jedynie z różnych wizji projektantów i (w pewnym stopniu) z różnic między samymi firmami IBM i CRAY Research. BlueGene/L zaprojektowany został od podstaw jako
komputer komercyjny, który firma IBM spodziewa się sprzedać w wielu egzempla-
rzach firmom zajmującym się badaniami biotechnologicznymi, farmaceutycznymi itp.
Red Storm powstał natomiast w jednym egzemplarzu na konkretne zamówienie, choć
— jak wcześniej pisaliśmy — firma CRAY planuje seryjną produkcję jego okrojonej, tańszej wersji.
8.4. WIELOKOMPUTERY PRZEKAZUJĄCE KOMUNIKATY
671
Wizja projektantów z IBM byłą dość wyrazista: wykorzystanie istniejących rdzeni
w celu stworzenia specjalizowanego układu, który można będzie tanio produkować
w sposób masowy i który, sam nie będąc specjalnie szybkim, może zostać wykorzystany jako „masowy” budulec dla potężnego komputera, w wyniku połączenia wielu tysięcy jego egzemplarzy siecią o umiarkowanej prędkości. Wizja projektantów z CRAY Research jawi się jako równie klarowna, lecz całkowicie odmienna, zakładała bowiem wykorzystanie szybkiego, uniwersalnego, 64-bitowego układu „z półki”, który wzbogacony o dużą ilość pamięci i specjalizowany router stał się wydajnym węzłem obliczeniowym — o wiele wydajniejszym niż węzeł BlueGene/L, dzięki czemu można
było zadowolić się mniejszą liczbą węzłów i połączyć je ze sobą szybszą siecią.
Bezpośrednią konsekwencją opisanych różnic w wizji projektu okazały się róż-
nice w sposobie pakowania samych węzłów. Ponieważ w węźle BlueGene/L procesor
obliczeniowy zintegrowany jest z routerem w jednym układzie, można było osiągnąć bardzo duże upakowanie węzłów — 1024 na szafkę. Węzeł komputera Red Storm
zbudowany został natomiast na bazie oryginalnego, niemodyfikowanego procesora
„z półki”, więc zarówno pamięć, jak i router trzeba było dołączyć na zewnątrz tego procesora; w rezultacie w jednej szafce komputera mieści się tylko 96 procesorów (węzłów), a sam komputer zajmuje większą powierzchnię oraz zużywa ponad ośmio-krotnie więcej energii niż BlueGene/L.
W egzotycznym świecie obliczeniowym dużych laboratoriów kryterium osta-
tecznym jest wydajność. BlueGene/L wygrał co prawda pierwsze starcie z Red Stormem (71 TF/s kontra 41 TF/s), lecz — w przeciwieństwie do BlueGene/L — Red Storm
można w razie potrzeby rozbudować o kolejne 10 368 Opteronów (na przykład wy-
mieniając obecne na nowsze wersje dwurdzeniowe), co (teoretycznie) zwiększyć może wydajność do 82 TF/s. W odpowiedzi IBM może zwiększyć częstotliwość zegara —