Mesco

GPU w stacjach roboczych (benchmark HPC)


Procesory obliczeń GPU z serii NVIDIA Tesla 20xx przekształcają standardowe komputery PC i stacje robocze w superkomputery osobiste - udostępniające tuż przy Twoim biurku wydajność obliczeniową na poziomie typowym dla klastrów.  Jednostki GPU z serii Tesla 20xx oparte na architekturze GPU NVIDIA CUDA o kryptonimie Fermi charakteryzują się wydajnością obliczeń zmiennoprzecinkowych o podwójnej precyzji na poziomie ponad 500 GFLOPS i 1 TFLOPS w trybie z pojedynczą precyzją, obsługują mechanizmy ECC ochrony i korekcji danych w pamięci oraz wyposażone są w pamięć podręczną pierwszego i drugiego poziomu (L1 i L2). Procesory GPU z serii Tesla 20xx dla stacji roboczych zapewniają tuż przy Twoim biurku wydajność obliczeniową na poziomie typowym dla klastrów.
W porównaniu do systemów wykorzystujących wyłącznie układy CPU, stacje robocze z modułami obliczeń GPU z serii Tesla 20 oferują superkomputerową moc obliczeniową za 1/10 ceny i przy 1/20 poboru mocy, zapewniają przy tym najwyższą gęstość mocy obliczeniowej.


Wymagania jakie należy spełnić aby wykorzystać karty GPU TESLA w obliczeniach w ANSYS:

Licencje komercyjne:
- licencja mechaniczna ANSYS (Professional / Strucural / Mechanical)
- Licencja 'ANSYS HPC Pack'

Licencje akademickie:
- licencja badawcza (Research / Associate)
 

Specyfikacja techniczna kart TESLA:
- 448 rdzeni CUDA
- wydajność dla obliczeń float double precision: 515 Gflops
- wydajność dla obliczeń float single precision: 1.03 TFlops
- pamięć: 2050: 3GB   /  2070: 6GB
- maksymalny pobór mocy: 225W

ogólna specyfikacja techniczna kart TESLA

Dostępne wersje kart TESLA 20xx dla stacji robiczych:
C2050, C2070
M2050, M2070
 


Benchmark:

Celem testów było sprawdzenie wydajności obliczeń mechanicznych na wielu rdzeniach.
Jako narzędzie, zastosowaliśmy sprzęt często używany w każdym biurze konstrukcyjnym czyli stację roboczą HP z serii Z800. Jest to sprawdzona dwuprocesorowa stacja pozwalająca na znaczną rozbudowę zasobów (Z800 możemy rozbudować do 192GB RAM oraz wyposażyć ją w dwie karty obliczeniowe GPU)

Podstawowe parametry naszej stacji HP Z800:
  • dwa procesory Intel Xeon X5690 (3.43 GHz, 6 rdzeni/procesor)
  • pamięć RAM 96GB (12x8GB DDR3-1333MHz ECC)
  • dyski twarde 3x 1TB (SATA, 7200rpm RAID (2 w macierzy RAID typu stripe)
  • karta graficzna HP Quadro 4000 (2GB RAM)
  • karta GPU HP TESLA 2075 (488 procesorów, 6GB RAM)
  • system operacyjny Windows 7 64bit
  • zainstalowane oprogramowanie: ANSYS 13.2 (wraz z HPC Pack)
Założeniem testów było sprawdzenie skalowalności obliczeń mechanicznych w konfiguracji od 1 do 12 rdzeni oraz sprawdzenie wpływu dołożenia karty GPU.
W przeprowadzonych testach nie używaliśmy trybu HT (hyper trading).

Raport z benchmarku.


Polecamy również uwadze:
artykuł: Speed Up Simulations with a GPU in ANSYS
Dodatkowe informacje i specyfikacja kart dla stacji roboczych na stronie firmy nVidia