NVIDIA Ampere A100 250W TDP GPU op PCIe 4.0 gemaakt voor AI, datawetenschap en supercomputing gelanceerd met beloofde 90 procent prestaties van 400W-model

Hardware / NVIDIA Ampere A100 250W TDP GPU op PCIe 4.0 gemaakt voor AI, datawetenschap en supercomputing gelanceerd met beloofde 90 procent prestaties van 400W-model 2 minuten gelezen

Nvidia



NVIDIA heeft officieel de A100 gelanceerd, een PCIe 4.0-compatibele GPU die is gebaseerd op de volgende generatie Ampere-architectuur. Hoewel het een lager TDP-profiel van 250 W heeft, belooft NVIDIA dat de PCIe 4.0 Ampere A100 GPU tot 90 procent van de prestaties van de volledige 400 W A100 HGX GPU zal kunnen bieden. De derde variant van de groeiende Ampere A100 GPU-familie, de A100 PCIe, is bedoeld voor servers met Artificial Intelligence (AI), Data Science en Supercomputing-clusters.

NVIDIA onthulde een PCI-Express 4.0-variant van de A100 GPU. De GPU is gebaseerd op de 7nm Ampere-microarchitectuur. Daarnaast kondigde het bedrijf ook verschillende A100-aangedreven systemen aan van toonaangevende serverfabrikanten, waaronder Asus, Dell, Cisco, Lenovo en meer. De 250 W A100 PCIe 4.0 GPU-accelerator lijkt veel op de volledige 400 W TDP-variant, en NVIDIA belooft ook vrijwel identieke prestaties ondanks de aanzienlijke daling van het TDP-profiel.



NVIDIA A100 Ampere GPU in PCIe 4.0-vormfactor met dezelfde 400W A100 HGX GPU-configuratie maar met 250W:

NVIDIA heeft zijn PCIe 4.0 A100 PCIe GPU-accelerator aangekondigd. De Ampere GPU is beschikbaar voor uiteenlopende industriële toepassingen met systemen variërend van een enkele A100 PCIe GPU tot servers die twee kaarten tegelijk gebruiken via de 12 NVLINK-kanalen die in totaal 600 GB / s aan interconnectbandbreedte leveren. De 250 W TDP A100 PCIe GPU-versneller verandert niet veel in termen van kernconfiguratie in vergelijking met de 400 W A100 HGX GPU.



De GA100 GPU heeft de specificaties van de 400W A100 HGX-variant met 6912 CUDA-cores gerangschikt in 108 SM-units, 432 Tensor Cores en 40 GB HBM2-geheugen die dezelfde geheugenbandbreedte van 1,55 TB / s levert (afgerond op 1,6 TB / s). s). Als u het GPU-pakket echter op het PCIe 4.0-standaard had zijn eigen nadeel van het aanzienlijk verminderen van TDP. Dit betekent naar verluidt een prestatievergoeding van 10 tot 50 procent op basis van de werklast. Bovendien is de 250W TDP-variant van de A100 GPU meer geschikt voor korte bursts dan voor langdurige belasting.

NVIDIA A100 Ampere GPU in PCIe 4.0 Form-Factor-prestaties:

Vanwege de aanzienlijke vermindering van het TDP-profiel, zou kunnen worden aangenomen dat de kaart lagere klokken zou hebben om de minder TDP-invoer te compenseren. De prestatiestatistieken die NVIDIA heeft vrijgegeven, zijn echter echt verrassend, aangezien ze vrij dicht in de buurt komen van de 400W TDP-variant. De FP64-prestaties worden nog steeds beoordeeld op 9,7 / 19,5 TFLOP's, FP32-prestaties worden beoordeeld op 19,5 / 156/312 TFLOP's (Sparsity), FP16-prestaties worden beoordeeld op 312/624 TFLOP's (Sparsity) en INT8 wordt beoordeeld op 624/1248 TOP's ( Schaarsheid).



Eenvoudige wiskunde geeft aan, en NVIDIA verzekert dat de Ampere-gebaseerde PCIe 4.0 250W A100 GPU 90 procent van de prestaties van de A100 HGX-kaart (400W) in topservertoepassingen kan leveren. Dit is gerechtvaardigd omdat het voor de nieuwe variant minder tijd kost om bovengenoemde taken te voltooien. De nummers mogen echter alleen geldig zijn voor korte intervallen. In complexe situaties waarin aanhoudende GPU-mogelijkheden vereist zijn, kan de 250 W PCIe 4.0 GPU overal van 90 tot 50 procent de prestaties leveren van de 400 W A100 HGX GPU.

De Ampere-microarchitectuur zal zeker ten goede komen aan de nieuwe A100. NVIDIA belooft een prestatieverbetering van ten minste 20x ten opzichte van de op Volta gebaseerde voorganger. De PCIe 4.0 A100 GPU is voorzien van multi-instance GPU-technologie. Dit betekent dat een enkele A100 kan worden opgedeeld in maar liefst zeven afzonderlijke GPU's om verschillende computertaken uit te voeren. Hoewel dit de segmentatie bevordert, is er de 3e generatie NVLink, waarmee verschillende GPU's kunnen worden samengevoegd tot één gigantische GPU.

Tags nvidia