NVIDIA Ampere A100 250W TDP GPU uz PCIe 4.0, kas paredzēts AI, datu zinātnei un superskaitļošanai, palaists ar apsolīto 90 procentu 400 W modeļa veiktspēju

Aparatūra / NVIDIA Ampere A100 250W TDP GPU uz PCIe 4.0, kas paredzēts AI, datu zinātnei un superskaitļošanai, kas palaists ar apsolīto 90 procentu 400 W modeļa veiktspēju 2 minūtes lasīts

Nvidia



NVIDIA ir oficiāli laidusi klajā A100, ar PCIe 4.0 saderīgu GPU, kas balstīts uz nākamās paaudzes Ampere arhitektūru. Lai arī ar zemāku 250 W TDP profilu NVIDIA sola, ka PCIe 4.0 Ampere A100 GPU spēs piedāvāt līdz pat 90 procentiem no pilna 400 W A100 HGX GPU veiktspējas. Trešais pieaugošās Ampere A100 GPU saimes variants A100 PCIe ir paredzēts serveriem, kuros darbojas mākslīgā intelekta (AI), datu zinātnes un superdatoru kopas.

NVIDIA atklāja A100 GPU PCI-Express 4.0 variantu. GPU pamatā ir 7 nm Ampere mikroarhitektūra. Turklāt uzņēmums paziņoja arī par vairākām vadošajiem serveru ražotājiem, tostarp Asus, Dell, Cisco, Lenovo un citām, ar A100 darbināmām sistēmām. 250 W A100 PCIe 4.0 GPU paātrinātājs ir diezgan līdzīgs pilnam 400 W TDP variantam, un NVIDIA arī sola gandrīz identisku veiktspēju, neskatoties uz ievērojamo TDP profila kritumu.



NVIDIA A100 ampēra GPU PCIe 4.0 formas faktorā ar tādu pašu 400 W A100 HGX GPU konfigurāciju, bet ar 250 W:

NVIDIA ir paziņojusi par savu PCIe 4.0 A100 PCIe GPU paātrinātāju. Ampere GPU ir pieejams dažādiem rūpnieciskas lietošanas gadījumu komplektiem ar sistēmām, sākot no viena A100 PCIe GPU līdz serveriem, kuros vienlaikus tiek izmantotas divas kartes, izmantojot 12 NVLINK kanālus, kas kopā nodrošina 600 GB / s starpsavienojuma joslas platumu. 250 W TDP A100 PCIe GPU akselerators kodola konfigurācijas ziņā daudz nemainās, salīdzinot ar 400 W A100 HGX GPU.



GA100 GPU ir 400W A100 HGX varianta specifikācijas ar 6912 CUDA kodoliem, kas sakārtoti 108 SM vienībās, 432 tenzora kodoliem un 40 GB HBM2 atmiņu, kas nodrošina tādu pašu atmiņas joslas platumu 1,55 TB / s (noapaļots līdz 1,6 TB / s). s). Tomēr GPU pakotnes izvietošana PCIe 4.0 standarts bija savs trūkums - ievērojami samazināt TDP. Tiek ziņots, ka tas nozīmē 10 līdz 50 procentu izpildes sodu, pamatojoties uz slodzi. Turklāt A100 GPU 250 W TDP variants ir vairāk piemērots īsiem pārrāvumiem, nevis ilgstošām slodzēm.

NVIDIA A100 ampēra GPU PCIe 4.0 formas faktora veiktspējā:

Sakarā ar ievērojamo TDP profila samazinājumu, var pieņemt, ka kartē būs zemāki pulksteņi, lai kompensētu mazāk TDP ievadi. Tomēr NVIDIA izdotā veiktspējas metrika ir patiesi pārsteidzoša, jo tā ir diezgan tuvu 400 W TDP variantam. FP64 veiktspēja joprojām tiek novērtēta ar 9,7 / 19,5 TFLOP, FP32 veiktspēja ir novērtēta ar 19,5 / 156/312 TFLOP (Sparsity), FP16 veiktspēja ir novērtēta ar 312/624 TFLOP (Sparsity), un INT8 ir novērtēta ar 624/1248 TOP ( Sparsity).



Vienkārša matemātika norāda, un NVIDIA nodrošina, ka uz Ampere bāzes PCIe 4.0 250W A100 GPU var nodrošināt 90 procentus no A100 HGX kartes (400W) veiktspējas augstākajās servera lietojumprogrammās. Tas ir pamatoti, jo iepriekšminēto uzdevumu izpildei jaunajam variantam ir vajadzīgs mazāks laiks. Tomēr numuriem jābūt derīgiem tikai uz nelieliem intervāliem. Sarežģītās situācijās, kurās bija nepieciešamas ilgstošas ​​GPU iespējas, 250 W PCIe 4.0 GPU spēj nodrošināt 400 W A100 HGX GPU veiktspēju no 90 līdz 50 procentiem.

Ampere mikroarhitektūra noteikti nāks par labu jaunajam A100. NVIDIA sola vismaz 20x lielāku veiktspēju nekā Volta bāzes priekšgājējs. PCIe 4.0 A100 GPU ir vairāku instanču GPU tehnoloģija. Tas nozīmē, ka vienu A100 var sadalīt pat septiņos atsevišķos GPU, lai veiktu dažādus skaitļošanas uzdevumus. Lai gan tas veicina segmentāciju, pastāv 3. paaudzes NVLink, kas ļauj vairākus GPU apvienot vienā milzu GPU.

Tagi nvidia