Nvidia RT kodoli pret AMD staru paātrinātājiem - izskaidrots

Ar pirmās paaudzes RTX Graphics kartēm 2018. gadā Nvidia iepazīstināja pasauli ar pavisam jaunu funkciju, kurai vajadzēja mainīt spēļu ainavu, kā mēs to zinām. Pirmās paaudzes RTX 2000 sērijas grafikas kartes tika balstītas uz jauno Turing arhitektūru un nodrošināja atbalstu reāllaika staru izsekošanai spēlēs. Ray Tracing jau pastāvēja profesionālā 3D animācijā un sintētiskajos laukos, taču Nvidia atbalstīja spēļu reāllaika renderēšanu, izmantojot Ray Tracing tehnoloģiju, nevis tradicionālo rastrēšanu, kurai vajadzēja mainīt spēli. Rasterizācija ir tradicionālā tehnika, ar kuras palīdzību spēles tiek renderētas, savukārt Ray Tracing izmanto sarežģītus aprēķinus, lai precīzi attēlotu, kā gaisma spēles vidē mijiedarbotos un izturētos tāpat kā reālajā dzīvē. Jūs varat uzzināt vairāk par staru izsekošanu un rastrēšanu šajā satura rakstā .



Ray Traced Reflections var būt vispievilcīgākais Ray Tracing pielietojums spēlēs - attēls: Nvidia

Vēl 2018. gadā AMD neatbildēja uz Nvidia grafisko karšu RTX sēriju un to Ray Tracing funkcionalitāti. Sarkanā komanda vienkārši nebija gatava Nvidia novatoriskajai ieviešanai, un tas viņu lielākos piedāvājumus nostādīja ievērojami neizdevīgākā situācijā nekā Green Green komanda. AMD RX 5700 XT bija fantastiska grafikas karte par cenu 399 USD, kas konkurēja ar 499 USD vērtīgo RTX 2070 Super. Lielākā AMD problēma tomēr bija fakts, ka konkurss piedāvāja tehnoloģiju, kuras viņiem nebija. Tas kopā ar daudzveidīgo funkciju komplektu, DLSS atbalstu, stabilajiem draiveriem un vispārējo izcilo sniegumu liek Nvidia piedāvājumiem būtiskas priekšrocības, kad runa ir par Turing vs RDNA paaudzi.



AMD RX 6000 sērija ar staru izsekošanu

Ātra virzība uz 2020. gadu un AMD beidzot ir novedusi cīņu pret Nvidia populārākajiem piedāvājumiem. AMD ir ne tikai ieviesis atbalstu reāllaika staru izsekošanai spēlēs, bet arī izlaidušas 3 grafikas kartes, kas ir ārkārtīgi konkurētspējīgas Nvidia populārākajām grafikas kartēm. AMD RX 6800, RX 6800 XT un RX 6900 XT cīnās viens pret otru ar attiecīgi Nvidia RTX 3070, RTX 3080 un RTX 3090. AMD beidzot atkal ir konkurētspējīgs produkta kaudzes augšdaļā, kas ir daudzsološa ziņa arī patērētājiem.



Staru izsekošana ir viena no galvenajām iezīmēm, ko AMD ir ieviesis šajā paaudzē - Image: AMD



Tomēr arī AMD lietas nav pilnībā pozitīvas. Lai gan AMD ir ieviesis atbalstu reāllaika staru izsekošanai spēlēs, to veiktspēja ar staru izsekošanu tika uztverta gan no recenzentiem, gan citiem patērētājiem. Tas ir saprotams, lai gan, tā kā šis ir AMD pirmais Ray Tracing mēģinājums, tāpēc būtu nedaudz negodīgi sagaidīt, ka viņi pirmajā mēģinājumā sniegs labāko Ray Tracing sniegumu. Tomēr tas rada jautājumus par to, kā darbojas AMD Ray Tracing ieviešana, salīdzinot ar Nvidia ieviešanu, ko mēs redzējām ar Turing un tagad Ampere arhitektūru.

Nvidia RTX Technologies komplekts

Galvenais iemesls, kāpēc AMD mēģinājums, šķiet, ir nepietiekams, salīdzinot ar Nvidia, ir tāds, ka AMD būtībā spēlēja panākumus ar Nvidia un tam bija vairāk vai mazāk tikai 2 gadi laika, lai izstrādātu un pilnveidotu Ray Tracing ieviešanu. No otras puses, Nvidia ir izstrādājusi šo tehnoloģiju daudz ilgāk, jo tām nebija neviena, ar kuru konkurēt produktu augšdaļā. Nvidia ne tikai sniedza Ray Tracing atbalstu pirms AMD, bet tam bija arī labāka atbalsta ekosistēma, kas veidota arī ap tehnoloģiju.

Nvidia izstrādāja savas grafikas karšu sērijas RTX 2000 ar galveno uzmanību Ray Tracing. Tas ir redzams visā pašas Turingas arhitektūras dizainā. Nvidia ne tikai pavairoja CUDA kodolu skaitu, bet arī pievienoja īpašus veltītos staru izsekošanas kodolus, kas pazīstami kā “RT kodoli”, kuri apstrādā lielāko daļu staru izsekošanai nepieciešamo aprēķinu. Nvidia arī izstrādāja tehnoloģiju, kas pazīstama kā “Deep Learning Super Sampling jeb DLSS”, kas ir fantastiska tehnoloģija, kas izmanto dziļu mācīšanos un AI, lai veiktu palielināšanas un atjaunošanas uzdevumus, kā arī kompensētu staru izsekošanas veiktspējas zudumu. Nvidia arī GeForce sērijas kartēs ieviesa īpašus “Tensor Cores”, kas ir paredzēti, lai palīdzētu padziļinātai apmācībai un AI uzdevumos, piemēram, DLSS. Papildus tam Nvidia strādāja arī ar spēļu studijām, lai optimizētu gaidāmās Ray Tracing spēles speciālajai Nvidia aparatūrai, lai varētu maksimāli palielināt veiktspēju.



Spēlē Ray Tracing gaisma spēlē izturas tāpat kā reālajā dzīvē - attēls: Nvidia

Nvidia’s RT kodoli

RT vai Ray Tracing Cores ir Nvidia īpašie aparatūras kodoli, kas īpaši izstrādāti, lai apstrādātu skaitļošanas slodzi, kas ir saistīta ar reālā laika staru izsekošanu spēlēs. Ja specializētie serdeņi ir paredzēti staru izsekošanai, no CUDA kodoliem tiek atslogota liela slodze, kas ir paredzēta standarta renderēšanai spēlēs, lai kodola izmantošanas piesātinājums pārāk daudz neietekmētu veiktspēju. RT kodoli upurē daudzpusību un ievieš aparatūru ar īpašu arhitektūru īpašiem aprēķiniem vai algoritmiem, lai sasniegtu lielāku ātrumu.

Visizplatītākie Ray Tracing paātrinājuma algoritmi, kas ir plaši pazīstami, ir BVH un Ray Packet Tracing, un Turingas arhitektūras shematiskajā diagrammā ir pieminēts arī BVH (Bounding Volume Hierarchy) transversāls. RT Core ir paredzēts, lai identificētu un paātrinātu komandas, kas saistītas ar Ray Traced renderēšanu spēlēs.

RT Core paskaidrots - attēls: Nvidia

Pēc Nvidia bijušā vecākā GPU arhitekta Yubo Zhang teiktā:

“[Tulkots] RT kodols būtībā pievieno īpašu cauruļvadu (ASIC) SM, lai aprēķinātu staru un trīsstūra krustojumu. Tas var piekļūt BVH un konfigurēt dažus L0 buferus, lai samazinātu BVH un trijstūra datu piekļuves aizkavi. Pieprasījumu iesniedz SM. Instrukcija tiek izsniegta, un rezultāts tiek atgriezts SM vietējā reģistrā. Iesaistītā instrukcija un citas aritmētiskās vai atmiņas IO instrukcijas var būt vienlaicīgas. Tā kā tā ir ASIC raksturīga ķēdes loģika, veiktspēju / mm2 var palielināt par lieluma pakāpi, salīdzinot ar ēnotāja kodu krustojuma aprēķināšanai. Lai gan esmu aizgājis no NV, es biju iesaistīts Turingas arhitektūras projektēšanā. Es biju atbildīgs par mainīgas likmes krāsošanu. Es priecājos redzēt atbrīvošanu tagad. ”

Nvidia arī Turingas arhitektūras baltajā grāmatā norāda, ka RT kodoli darbojas kopā ar uzlabotu denoising filtrēšanu, ļoti efektīvu BVH paātrināšanas struktūru, ko izstrādājusi NVIDIA Research, un ar RTX saderīgas API, lai reālā laikā sasniegtu staru izsekošanu vienā Turing GPU. RT serdeņi autonomi šķērso BVH, un, paātrinot šķērsošanas un staru / trīsstūra krustošanās testus, tie izkrauj SM, ļaujot tam apstrādāt citu virsotni, pikseļu un aprēķināt ēnošanas darbu. Ar tādām funkcijām kā BVH būvēšanu un atjaunošanu nodarbojas vadītājs, un staru ģenerēšanu un ēnošanu programma pārvalda, izmantojot jauna veida ēnotājus. Tas atbrīvo SM vienības veikt citus grafiskos un skaitļošanas darbus.

AMD Ray Accelerators

AMD ir piedalījies Ray Tracing sacensībās ar savu RX 6000 sēriju, un līdz ar to viņi ir ieviesuši arī dažus RDNA 2 arhitektūras dizaina galvenos elementus, kas palīdz šai funkcijai. Lai uzlabotu staru izsekošanas veiktspēju AMD RDNA 2 GPU, AMD savā galvenajā Compute Unit Design ir iekļāvis Ray Accelerator komponentu. Paredzams, ka šie staru paātrinātāji palielinās standarta skaitļošanas vienību efektivitāti skaitļošanas slodzēs, kas saistītas ar staru izsekošanu.

Ray Accelerators darbības mehānisms joprojām ir samērā neskaidrs, tomēr AMD ir sniedzis nelielu ieskatu par to, kā šie elementi, domājams, darbojas. Pēc AMD domām, šiem staru paātrinātājiem ir izteikts mērķis šķērsot ierobežotās apjoma hierarhijas (BVH) struktūru un efektīvi noteikt staru un lodziņu (un galu galā trijstūru) krustojumus. Dizains pilnībā atbalsta DirectX Ray Tracing (Microsoft’s DXR), kas ir PC Gaming nozares standarts. Papildus tam AMD izmanto skaitļošanas balstītu denoiser, lai attīrītu staru izsekoto ainu spekulatīvos efektus, nevis paļaujas uz speciāli izveidotu aparatūru. Tas, iespējams, radīs papildu spiedienu uz jauno Compute Units jauktās precizitātes iespējām.

Skaidroti staru paātrinātāji - attēls: AMD

Staru paātrinātāji spēj arī apstrādāt četrus ierobežotos skaļuma kastes krustojumus vai vienu trīsstūra krustojumu sekundē, kas ir daudz ātrāk nekā Ray Traced ainas renderēšana bez īpašas aparatūras. AMD pieejai ir liela priekšrocība, ka RDNA 2 RT Accelerators var mijiedarboties ar kartes Infinity Cache. Kešatmiņā vienlaikus ir iespējams uzglabāt lielu skaitu saistīto apjoma struktūru, tāpēc zināmu slodzi var noņemt no datu pārvaldības un atmiņas nolasīšanas šūnām.

Galvenā atšķirība

Lielākā atšķirība, kas uzreiz ir acīmredzama, salīdzinot RT kodolus un staru paātrinātājus, ir tā, ka, lai gan abi savus pienākumus veic diezgan līdzīgi, RT kodoli ir paredzēti atsevišķi aparatūras kodoli, kuriem ir vienskaitļa funkcija, savukārt staru paātrinātājiem ir daļa no standarta Compute Unit struktūru RDNA 2 arhitektūrā. Ne tikai tas, ka Nvidia’s RT kodoli ir ar Ampere otro paaudzi ar daudz tehniskiem un arhitektoniskiem uzlabojumiem zem pārsega. Tas padara Nvidia RT Core ieviešanu par daudz efektīvāku un jaudīgāku Ray Tracing metodi nekā AMD ieviešana ar Ray Accelerators.

Tā kā katrā skaitļošanas blokā ir iebūvēts viens staru paātrinātājs, AMD RX 6900 XT iegūst 80 staru paātrinātājus, 6800 XT iegūst 72 staru paātrinātājus un RX 6800 iegūst 60 staru paātrinātājus. Šie skaitļi nav tieši salīdzināmi ar Nvidia RT Core numuriem, jo ​​tie ir īpaši kodoli, kas veidoti, domājot par vienu funkciju. RTX 3090 saņem 82 2ndGen RT kodoli, RTX 3080 iegūst 60 2ndGen RT kodoli un RTX 3070 iegūst 46 2ndGen RT serdeņi. Nvidia visās šajās kartēs ir arī atsevišķi Tensor serdeņi, kas palīdz mašīnmācībās un AI lietojumprogrammās, piemēram, DLSS, par kurām varat uzzināt vairāk šajā rakstā .

Katrā RDNA 2 skaitļošanas vienībā ir iebūvēts viens staru paātrinātājs - attēls: AMD

Nākotnes optimizācija

Šajā brīdī ir grūti pateikt, kāda ir Nvidia un AMD Ray Tracing nākotne, taču, analizējot pašreizējo situāciju, var izdarīt dažus izglītotus minējumus. Rakstīšanas laikā Nvidia ir diezgan ievērojams līderis Ray Tracing veiktspējā, salīdzinot tieši ar AMD piedāvājumiem. Lai gan AMD ir iespaidīgi sācis RT, pētniecības, izstrādes, atbalsta un optimizācijas ziņā viņi joprojām ir 2 gadus atpalikuši no Nvidia. Nvidia ir bloķējis lielāko daļu Ray Tracing nosaukumu tūlīt 2020. gadā, lai labāk izmantotu Nvidia veltīto aparatūru nekā AMD. Tas apvienojumā ar faktu, ka Nvidia RT kodoli ir nobriedušāki un jaudīgāki nekā AMD Ray Accelerators, nostāda AMD neizdevīgākā situācijā, kad runa ir par pašreizējo Ray Tracing situāciju.

Tomēr AMD šeit noteikti neapstājas. AMD jau ir paziņojis, ka viņi strādā pie AMD alternatīvas DLSS, kas ir milzīgs palīgs Ray Tracing veiktspējas uzlabošanā. AMD strādā arī ar spēļu studijām, lai optimizētu gaidāmās spēles savai aparatūrai, kas parāda tādos nosaukumos kā GodFall un Dirt 5, kur AMD RX 6000 sērijas kartes darbojas pārsteidzoši labi. Tāpēc mēs varam sagaidīt, ka AMD Ray Tracing atbalsts kļūs arvien labāks ar gaidāmajiem nosaukumiem un tādu topošo tehnoloģiju attīstību kā DLSS Alternative.

Ar to teikts, kopš rakstīšanas brīža Nvidia RTX Suite ir pārāk spēcīgs, lai to ignorētu ikvienam, kurš meklē nopietnu Ray Tracing veiktspēju. Mūsu standarta ieteikums būs jaunā Nvidia grafisko karšu RTX 3000 sērija, salīdzinot ar AMD RX 6000 sēriju, ikvienam, kurš uzskata, ka Ray Tracing ir svarīgs pirkuma lēmuma faktors. Tas varētu un tam vajadzētu mainīties, ņemot vērā AMD nākotnes piedāvājumus, kā arī uzlabojumus gan draiveros, gan spēļu optimizācijā laika gaitā.

Gaidāmās spēles, kas atbalsta gan RTX, gan DLSS - attēls: Nvidia

Pēdējie vārdi

AMD beidzot ir nokļuvis Ray Tracing arēnā, ieviešot viņu RX 6000 grafisko karšu sēriju, kuras pamatā ir RDNA 2 arhitektūra. Lai gan tie nepārspēj Nvidia RTX 3000 sērijas kartes tiešajos Ray Tracing etalonos, AMD piedāvājumi patiešām nodrošina ļoti konkurētspējīgu rastrēšanas veiktspēju un iespaidīgu vērtību, kas var pievilināt spēlētājus, kuriem Ray Tracing nav tik svarīgi. Tomēr AMD ir ceļā uz Ray Tracing veiktspējas uzlabošanu, veicot vairākus galvenos soļus ātri pēc kārtas.

Nvidia un AMD pieeja Ray Tracing ir diezgan līdzīga, taču abi uzņēmumi to izmanto, lai to izdarītu. Sākotnējā pārbaude parādīja, ka Nvidia īpašie RT kodoli pārspēj AMD Ray Accelerator, kas ir iebūvēti pašos skaitļošanas blokos. Tas, iespējams, nerada īpašas bažas galalietotājam, taču ir svarīga lieta, kas jāņem vērā nākotnē, jo spēļu izstrādātāji tagad saskaras ar lēmumu optimizēt savas RT funkcijas, izmantojot vienu no abām pieejām.