Yeni NVIDIA ve AMD Ekran Kartlarından Neler Bekleniyor?

ItalioBrot

Global Mod
Global Mod
Yeni RDNA 3 mimarili Radeon RX 7900 XT ve Ada Lovelace takviyeli GeForce RTX 4090 ekran kartlarıyla ilgili yeni ayrıntılar gelmeye devam ediyor. Bu GPU’ların büyük performans iyileştirmeleri getirmesi bekleniyor ve beraberinde şimdiye kadar üretilmiş en epeyce güç tüketen çipler olacak.

NVIDIA Ada Lovelace mimarisiyle monolitik bir yaklaşımı hedeflerken, AMD’nin CDNA 2 mimarisinde olduğu üzere epeyce yongalı bir tasarım (MCM) kullanımı bekleniyor. AMD, artık tüketici ve oyun GPU’ları için birebir MCM teknolojisini kullanacak.

AMD Radeon RX 7900 XT: RDNA 3 Mimarisi ve Navi 21

Amiral gemisi RDNA 3 yongası olan AMD Navi 31 GPU, yeni kuşak Radeon RX 7900 XT grafik kartına güç sağlayacak. AMD’nin yeni kuşak RDNA 3 yongalarında CU (Bilgi Süreç Birimi) yerine WGP’ler (Çalışma Kümesi İşlemcileri) kullanılacak. Ekran kartının TSMC’nin 5nm sürecine dayalı bir GCD (Graphics Core Die) ve TSMC 6nm sürecine dayalı bir MCD (Multi-Cache Die) olmak üzere iki temel IP’ye sahip olacağı söyleniyor.

Görünen Navi 31 GPU yapılandırmasında iki GCD (Graphics Core Die) ve tek bir MCD (Multi-Cache Die) bulunuyor. Her GCD’de 3 Shader Motoru (toplam 6) ve her Shader Motorunda 2 Shader Dizisi (SE başına 2 / GCD başına 6 / toplamda 12) yer alıyor.

Ayrıyeten Her Shader Dizisi 5 WGP’den (SE başına 10 / GCD başına 30 / toplamda 60) oluşuyor ve her WGP, 32 ALU’ya sahip 8 SIMD32 ünitesine (SA başına 40 SIMD32 / SE başına 80 / GCD başına 240 / toplamda 480) sahip. Bu SIMD32 üniteleri, GCD başına 7.680 çekirdek ve toplamda 15.360 çekirdek oluşturmak üzere bir ortaya geliyor.

Navi 31 MCD, yeni kuşak Infinity Fabric orta irtibatı aracılığıyla ikili GCD’lere bağlanacak ve 256-512 MB kapasitede Infinity Cache önbellek taşıyacak. Her GPU ayrıyeten 4 bellek temasına (32 bit) sahip olmalı. Bu da 256 bit bilgi yolu arabirimi için toplam 8 32 bit bellek denetimcisi olacağı manasına gelmekte.

Yakın vakitte ortaya çıkan bir öteki söylenti, AMD’nin RDNA 3 ailesinde üç boyutlu Infinity Cache bellek teknolojisini kullanacağını ortaya koydu. Tıpkı Milan-X yongalarının L3 önbelleğinde olduğu üzere, GPU’da bulunan mevcut önbelleğe ek olarak dikey olarak istiflenmiş ek bir önbellek ünitesi yer alacak.

AMD RDNA GPU Karşılaştırması

GPU İsmiNavi 10Navi 21Navi 31
GPU Üretim Teknolojisi7nm7nm5nm (6nm?)
GPU PaketlemesiMonolitikMonolitikMCD (Multi-Chiplet Die)
Shader Motorları246
GPU WGP204030 (Per MCD)
60 (In Total)
WGP başına SP128128256
Hesaplama Ünitesi4080120 (MCD başına)
240 (toplam)
Çekirdek (Kalıp Başına)256051207680
Çekirdek (Toplam)2560512015360 (2 x MCD)
Bellek Veriyolu256-bit256-bit256-bit
Bellek TipiGDDR6GDDR6GDDR6
Bellek Kapasitesi8 GB16 GB32 GB
Infinity Cache128 MB256-512 MB
Amiral Gemisi SKURadeon RX 5700 XTRadeon RX 6900 XTXRadeon RX 7900 XT
TBP225W330W350-550W
Çıkış Tarihi2019 3. Çeyrek2020 4. Çeyrek2022 4. Çeyrek

NVIDIA GeForce RTX 4090: Ada Lovelace Mimarisi ve AD102 GPU

Mevcut bilgilere göre NVIDIA’nın Ada Lovelace GPU’ları için TSMC’nin N5 (5nm) üretim teknolojisi kullanılacak. AMD’nin bilakis, yeşil kadro yeni ekran kartlarında monolitik bir tasarım benimseyecek. Amiral gemisi RTX 4090 modelinde AD102 GPU’nun yer alacağını ekleyelim.

AD102 GPU’nun 2.5 GHz (2.3 GHz ortalama artış) kadar yüksek bir saat suratına sahip olduğu söyleniyor. NVIDIA AD102, 144 SM ünitesi ortasında yer alan (değişebilen) ön özelliklere göre 18432 CUDA Çekirdeğine sahip görünüyor. Bu da Turing mimarisine kıyasla çekirdek sayısında neredeyse iki katlık bir artış demek. 2.3-2.5 GHz saat suratı bize 85 ila 92 TFLOP’a kadar süreç performansı (FP32) veriyor. Bu 36 TFLOP FP32 hesaplama gücü içeren mevcut RTX 3090’ın FP32 performansının iki katından fazla.

%150 performans artışı hayli büyük görünüyor lakin NVIDIA’nın Ampere ile bu jenerasyon FP32 kıymetlerinde esasen büyük bir sıçrama yaptığını unutmamak gerekiyor. Ampere GA102 GPU (RTX 3090) 36 TFLOP sunarken Turing TU102 GPU (RTX 2080 Ti) 13 TFLOP ham güç sunacak. Yani FP bedelleri açısından %150’nin üzerinde bir artış yaşandı. Lakin RTX 3090, gerçek dünya oyun performansı açısından RTX 2080 Ti’iye göre %50-60 civarında daha kuvvetliydü.

Bunun yanı sıra NVIDIA GeForce RTX 40 amiral gemisinin RTX 3090’a benzeri bir 384-bit bilgi yolu arayüzüne sahip olacağı da gelen bilgiler içinde. Yenik artlar bir daha GDDR6X belleklerden yararlanacak, fakat mevcut modellere kıyasla daha yüksek bant genişliği nazaranceğiz. RTX 4090 24 GB belleğe sahip olacak, bu niçinle tek taraflı 16 GB DRAM yahut çift taraflı 8 GB DRAM modülleri bekleyebiliriz.

NVIDIA GPU Kıyaslaması

GPU İsmiTU102GA102AD102
GPU MimarisiTuringAmpereAda Lovelace
GPU Üretim TeknolojisiTSMC 12nm NFFSamsung 8nm5nm
Grafik Sürece Kümeleri (GPC)6712
Doku Sürece Kümeleri (TPC)364272
Akış İşlemcileri (SM)7284144
CUDA Çekirdeği46081075218432
Teorik TFLOP16.137.6~90 TFLOPs?
Bellek TipiGDDR6GDDR6XGDDR6X
Bellek Veriyolu384-bit384-bit384-bit
Bellek Kapasitesi11 GB (2080 Ti)24 GB (3090)24 GB (4090?)
Amiral Gemisi SKURTX 2080 TiRTX 3090RTX 4090?
TGP250W350W450-650W?
Çıkış TarihiEylül 2018Eylül 20202022?