Yeni NVIDIA ve AMD Ekran Kartlarından Neler Bekleniyor?

ItalioBrot · 17 Kas 2021

Yeni RDNA 3 mimarili Radeon RX 7900 XT ve Ada Lovelace takviyeli GeForce RTX 4090 ekran kartlarıyla ilgili yeni ayrıntılar gelmeye devam ediyor. Bu GPU’ların büyük performans iyileştirmeleri getirmesi bekleniyor ve beraberinde şimdiye kadar üretilmiş en epeyce güç tüketen çipler olacak.

NVIDIA Ada Lovelace mimarisiyle monolitik bir yaklaşımı hedeflerken, AMD’nin CDNA 2 mimarisinde olduğu üzere epeyce yongalı bir tasarım (MCM) kullanımı bekleniyor. AMD, artık tüketici ve oyun GPU’ları için birebir MCM teknolojisini kullanacak.

AMD Radeon RX 7900 XT: RDNA 3 Mimarisi ve Navi 21

Amiral gemisi RDNA 3 yongası olan AMD Navi 31 GPU, yeni kuşak Radeon RX 7900 XT grafik kartına güç sağlayacak. AMD’nin yeni kuşak RDNA 3 yongalarında CU (Bilgi Süreç Birimi) yerine WGP’ler (Çalışma Kümesi İşlemcileri) kullanılacak. Ekran kartının TSMC’nin 5nm sürecine dayalı bir GCD (Graphics Core Die) ve TSMC 6nm sürecine dayalı bir MCD (Multi-Cache Die) olmak üzere iki temel IP’ye sahip olacağı söyleniyor.

Görünen Navi 31 GPU yapılandırmasında iki GCD (Graphics Core Die) ve tek bir MCD (Multi-Cache Die) bulunuyor. Her GCD’de 3 Shader Motoru (toplam 6) ve her Shader Motorunda 2 Shader Dizisi (SE başına 2 / GCD başına 6 / toplamda 12) yer alıyor.

Ayrıyeten Her Shader Dizisi 5 WGP’den (SE başına 10 / GCD başına 30 / toplamda 60) oluşuyor ve her WGP, 32 ALU’ya sahip 8 SIMD32 ünitesine (SA başına 40 SIMD32 / SE başına 80 / GCD başına 240 / toplamda 480) sahip. Bu SIMD32 üniteleri, GCD başına 7.680 çekirdek ve toplamda 15.360 çekirdek oluşturmak üzere bir ortaya geliyor.

Navi 31 MCD, yeni kuşak Infinity Fabric orta irtibatı aracılığıyla ikili GCD’lere bağlanacak ve 256-512 MB kapasitede Infinity Cache önbellek taşıyacak. Her GPU ayrıyeten 4 bellek temasına (32 bit) sahip olmalı. Bu da 256 bit bilgi yolu arabirimi için toplam 8 32 bit bellek denetimcisi olacağı manasına gelmekte.

Yakın vakitte ortaya çıkan bir öteki söylenti, AMD’nin RDNA 3 ailesinde üç boyutlu Infinity Cache bellek teknolojisini kullanacağını ortaya koydu. Tıpkı Milan-X yongalarının L3 önbelleğinde olduğu üzere, GPU’da bulunan mevcut önbelleğe ek olarak dikey olarak istiflenmiş ek bir önbellek ünitesi yer alacak.

AMD RDNA GPU Karşılaştırması

GPU İsmi	Navi 10	Navi 21	Navi 31
GPU Üretim Teknolojisi	7nm	7nm	5nm (6nm?)
GPU Paketlemesi	Monolitik	Monolitik	MCD (Multi-Chiplet Die)
Shader Motorları	2	4	6
GPU WGP	20	40	30 (Per MCD) 60 (In Total)
WGP başına SP	128	128	256
Hesaplama Ünitesi	40	80	120 (MCD başına) 240 (toplam)
Çekirdek (Kalıp Başına)	2560	5120	7680
Çekirdek (Toplam)	2560	5120	15360 (2 x MCD)
Bellek Veriyolu	256-bit	256-bit	256-bit
Bellek Tipi	GDDR6	GDDR6	GDDR6
Bellek Kapasitesi	8 GB	16 GB	32 GB
Infinity Cache	–	128 MB	256-512 MB
Amiral Gemisi SKU	Radeon RX 5700 XT	Radeon RX 6900 XTX	Radeon RX 7900 XT
TBP	225W	330W	350-550W
Çıkış Tarihi	2019 3. Çeyrek	2020 4. Çeyrek	2022 4. Çeyrek

NVIDIA GeForce RTX 4090: Ada Lovelace Mimarisi ve AD102 GPU

Mevcut bilgilere göre NVIDIA’nın Ada Lovelace GPU’ları için TSMC’nin N5 (5nm) üretim teknolojisi kullanılacak. AMD’nin bilakis, yeşil kadro yeni ekran kartlarında monolitik bir tasarım benimseyecek. Amiral gemisi RTX 4090 modelinde AD102 GPU’nun yer alacağını ekleyelim.

AD102 GPU’nun 2.5 GHz (2.3 GHz ortalama artış) kadar yüksek bir saat suratına sahip olduğu söyleniyor. NVIDIA AD102, 144 SM ünitesi ortasında yer alan (değişebilen) ön özelliklere göre 18432 CUDA Çekirdeğine sahip görünüyor. Bu da Turing mimarisine kıyasla çekirdek sayısında neredeyse iki katlık bir artış demek. 2.3-2.5 GHz saat suratı bize 85 ila 92 TFLOP’a kadar süreç performansı (FP32) veriyor. Bu 36 TFLOP FP32 hesaplama gücü içeren mevcut RTX 3090’ın FP32 performansının iki katından fazla.

%150 performans artışı hayli büyük görünüyor lakin NVIDIA’nın Ampere ile bu jenerasyon FP32 kıymetlerinde esasen büyük bir sıçrama yaptığını unutmamak gerekiyor. Ampere GA102 GPU (RTX 3090) 36 TFLOP sunarken Turing TU102 GPU (RTX 2080 Ti) 13 TFLOP ham güç sunacak. Yani FP bedelleri açısından %150’nin üzerinde bir artış yaşandı. Lakin RTX 3090, gerçek dünya oyun performansı açısından RTX 2080 Ti’iye göre %50-60 civarında daha kuvvetliydü.

Bunun yanı sıra NVIDIA GeForce RTX 40 amiral gemisinin RTX 3090’a benzeri bir 384-bit bilgi yolu arayüzüne sahip olacağı da gelen bilgiler içinde. Yenik artlar bir daha GDDR6X belleklerden yararlanacak, fakat mevcut modellere kıyasla daha yüksek bant genişliği nazaranceğiz. RTX 4090 24 GB belleğe sahip olacak, bu niçinle tek taraflı 16 GB DRAM yahut çift taraflı 8 GB DRAM modülleri bekleyebiliriz.

NVIDIA GPU Kıyaslaması

GPU İsmi	TU102	GA102	AD102
GPU Mimarisi	Turing	Ampere	Ada Lovelace
GPU Üretim Teknolojisi	TSMC 12nm NFF	Samsung 8nm	5nm
Grafik Sürece Kümeleri (GPC)	6	7	12
Doku Sürece Kümeleri (TPC)	36	42	72
Akış İşlemcileri (SM)	72	84	144
CUDA Çekirdeği	4608	10752	18432
Teorik TFLOP	16.1	37.6	~90 TFLOPs?
Bellek Tipi	GDDR6	GDDR6X	GDDR6X
Bellek Veriyolu	384-bit	384-bit	384-bit
Bellek Kapasitesi	11 GB (2080 Ti)	24 GB (3090)	24 GB (4090?)
Amiral Gemisi SKU	RTX 2080 Ti	RTX 3090	RTX 4090?
TGP	250W	350W	450-650W?
Çıkış Tarihi	Eylül 2018	Eylül 2020	2022?

Yeni NVIDIA ve AMD Ekran Kartlarından Neler Bekleniyor?

ItalioBrot

Global Mod