Yeni RDNA 3 mimarili Radeon RX 7900 XT ve Ada Lovelace takviyeli GeForce RTX 4090 ekran kartlarıyla ilgili yeni ayrıntılar gelmeye devam ediyor. Bu GPU’ların büyük performans iyileştirmeleri getirmesi bekleniyor ve beraberinde şimdiye kadar üretilmiş en epeyce güç tüketen çipler olacak.
NVIDIA Ada Lovelace mimarisiyle monolitik bir yaklaşımı hedeflerken, AMD’nin CDNA 2 mimarisinde olduğu üzere epeyce yongalı bir tasarım (MCM) kullanımı bekleniyor. AMD, artık tüketici ve oyun GPU’ları için birebir MCM teknolojisini kullanacak.
AMD Radeon RX 7900 XT: RDNA 3 Mimarisi ve Navi 21
Amiral gemisi RDNA 3 yongası olan AMD Navi 31 GPU, yeni kuşak Radeon RX 7900 XT grafik kartına güç sağlayacak. AMD’nin yeni kuşak RDNA 3 yongalarında CU (Bilgi Süreç Birimi) yerine WGP’ler (Çalışma Kümesi İşlemcileri) kullanılacak. Ekran kartının TSMC’nin 5nm sürecine dayalı bir GCD (Graphics Core Die) ve TSMC 6nm sürecine dayalı bir MCD (Multi-Cache Die) olmak üzere iki temel IP’ye sahip olacağı söyleniyor.
Görünen Navi 31 GPU yapılandırmasında iki GCD (Graphics Core Die) ve tek bir MCD (Multi-Cache Die) bulunuyor. Her GCD’de 3 Shader Motoru (toplam 6) ve her Shader Motorunda 2 Shader Dizisi (SE başına 2 / GCD başına 6 / toplamda 12) yer alıyor.
Ayrıyeten Her Shader Dizisi 5 WGP’den (SE başına 10 / GCD başına 30 / toplamda 60) oluşuyor ve her WGP, 32 ALU’ya sahip 8 SIMD32 ünitesine (SA başına 40 SIMD32 / SE başına 80 / GCD başına 240 / toplamda 480) sahip. Bu SIMD32 üniteleri, GCD başına 7.680 çekirdek ve toplamda 15.360 çekirdek oluşturmak üzere bir ortaya geliyor.
Navi 31 MCD, yeni kuşak Infinity Fabric orta irtibatı aracılığıyla ikili GCD’lere bağlanacak ve 256-512 MB kapasitede Infinity Cache önbellek taşıyacak. Her GPU ayrıyeten 4 bellek temasına (32 bit) sahip olmalı. Bu da 256 bit bilgi yolu arabirimi için toplam 8 32 bit bellek denetimcisi olacağı manasına gelmekte.
Yakın vakitte ortaya çıkan bir öteki söylenti, AMD’nin RDNA 3 ailesinde üç boyutlu Infinity Cache bellek teknolojisini kullanacağını ortaya koydu. Tıpkı Milan-X yongalarının L3 önbelleğinde olduğu üzere, GPU’da bulunan mevcut önbelleğe ek olarak dikey olarak istiflenmiş ek bir önbellek ünitesi yer alacak.
AMD RDNA GPU Karşılaştırması
NVIDIA GeForce RTX 4090: Ada Lovelace Mimarisi ve AD102 GPU
Mevcut bilgilere göre NVIDIA’nın Ada Lovelace GPU’ları için TSMC’nin N5 (5nm) üretim teknolojisi kullanılacak. AMD’nin bilakis, yeşil kadro yeni ekran kartlarında monolitik bir tasarım benimseyecek. Amiral gemisi RTX 4090 modelinde AD102 GPU’nun yer alacağını ekleyelim.
AD102 GPU’nun 2.5 GHz (2.3 GHz ortalama artış) kadar yüksek bir saat suratına sahip olduğu söyleniyor. NVIDIA AD102, 144 SM ünitesi ortasında yer alan (değişebilen) ön özelliklere göre 18432 CUDA Çekirdeğine sahip görünüyor. Bu da Turing mimarisine kıyasla çekirdek sayısında neredeyse iki katlık bir artış demek. 2.3-2.5 GHz saat suratı bize 85 ila 92 TFLOP’a kadar süreç performansı (FP32) veriyor. Bu 36 TFLOP FP32 hesaplama gücü içeren mevcut RTX 3090’ın FP32 performansının iki katından fazla.
%150 performans artışı hayli büyük görünüyor lakin NVIDIA’nın Ampere ile bu jenerasyon FP32 kıymetlerinde esasen büyük bir sıçrama yaptığını unutmamak gerekiyor. Ampere GA102 GPU (RTX 3090) 36 TFLOP sunarken Turing TU102 GPU (RTX 2080 Ti) 13 TFLOP ham güç sunacak. Yani FP bedelleri açısından %150’nin üzerinde bir artış yaşandı. Lakin RTX 3090, gerçek dünya oyun performansı açısından RTX 2080 Ti’iye göre %50-60 civarında daha kuvvetliydü.
Bunun yanı sıra NVIDIA GeForce RTX 40 amiral gemisinin RTX 3090’a benzeri bir 384-bit bilgi yolu arayüzüne sahip olacağı da gelen bilgiler içinde. Yenik artlar bir daha GDDR6X belleklerden yararlanacak, fakat mevcut modellere kıyasla daha yüksek bant genişliği nazaranceğiz. RTX 4090 24 GB belleğe sahip olacak, bu niçinle tek taraflı 16 GB DRAM yahut çift taraflı 8 GB DRAM modülleri bekleyebiliriz.
NVIDIA GPU Kıyaslaması
NVIDIA Ada Lovelace mimarisiyle monolitik bir yaklaşımı hedeflerken, AMD’nin CDNA 2 mimarisinde olduğu üzere epeyce yongalı bir tasarım (MCM) kullanımı bekleniyor. AMD, artık tüketici ve oyun GPU’ları için birebir MCM teknolojisini kullanacak.
AMD Radeon RX 7900 XT: RDNA 3 Mimarisi ve Navi 21
Amiral gemisi RDNA 3 yongası olan AMD Navi 31 GPU, yeni kuşak Radeon RX 7900 XT grafik kartına güç sağlayacak. AMD’nin yeni kuşak RDNA 3 yongalarında CU (Bilgi Süreç Birimi) yerine WGP’ler (Çalışma Kümesi İşlemcileri) kullanılacak. Ekran kartının TSMC’nin 5nm sürecine dayalı bir GCD (Graphics Core Die) ve TSMC 6nm sürecine dayalı bir MCD (Multi-Cache Die) olmak üzere iki temel IP’ye sahip olacağı söyleniyor.
Görünen Navi 31 GPU yapılandırmasında iki GCD (Graphics Core Die) ve tek bir MCD (Multi-Cache Die) bulunuyor. Her GCD’de 3 Shader Motoru (toplam 6) ve her Shader Motorunda 2 Shader Dizisi (SE başına 2 / GCD başına 6 / toplamda 12) yer alıyor.
Ayrıyeten Her Shader Dizisi 5 WGP’den (SE başına 10 / GCD başına 30 / toplamda 60) oluşuyor ve her WGP, 32 ALU’ya sahip 8 SIMD32 ünitesine (SA başına 40 SIMD32 / SE başına 80 / GCD başına 240 / toplamda 480) sahip. Bu SIMD32 üniteleri, GCD başına 7.680 çekirdek ve toplamda 15.360 çekirdek oluşturmak üzere bir ortaya geliyor.
Navi 31 MCD, yeni kuşak Infinity Fabric orta irtibatı aracılığıyla ikili GCD’lere bağlanacak ve 256-512 MB kapasitede Infinity Cache önbellek taşıyacak. Her GPU ayrıyeten 4 bellek temasına (32 bit) sahip olmalı. Bu da 256 bit bilgi yolu arabirimi için toplam 8 32 bit bellek denetimcisi olacağı manasına gelmekte.
Yakın vakitte ortaya çıkan bir öteki söylenti, AMD’nin RDNA 3 ailesinde üç boyutlu Infinity Cache bellek teknolojisini kullanacağını ortaya koydu. Tıpkı Milan-X yongalarının L3 önbelleğinde olduğu üzere, GPU’da bulunan mevcut önbelleğe ek olarak dikey olarak istiflenmiş ek bir önbellek ünitesi yer alacak.
AMD RDNA GPU Karşılaştırması
GPU İsmi | Navi 10 | Navi 21 | Navi 31 |
---|---|---|---|
GPU Üretim Teknolojisi | 7nm | 7nm | 5nm (6nm?) |
GPU Paketlemesi | Monolitik | Monolitik | MCD (Multi-Chiplet Die) |
Shader Motorları | 2 | 4 | 6 |
GPU WGP | 20 | 40 | 30 (Per MCD) 60 (In Total) |
WGP başına SP | 128 | 128 | 256 |
Hesaplama Ünitesi | 40 | 80 | 120 (MCD başına) 240 (toplam) |
Çekirdek (Kalıp Başına) | 2560 | 5120 | 7680 |
Çekirdek (Toplam) | 2560 | 5120 | 15360 (2 x MCD) |
Bellek Veriyolu | 256-bit | 256-bit | 256-bit |
Bellek Tipi | GDDR6 | GDDR6 | GDDR6 |
Bellek Kapasitesi | 8 GB | 16 GB | 32 GB |
Infinity Cache | – | 128 MB | 256-512 MB |
Amiral Gemisi SKU | Radeon RX 5700 XT | Radeon RX 6900 XTX | Radeon RX 7900 XT |
TBP | 225W | 330W | 350-550W |
Çıkış Tarihi | 2019 3. Çeyrek | 2020 4. Çeyrek | 2022 4. Çeyrek |
NVIDIA GeForce RTX 4090: Ada Lovelace Mimarisi ve AD102 GPU
Mevcut bilgilere göre NVIDIA’nın Ada Lovelace GPU’ları için TSMC’nin N5 (5nm) üretim teknolojisi kullanılacak. AMD’nin bilakis, yeşil kadro yeni ekran kartlarında monolitik bir tasarım benimseyecek. Amiral gemisi RTX 4090 modelinde AD102 GPU’nun yer alacağını ekleyelim.
AD102 GPU’nun 2.5 GHz (2.3 GHz ortalama artış) kadar yüksek bir saat suratına sahip olduğu söyleniyor. NVIDIA AD102, 144 SM ünitesi ortasında yer alan (değişebilen) ön özelliklere göre 18432 CUDA Çekirdeğine sahip görünüyor. Bu da Turing mimarisine kıyasla çekirdek sayısında neredeyse iki katlık bir artış demek. 2.3-2.5 GHz saat suratı bize 85 ila 92 TFLOP’a kadar süreç performansı (FP32) veriyor. Bu 36 TFLOP FP32 hesaplama gücü içeren mevcut RTX 3090’ın FP32 performansının iki katından fazla.
%150 performans artışı hayli büyük görünüyor lakin NVIDIA’nın Ampere ile bu jenerasyon FP32 kıymetlerinde esasen büyük bir sıçrama yaptığını unutmamak gerekiyor. Ampere GA102 GPU (RTX 3090) 36 TFLOP sunarken Turing TU102 GPU (RTX 2080 Ti) 13 TFLOP ham güç sunacak. Yani FP bedelleri açısından %150’nin üzerinde bir artış yaşandı. Lakin RTX 3090, gerçek dünya oyun performansı açısından RTX 2080 Ti’iye göre %50-60 civarında daha kuvvetliydü.
Bunun yanı sıra NVIDIA GeForce RTX 40 amiral gemisinin RTX 3090’a benzeri bir 384-bit bilgi yolu arayüzüne sahip olacağı da gelen bilgiler içinde. Yenik artlar bir daha GDDR6X belleklerden yararlanacak, fakat mevcut modellere kıyasla daha yüksek bant genişliği nazaranceğiz. RTX 4090 24 GB belleğe sahip olacak, bu niçinle tek taraflı 16 GB DRAM yahut çift taraflı 8 GB DRAM modülleri bekleyebiliriz.
NVIDIA GPU Kıyaslaması
GPU İsmi | TU102 | GA102 | AD102 |
---|---|---|---|
GPU Mimarisi | Turing | Ampere | Ada Lovelace |
GPU Üretim Teknolojisi | TSMC 12nm NFF | Samsung 8nm | 5nm |
Grafik Sürece Kümeleri (GPC) | 6 | 7 | 12 |
Doku Sürece Kümeleri (TPC) | 36 | 42 | 72 |
Akış İşlemcileri (SM) | 72 | 84 | 144 |
CUDA Çekirdeği | 4608 | 10752 | 18432 |
Teorik TFLOP | 16.1 | 37.6 | ~90 TFLOPs? |
Bellek Tipi | GDDR6 | GDDR6X | GDDR6X |
Bellek Veriyolu | 384-bit | 384-bit | 384-bit |
Bellek Kapasitesi | 11 GB (2080 Ti) | 24 GB (3090) | 24 GB (4090?) |
Amiral Gemisi SKU | RTX 2080 Ti | RTX 3090 | RTX 4090? |
TGP | 250W | 350W | 450-650W? |
Çıkış Tarihi | Eylül 2018 | Eylül 2020 | 2022? |