NVIDIA GeForce RTX 4090 İncelemesi
GeForce RTX 4000 serisi ekran kartlarının en üst modeli olan RTX 4090 ofisimizde. Kartı kapsamlıca inceliyoruz.
İlk bilgisayar programcısı olarak kabul edilen Ada Lovelace’ın adını taşıyan GeForce “Ada” grafik mimarisi, CUDA çekirdeklerinden RT çekirdeklerine, yapay zeka konusunda önemli bir faktör olan Tensor çekirdeklerinden gölgelendirici performansını artıran Shader Execution Reordering SIMD optimizasyonlarına kadar her alanda yenilikler getiriyor.
“Ada” CUDA çekirdekleri, Ampere mimarisi üzerinde çok büyük frekans ve IPC artışları sağlıyor. Yeni nesil GPU’ların NVIDIA’ya özel olarak optimize edilen TSMC 4nm üretim teknolojisinden faydalandığını biliyoruz. GeForce RTX 4090 ise bu nesil için geliştirilen en büyük GPU olan “AD102” silikonundan gücünü alıyor. AD102 silikonu aslında 18.432 CUDA çekirdeğinin kullanılmasına imkan tanıyor, ancak mevcut amiral gemisi 16.384 CUDA çekirdeğiyle çalışacak şekilde ayarlanmış.
CUDA çekirdeklerinin yanı sıra, 568 Tensor çekirdeğinden 512’si, 142 RT çekirdeğinden 128’i kullanılıyor. Kart ayrıca 512 TMU ve 192 ROP ile donatılmış. Tam yapılandırma ise muhtemelen GeForce RTX 4090 Ti için saklanıyor. Mevcuttaki en güçlü kart olan 4090, RTX 3090 Ti ile aynı şekilde 21 Gbps hızda çalışan, teorik olarak 1008 GB/sn bant genişliği sunan 24 GB GDDR6X belleklerden yararlanıyor.
NVIDIA, donanımsal ve rasterizasyon açısından nesiller arasında büyük performans artışları sağlamış. Tüm bunlara bir de devrimsel DLSS 3 teknolojisi dahil olduğunda işler apayrı bir noktaya geliyor. Yalnızca RTX 4000 serisine özel olan DLSS 3 teknolojisi, GPU’nun ana grafik işleme mekanizmasından hariç olarak yalnızca yapay zeka kullanarak yeni kareler üretebiliyor. Şirket bundan “sinirsel işleme (neural rendering)” olarak bahsediyor ve grafik dünyasına yeni tabir daha getiriyor. Bu gerçekten çok önemli bir atılım. NVIDIA, yeni teknolojisini rasterizasyon ve ışın izleme tekniklerinin yanında ayrı bir şekilde konumlandırıyor.
İncelememize konuk NVIDIA GeForce RTX 4090 Founders Edition, yeşil ekil ekibin referans tasarımını temsil ediyor. Yeni nesil kartların genel görünümü RTX 3000 serisiyle aynı kalmış, ancak RTX 4090 gerçekten heybetli ve çok büyük. RTX 4000 serisi PCI-Express Gen 4 bağlantı arabirimini kullanmaya devam ederken, güç mimarisi için PCIe Gen 5 standardına geçiş yapılmış. 12VHPWR adı verilen yeni 12+4 pin tasarımı, referans tasarım da dahil olmak üzere üretim ortakları tarafından geliştirilen RTX 4090 modellerinde standart haline geliyor.
Türkiye’de satışa sunulmayan RTX 4090 Founders Edition 1.599 dolarlık fiyatla satışa çıktı. GeForce RTX 3090 ise iki yıl öncesinde 100 dolarlık farkla, 1.499 dolar fiyatla çıkış yapmıştı. Bu arada, özel soğutmalı RTX 4090 modellerinin 1.999 dolara kadar uzandığını ve hatta bazı modellerin 2.000 dolar üzerine çıktığını belirtelim. Ülkemizde ise özel tasarımlar 40.000-50.000 lira civarında fiyatlarla satılıyor.
Yukarıdaki teknik özellikler tablosu aslında birçok şeyin göstergesi; transistör sayıları Ampere mimarisine kıyasla neredeyse üç katına çıktı, RTX 4090’daki çekirdek sayıları RTX 3090 Ti’den %52 daha yüksek, GPU saat hızları %35 daha fazla ve 12 kat daha fazla L2 önbellek mevcut. RTX 4090’ın potansiyelini teorik olarak rahatlıkla görebiliyoruz ve RTX 3090/3090 Ti’ye kıyasla önemli farklar var. Ancak GPU’nun içinde fark yaratan başka değişiklikler de var.
Eğer ekran kartlarını profesyonel amaçla kullanacaksanız, özellikle de derin öğrenme ve yapay zeka alanında iş yapıyorsanız, GeForce RTX 4000 serisi gerçekten parasının hakkını verecek bir ürün serisi. Ayrıca içerik üreten kişiler için de Ada mimarili kartlar ideal bir seçenek olabilir. Bu işten para kazananlar için zaman=para demek. RTX 4000 serisi kartlar da gerçekten önemli gelişmeler sunuyor.
Peki ya oyuncular? RTX 3090 ve 3090 Ti’nin aksine NVIDIA, RTX 4090’ın yalnızca profesyoneller için tasarlandığını söylemiyor. Evet, RTX 4090 profesyoneller için harika işler çıkaracak. Ancak bu kart aynı zamanda GeForce ailesinin bir parçası ve şirket oyun performansı konusunda sürekli grafik kıyaslamaları yapıyor. RTX 4090 ile yaptığımız testlerde gördüğünüz üzere, yeni amiral gemisi DLSS 3 devre dışı olsa bile gerçekten çok güçlü. DLSS 3 devreye girdiğinde ise işler zaten bambaşka bir hal alıyor.
Işın izleme bir kez daha büyük önem kazanıyor ve üç yeni teknoloji hayatımıza giriyor: Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) ve Displaced Micro-Meshes (DMM). Bu yeniliklerin tümüyle birlikte çeşitli iyileştirmeler sunuluyor, ancak geliştiricilerin yeni teknolojileri oyunlarına uygulaması gerekecek.
OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha iyi işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha hızlı Bounding Volume Hierarchy (BVH) oluşturma süresi sunarak geometrik olarak karmaşık sahnelerin gerçek zamanlı ışın takibini mümkün hale getiriyor.
Ada GPU içinde yer alan ışın izleme birimleri, Faster Ray-Triangle Intersection Throughput (Işın-Üçgen Kesişme Verimi) açısından iki kat daha gelişmiş ve bu da geliştiricilerin sanal dünyalarına daha fazla ayrıntı eklemelerini sağlıyor.
Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı nesneye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylelikle çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, önceden verimsiz olan bu iş yüklerini dinamik olarak yeniden düzenleyerek çok daha verimli hale getiriyor. SER, ışın izleme işlemleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare hızlarını %25’e kadar artırabiliyor.
Derin öğrenme ve yapay zeka iş yüklerine gelince, yine bu alanda büyük gelişmeler kaydedildiğini görüyoruz. Ada’nın dördüncü nesil Tensor çekirdekleri, ilk olarak Hopper H100 veri merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak verimi 5 kata kadar artırıyor ve 1.4 Tensor-petaFLOPS’luk güç ortaya çıkıyor.
Transformer Engine sayesinde FP16 yerine FP8 kullanabilen algoritmalar için Tensor çekirdeği başına hesaplama becerisi iki katına çıkıyor.
Önceki nesil Ampere ekran kartlarında AV1 kod çözme desteği sunulsa da AV1 kodlama desteği sunulmuyordu. Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama desteği sunan sekizinci nesil NVIDIA Encoder’a (NVENC) sahip olacak. Böylelikle yayıncılar ve video işiyle uğraşanlar için yeni olanaklar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıca 1080p’de yayın yapan kullanıcıların aynı bit hızı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.
Ada GPU’lar ayrıca çift NVENC kodlayıcı ile destekleniyor. Bu gelişim ise profesyonel video düzenleme için 8K/60 veya dört adet 4K/60 video kodlamasına olanak sağlıyor. DaVinci Resolve, Adobe Premiere Pro için popüler Voukoder eklentisi ve Çin’in en iyi video düzenleme uygulaması olan Jianying, AV1 desteğinin yanı sıra çift kodlama desteğiyle kullanıma sunulacak. NVIDIA ayrıca popüler efekt uygulaması Notch’a AV1 desteği getirmek ve Topaz yazılımına çift kodlama desteği sunmak için çalışıyor.
Grafik dünyasında 3D düzenleme yapmak zorlu bir deneyimdir. 3D içerik üreticileri, çalışma yaptığı sıralarda sürekli önizleme yapmak zorunda kalırlar. Ancak DLSS 3’ün performans kazanımları sayesinde sanatçılar, gerçek zamanlı render uygulamalarında akıcı ve sorunsuz şekilde içerik üretebilecekler.
DLSS 3 teknolojisi ilk etapta Unreal Engine, Unity ve Omniverse’e geliyor. 3D sanatçıları, daha önce hiç görülmemiş gerçekçilik seviyeleriyle gerçek zamanlı etkileşime olanak tanıyan materyaller, aydınlatma, nesneler, karakterler ve sahneler oluşturabilecekler. Sanatçılar sahnelerinde değişiklikler yaparken görüntü anında işlenecek ve hızlı geri bildirim alabilecekler.
Bildiğiniz gibi, birçok iş yükü için GPU bellek boyutu ve hızları çok önemli. GeForce RTX 4090, diğer iyileştirmelerin yanı sıra 21 Gbps hızında çalışan 24 GB GDDR6X belleğiyle içerik üreticilerin işlerini kolaylaştıracak. Çok sayıda malzeme ve doku kullanan, büyük veri kümeleriyle çalışan kişiler, yoğun GPU kullanımına ihtiyaç duyan iş akışlarını rahat yürütebilecek.
DLSS 3, kaliteyi bozmadan FPS oranlarında iki kat ve bazı durumlarda daha yüksek performans artışları getiriyor. Bu gerçekten oyun ve grafik dünyasında devrim yaratan bir teknoloji.
DLSS 2’nin tüm özelliklerine ek olarak, bu teknoloji grafik oluşturma işlem hattını dahil etmeden yalnızca yapay zeka kullanarak kareleri oluşturma yeteneğine sahip. DLSS 3 ile değişen her kare, önceki işlenmiş karenin bir kopyası olmaksızın yapay zeka ile üretilmekte.
DLSS 3, görüntü kalitesi ve yanıt verme özelliğini korurken performansı büyük ölçüde artıran yapay zeka destekli grafiklerde devrim niteliğinde bir atılım olarak tanımlanıyor. DLSS Frame Generation otomatik kodlayıcısı 4 temel veriyi ele alıyor: mevcut ve önceki oyun kareleri, Ada mimarisinin Optical Flow Accelerator’ı tarafından oluşturulan bir optik akış alanı, hareket vektörleri ve derinlik gibi oyun motoru verileri.
Optical Flow Accelerator, iki ardışık oyun içi kareyi analiz ediyor ve bir optik akış alanı hesaplaması yapıyor. Optik akış alanı, piksellerin kare 1’den kare 2’ye hareket ettiği yönü ve hızı yakalamakta. Optik Akış Hızlandırıcı, oyun motoru hareket vektörü hesaplamalarına dahil edilmeyen parçacıklar, yansımalar, gölgeler ve aydınlatma gibi piksel düzeyinde bilgileri yakalama yeteneğine sahip. Aşağıdaki motosiklet örneğinde, motosikletlinin hareket akışı gölgenin motosiklete göre ekranda kabaca aynı yerde kaldığını doğru bir şekilde temsil etmekte.
Optik Akış Hızlandırıcı, yansıma gibi piksel düzeyindeki efektleri doğru bir şekilde takip ederken, DLSS 3 ayrıca sahnedeki geometrinin hareketini tam olarak izlemek için oyun motoru hareket vektörlerini kullanıyor. Aşağıdaki örnekte oyun hareket vektörleri motosikletçinin yanından geçen yolun hareketini doğru bir şekilde izlediği (ancak gölgeleri değil) gösterilmiş. Yalnızca motor hareket vektörlerini kullanarak çerçeveler oluşturmak, gölgede pürüz gibi görsel anormalliklere neden olmakta.
DLSS Frame Generation yapay zeka ağı, her piksel için ara kareler oluşturmak üzere oyun hareket vektörlerinden, optik akış alanından ve sıralı oyun karelerinden gelen bilgilerin nasıl kullanılacağına karar veriyor. Bu ağ, hareketi izlemek için hem motor hareket vektörlerini hem de optik akışı kullanarak (aşağıdaki resimde görüldüğü gibi) hem geometriyi hem de efektleri doğru bir şekilde yeniden oluşturabiliyor.
Yapay zeka, DLSS 3 etkinleştirildiğinde ilk karenin dörtte üçünü ve DLSS Frame Generation kullanarak ikinci karenin tamamını yeniden yapılandırıyor. Biraz önce belirttiğimiz gibi, görüntülenen toplam piksellerin sekizde yedisi yeniden yapılandırılıyor ve performansa büyük katkı sağlanıyor.
NVIDIA’nın iddialarına bakılırsa belirli oyun ve motorlarda geleneksel işlemeye kıyasla dört kata kadar performans artışı sağlanabiliyor. Erken yaptığımız DLSS 3 testlerine aşağıdaki videomuzdan ulaşabilirsiniz. Yeni sürücüler, oyun güncellemeleri ve gelişmiş DLSS 3 desteği ile çok daha iyisini görebiliriz.
Eskiden içerik üretimi büyük stüdyolar tarafından yapılırken, artık bireysel geliştiriciler güçlü sistemleriyle birlikte üstün görseller sunan içerikler üretebiliyor. NVIDIA, bildiğiniz gibi Game Ready sürücüsünün yanı sıra Studio sürücüsüyle profesyonel kullanıcılar için yenilikler ve optimizasyonlar sağlıyor. İşte yeşil takımın sunduğu bazı ayrıcalıklar:
Canlı yayıncılar genellikle bant genişliğiyle ilgili sorunlar (örneğin Twitch veya Discord’un maksimum 8 Mbps bit hızı gibi) yaşar. Bu da yayıncıların sunduğu kaliteyi ve çözünürlüğü olumsuz etkilemekte. AV1 ile canlı yayınlar daha detaylı ve daha hatasız görünecek, artık daha yüksek çözünürlükte yayın yapabilecek. AV1 ayrıca HDR ve düşük gecikme yetenekleriyle gelişmiş kodlama özelliklerini de destekliyor.
NVIDIA, AV1 için sektördeki önde gelen şirketlerle birlikte çalıştığını söylüyor. Popüler uygulamalardan olan OBS Studio, 2022 Ekim ayında yayınlanan Beta sürümü ile NVENC ile AV1 desteği sunmaya başladı. Bunun yanında, oyuncuların her gün kullandığı Discord, 2022 sonlarında AV1 ile uçtan uca canlı yayın özelliği alıyor.
Adobe Premiere Pro ve Blackmagic Design DaVinci Resolve gibi video düzenleme uygulamaları, CUDA çekirdeklerinin yanı sıra yapay zeka destekli Tensor çekirdekleriyle birlikte GPU gücünden yararlanıyor. Renk düzeltme, video kare boyutu dönüştürme, bulanıklaştırma, keskinleştirme, görüntü işleme efektleri ve RAW dosya dönüştürme gibi temel işlevlerin tümü, gelişmiş GPU teknolojileri sayesinde her zamankinden daha kısa sürede tamamlanıyor.
RTX 4090, AI Magic Mask kullanımında RTX 3090 Ti’ye kıyasla 1.7 kat daha hızlı:
RTX 4000 serisinde bulunan çift kodlayıcı, yeni algoritma ve mimari performans iyileştirmeleri ile birlikte HEVC/AV1 kodlamasında RTX 3000 serisine göre 2 kata kadar daha iyi performans sağlıyor:
ON1 Resize AI 2022, daha yüksek çözünürlüklü çıktılar oluşturmak için GPU hızlandırmalı AI işlevselliğini kullanıyor. Böylelikle görüntü ayrıntılarından ödün vermeden düşük çözünürlüklü görüntülerden yüksek çözünürlüklü görüntü çıktıları almamıza imkan veriyor. RTX 4090, ON1 Resize AI 2022’d yapay zeka hızlandırmalı görüntü boyutlandırma senaryosunda RTX 3090 Ti’ye kıyasla 1.6 kata kadar daha hızlı.
Işın izleme destekli işleme, animatörlerin filmlerdeki görsel efektler ve oyunlardaki animasyonlu karakterler gibi fotogerçekçi dijital varlıklar tasarlamasına olanak tanıyor. Bu teknoloji yıllardır Hollywood’da standart olarak kullanılıyor ancak yüksek güçlü sunucular ve iş istasyonları gerektiriyor. RTX 4000 serisi ise bu işi son tüketici bazında başka bir noktaya taşıyor.
Yeni amiral gemisi, ışın izlemeli işleme konusunda en güçlü GPU oldu. Bu kart Blender Cycles, Chaos VRay ve Luxion Keyshot gibi video işleme uygulamalarında önceki nesil RTX 3090 Ti’ye kıyasla 1.9 kata kadar daha hızlı kare işleme performansı sunuyor. DLSS 3 ve gölgelendirici yürütme yeniden sıralama özelliğiyle birleştirildiğinde ise gerçek zamanlı render uygulamalarında 4 kata kadar daha hızlı render performansı elde etmek mümkün.
AD102 GPU, DLSS 3 Frame Generation ile desteklendiğinde ve Ultra Performans moduna oyunlarda 8K HDR oyun deneyimine hazır. Ayrıca RTX 4090’da bulunan çift kodlayıcılar sayesinde GeForce Experience üzerinden 8K video oyun çekimi yapabiliyoruz.
NVIDIA, 8K çözünürlüğe giden yolda DLSS 3 faktörünün çok önemli olduğunu vurguluyor. İşte şirket tarafından paylaşılan bir test çizelgesi:
KAYNAK: Technopat
Yorum gönder