比思論壇

標題: 撥亂反正的 SUPER !! NVIDIA GeForce RTX 4070 SUPER FE 實測 [打印本頁]

作者: pebblecough    時間: 2024-9-16 02:31
標題: 撥亂反正的 SUPER !! NVIDIA GeForce RTX 4070 SUPER FE 實測
只能說老黃刀法去得太盡,RTX 40 中高階型號吸引力明顯不足,市場缺乏買氣,迫使 NVIDIA 祭出 RTX 40 SUPER 救市,首張登場是 GeForce RTX 4070 SUPER 顯示卡,升級至 AD104-350 繪圖核心,增至 7,168 個 CUDA Cores、56 個 RT Cores 及 224 個 Tensor Cores,規格明顯提升更重要是售價卻不變,MSRP 維持在 US$599。HKEPC 找來 NVIDIA GeForce RTX 4070 SUPER FE 新卡與 RTX 4070 / RTX 4070 Ti 進行對比測試。




RTX 40 SUPER 第一炮 : 4070 SUPER



NVIDIA 16 日正式發布全新中階 GeForce RTX 4070 SUPER 顯示卡,這是 RTX 40 SUPER 系列的第一炮,CUDA Core 數目相較 RTX 4070 提升 20% 但增量不加價,MSRP 售價保持在 US$599,緊接下來還會有 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 型號登場。你沒看錯將會有 Ti SUPER 出現,很多人以為 SUPER 的型號定位在 Ti 之下,實際上 NVIDIA 官方是把 SUPER 定義作半代更新,RTX 40 SUPER 是一個系列不是型號。




有人說老黃的刀法越來越離譜,或許是 AMD 與 Intel 都太弱了令 NVIDIA 無所顧忌,但數據卻是騙不了人,對比 RTX 20、RTX 30 與 RTX 40 世代的晶片規格,中高階型號的晶片規格與 Full Chip 的差異越來越大,舉例 RTX 2070 是 TU102 Full Chip 規模的 50%,RTX 3070 是 GA102 Full Chip 規模的 54.76%,沒想到 RTX 4070 竟然只有 AD102 Full Chip 規模的 31.94%,晶片規模甚至低於舊代主流卡 RTX 2060 (41.67%) 及 RTX 3060 (33.33%) 、相當可憐。




過去 NVIDIA 70 新卡都能以下犯上力克 80 舊卡甚至更高型號,但 RTX 4070 卻完全沒有這個能力,性能的提升更多來自 DLSS 3 技術的加持,主要原因是舊代庫存太多,RTX 40 規格也留手讓 AIC 有機會清貨 。根據 NVIDIA 官方數據,當啟用 DLSS 3 的 Frame Gen 後,GeForce RTX 4070 在 2K 解析度下平均較 GeForce RTX 3080 快 40%,沒有 DLSS 3 就只能和 GeForce RTX 3080 打成平手,因此 GeForce RTX 4070 在遊戲市場要取得銷售成功,很大程度視乎 NVIDIA DLSS 3 技術的普及程度,

礦難後大量二手卡湧現、舊代 RTX 30 庫存減價,加上全球經濟低迷,市場明顯對 RTX 40 中高階型號興趣缺缺,以往是 RTX 20 / 30 的中高階型號性價比吸引,旗艦級型號是追求極致性能的金主們,但 RTX 40 卻是中高階型號性價比不足,反令 RTX 4090 性價比顯得更出色,就算 US$1,599 甚至炒價也是大賣,所有玩家們並非沒錢只是找不到升級的理由。



撥亂反正的 RTX 40 SUPER



對於 NVIDIA 來說 RTX 40 SUPER 是一個大升級,但筆者認為用「撥亂反正」來形容會更貼切,NVIDIA 將會推出三款全新 RTX 40 SUPER 型號,包括 GeForce RTX 4070 SUPER、GeForce RTX 4070 TI SUPER 及 GeForce RTX 4080 SUPER,其中 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 會取代舊型號,RTX 4070 Ti 及 RTX 4080 將完全停產,RTX 4080 SUPER 的 MSRP 定價會降至 US$999,當年 RTX 4080 只有 9,728 CUDA + 256-bit 16GB 敢賣 US$1,199,真是哪來的勇氣啊,玩家們都說:「畀多少少錢,買 RTX 4090 好過啦」。




GeForce RTX 4070 SUPER 是三張 SUPER 之中進步最大的一張,CUDA Core 相較 RTX 4070 增加了 20%,回到 AD102 Full Chip 規格的 38.89%,MSPR 定價 US$599 取代 RTX 4070 沿有定位,但 GeForce RTX 4070 並不會停產,而是向下調至 US$499 美元,整個佈局令 NVIDIA RTX 40 產品線回復吸引力,令人期待。



NVIDIA AD104-350 繪圖核心

與 RTX 4070 / RTX 4070 Ti 一樣,GeForce RTX 4070 SUPER 同樣採用 AD104 繪圖核心,基於 NVIDIA Ada Lovelace GPU 微架構,性能提升主要來自 FP32 運算單元數目及時脈倍增,更大的 L2 Cache 容量及全新著色器執行排序技術,升級第 3 代 RT Cores、升級第 4 代 Tensor Cores,與上代比較 Ampere GPU 微架構比較,傳統光柵圖形運算提高了 2 倍,同時在光線追蹤性能上提升近 4 倍。

採用 TSMC 4N NVIDIA Custom 制程,擁有 358 億個電晶體、 Die Size 294.5mm² 與上代 GeForce RTX 3060 的 GA106-300 Die Size 276mm² 相約,完整的 AD104 晶片內建 5 個 GPC 單元、 30 個 TPC 紋理處理群集及 60 個 SM 串流多處理器,具備 7,680 個 CUDA Cores、60 個 RT Cores 及 240 個 Tensor Cores。


▲ NVIDIA AD104-350 Block Diagram


GeForce RTX 4070 SUPER 採用 AD104-350 繪圖核心,規模相較 RTX 4070 大幅增加,回復至 5 個 GPC 單元、增至 28 個 TPC 紋理處理群集及 56 個 SM 串流多處理器,具備 7,168 個 CUDA Cores、56 個 RT Cores、224 個 Tensor Cores、224 個 Texture Unit 及 80 個 ROP。

核心時脈方面,NVIDIA GeForce RTX 4070 SUPER FE 預設時脈 1,980MHz、Boost 時脈為 2,475MHz,最高 TDP 為 220W 相較 RTX 4070 高了 20W。


▲ NVIDIA AD104 繪圖核心


記憶體方面,NVIDIA GeForce RTX 4070 與 RTX 4070 SUPER 一樣維持 192-bit 記憶體介面,搭配 21Gbps GDDR6X 記憶體顆粒,最高記憶體頻寬為 504GB/s,但 RTX 4070 SUPER 的 L2 Cache 容量由 36MB 提至 48MB,有助提升遊戲 Workload 資料命中率,降低讀取延遲達並減少 GDDR6X 記憶體頻寬使用,記憶體子系統性能將會相較 RTX 4070 有明顯改善。


NVIDIA GeForce RTX 4070 Family Full Specifications
Graphics CardGeForce
RTX 4070
Founders Edition
GeForce
RTX 4070 SUPER
Founders Edition
GeForce
RTX 4070 Ti
Founders Edition
GPU SKU
AD104-250AD104-350AD104-400
GPU Architecture
NVIDIA
Ada Lovelace
NVIDIA
Ada Lovelace
NVIDIA
Ada Lovelace
GPCs
455
TPCs
232830
SMs
465660
CUDA Cores / SM
128128128
CUDA Cores / GPU
588871687680
Tensor Cores / SM
4 (4th Gen)4 (4th Gen)4 (4th Gen)
Tensor Cores / GPU
184 (4th Gen)224 (4th Gen)240 (4th Gen)
RT Cores
46 (3rd Gen)56 (3rd Gen)60 (3rd Gen)
Frame Buffer Memory Size and Type
12GB GDDR6X12GB GDDR6X12GB GDDR6X
Memory Interface
192-bit192-bit192-bit
Memory Clock (Data Rate)
21 Gbps21 Gbps21 Gbps
Memory Bandwidth
504 GB/sec504 GB/sec504 GB/sec
ROPs
648080
L1 Data Cache/SharedMemory
5888 KB7168 KB7680 KB
L2 Cache
36864 KB49152 KB49152 KB
Video Engines
1x NVENC (Gen 8)
1x NVDEC (Gen 5)
1x NVENC (Gen 8)
1x NVDEC (Gen 5)
2x NVENC (Gen 8)
1x NVDEC (Gen 5)
TGP Power
200W220W285W
Transistor Count
35.8 Billion35.8 Billion35.8 Billion
Die Size
294.5mm²294.5mm²294.5mm²
Manufacturing Process
TSMC 4NTSMC 4NTSMC 4N
PCIe Interface
Gen4 x16Gen4 x16Gen4 x16









歡迎光臨 比思論壇 (http://108.170.5.74/) Powered by Discuz! X2.5