|簡體中文

比思論壇

 找回密碼
 按這成為會員
搜索



查看: 445|回復: 0
打印 上一主題 下一主題

撥亂反正的 SUPER !! NVIDIA GeForce RTX 4070 SUPER FE 實測

[複製鏈接]

1990

主題

1

好友

348

積分

中學生

Rank: 3Rank: 3

  • TA的每日心情
    慵懶
    2024-9-15 03:09
  • 簽到天數: 2 天

    [LV.1]初來乍到

    推廣值
    0
    貢獻值
    0
    金錢
    759
    威望
    348
    主題
    1990
    跳轉到指定樓層
    樓主
    發表於 2024-9-16 02:31:41 |只看該作者 |倒序瀏覽
    只能說老黃刀法去得太盡,RTX 40 中高階型號吸引力明顯不足,市場缺乏買氣,迫使 NVIDIA 祭出 RTX 40 SUPER 救市,首張登場是 GeForce RTX 4070 SUPER 顯示卡,升級至 AD104-350 繪圖核心,增至 7,168 個 CUDA Cores、56 個 RT Cores 及 224 個 Tensor Cores,規格明顯提升更重要是售價卻不變,MSRP 維持在 US$599。HKEPC 找來 NVIDIA GeForce RTX 4070 SUPER FE 新卡與 RTX 4070 / RTX 4070 Ti 進行對比測試。




    RTX 40 SUPER 第一炮 : 4070 SUPER



    NVIDIA 16 日正式發布全新中階 GeForce RTX 4070 SUPER 顯示卡,這是 RTX 40 SUPER 系列的第一炮,CUDA Core 數目相較 RTX 4070 提升 20% 但增量不加價,MSRP 售價保持在 US$599,緊接下來還會有 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 型號登場。你沒看錯將會有 Ti SUPER 出現,很多人以為 SUPER 的型號定位在 Ti 之下,實際上 NVIDIA 官方是把 SUPER 定義作半代更新,RTX 40 SUPER 是一個系列不是型號。




    有人說老黃的刀法越來越離譜,或許是 AMD 與 Intel 都太弱了令 NVIDIA 無所顧忌,但數據卻是騙不了人,對比 RTX 20、RTX 30 與 RTX 40 世代的晶片規格,中高階型號的晶片規格與 Full Chip 的差異越來越大,舉例 RTX 2070 是 TU102 Full Chip 規模的 50%,RTX 3070 是 GA102 Full Chip 規模的 54.76%,沒想到 RTX 4070 竟然只有 AD102 Full Chip 規模的 31.94%,晶片規模甚至低於舊代主流卡 RTX 2060 (41.67%) 及 RTX 3060 (33.33%) 、相當可憐。




    過去 NVIDIA 70 新卡都能以下犯上力克 80 舊卡甚至更高型號,但 RTX 4070 卻完全沒有這個能力,性能的提升更多來自 DLSS 3 技術的加持,主要原因是舊代庫存太多,RTX 40 規格也留手讓 AIC 有機會清貨 。根據 NVIDIA 官方數據,當啟用 DLSS 3 的 Frame Gen 後,GeForce RTX 4070 在 2K 解析度下平均較 GeForce RTX 3080 快 40%,沒有 DLSS 3 就只能和 GeForce RTX 3080 打成平手,因此 GeForce RTX 4070 在遊戲市場要取得銷售成功,很大程度視乎 NVIDIA DLSS 3 技術的普及程度,

    礦難後大量二手卡湧現、舊代 RTX 30 庫存減價,加上全球經濟低迷,市場明顯對 RTX 40 中高階型號興趣缺缺,以往是 RTX 20 / 30 的中高階型號性價比吸引,旗艦級型號是追求極致性能的金主們,但 RTX 40 卻是中高階型號性價比不足,反令 RTX 4090 性價比顯得更出色,就算 US$1,599 甚至炒價也是大賣,所有玩家們並非沒錢只是找不到升級的理由。



    撥亂反正的 RTX 40 SUPER



    對於 NVIDIA 來說 RTX 40 SUPER 是一個大升級,但筆者認為用「撥亂反正」來形容會更貼切,NVIDIA 將會推出三款全新 RTX 40 SUPER 型號,包括 GeForce RTX 4070 SUPER、GeForce RTX 4070 TI SUPER 及 GeForce RTX 4080 SUPER,其中 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 會取代舊型號,RTX 4070 Ti 及 RTX 4080 將完全停產,RTX 4080 SUPER 的 MSRP 定價會降至 US$999,當年 RTX 4080 只有 9,728 CUDA + 256-bit 16GB 敢賣 US$1,199,真是哪來的勇氣啊,玩家們都說:「畀多少少錢,買 RTX 4090 好過啦」。




    GeForce RTX 4070 SUPER 是三張 SUPER 之中進步最大的一張,CUDA Core 相較 RTX 4070 增加了 20%,回到 AD102 Full Chip 規格的 38.89%,MSPR 定價 US$599 取代 RTX 4070 沿有定位,但 GeForce RTX 4070 並不會停產,而是向下調至 US$499 美元,整個佈局令 NVIDIA RTX 40 產品線回復吸引力,令人期待。



    NVIDIA AD104-350 繪圖核心

    與 RTX 4070 / RTX 4070 Ti 一樣,GeForce RTX 4070 SUPER 同樣採用 AD104 繪圖核心,基於 NVIDIA Ada Lovelace GPU 微架構,性能提升主要來自 FP32 運算單元數目及時脈倍增,更大的 L2 Cache 容量及全新著色器執行排序技術,升級第 3 代 RT Cores、升級第 4 代 Tensor Cores,與上代比較 Ampere GPU 微架構比較,傳統光柵圖形運算提高了 2 倍,同時在光線追蹤性能上提升近 4 倍。

    採用 TSMC 4N NVIDIA Custom 制程,擁有 358 億個電晶體、 Die Size 294.5mm² 與上代 GeForce RTX 3060 的 GA106-300 Die Size 276mm² 相約,完整的 AD104 晶片內建 5 個 GPC 單元、 30 個 TPC 紋理處理群集及 60 個 SM 串流多處理器,具備 7,680 個 CUDA Cores、60 個 RT Cores 及 240 個 Tensor Cores。


    ▲ NVIDIA AD104-350 Block Diagram


    GeForce RTX 4070 SUPER 採用 AD104-350 繪圖核心,規模相較 RTX 4070 大幅增加,回復至 5 個 GPC 單元、增至 28 個 TPC 紋理處理群集及 56 個 SM 串流多處理器,具備 7,168 個 CUDA Cores、56 個 RT Cores、224 個 Tensor Cores、224 個 Texture Unit 及 80 個 ROP。

    核心時脈方面,NVIDIA GeForce RTX 4070 SUPER FE 預設時脈 1,980MHz、Boost 時脈為 2,475MHz,最高 TDP 為 220W 相較 RTX 4070 高了 20W。


    ▲ NVIDIA AD104 繪圖核心


    記憶體方面,NVIDIA GeForce RTX 4070 與 RTX 4070 SUPER 一樣維持 192-bit 記憶體介面,搭配 21Gbps GDDR6X 記憶體顆粒,最高記憶體頻寬為 504GB/s,但 RTX 4070 SUPER 的 L2 Cache 容量由 36MB 提至 48MB,有助提升遊戲 Workload 資料命中率,降低讀取延遲達並減少 GDDR6X 記憶體頻寬使用,記憶體子系統性能將會相較 RTX 4070 有明顯改善。


    NVIDIA GeForce RTX 4070 Family Full Specifications
    Graphics CardGeForce
    RTX 4070
    Founders Edition
    GeForce
    RTX 4070 SUPER
    Founders Edition
    GeForce
    RTX 4070 Ti
    Founders Edition
    GPU SKU
    AD104-250AD104-350AD104-400
    GPU Architecture
    NVIDIA
    Ada Lovelace
    NVIDIA
    Ada Lovelace
    NVIDIA
    Ada Lovelace
    GPCs
    455
    TPCs
    232830
    SMs
    465660
    CUDA Cores / SM
    128128128
    CUDA Cores / GPU
    588871687680
    Tensor Cores / SM
    4 (4th Gen)4 (4th Gen)4 (4th Gen)
    Tensor Cores / GPU
    184 (4th Gen)224 (4th Gen)240 (4th Gen)
    RT Cores
    46 (3rd Gen)56 (3rd Gen)60 (3rd Gen)
    Frame Buffer Memory Size and Type
    12GB GDDR6X12GB GDDR6X12GB GDDR6X
    Memory Interface
    192-bit192-bit192-bit
    Memory Clock (Data Rate)
    21 Gbps21 Gbps21 Gbps
    Memory Bandwidth
    504 GB/sec504 GB/sec504 GB/sec
    ROPs
    648080
    L1 Data Cache/SharedMemory
    5888 KB7168 KB7680 KB
    L2 Cache
    36864 KB49152 KB49152 KB
    Video Engines
    1x NVENC (Gen 8)
    1x NVDEC (Gen 5)
    1x NVENC (Gen 8)
    1x NVDEC (Gen 5)
    2x NVENC (Gen 8)
    1x NVDEC (Gen 5)
    TGP Power
    200W220W285W
    Transistor Count
    35.8 Billion35.8 Billion35.8 Billion
    Die Size
    294.5mm²294.5mm²294.5mm²
    Manufacturing Process
    TSMC 4NTSMC 4NTSMC 4N
    PCIe Interface
    Gen4 x16Gen4 x16Gen4 x16




    您需要登錄後才可以回帖 登錄 | 按這成為會員

    重要聲明:本論壇是以即時上載留言的方式運作,比思論壇對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,讀者及用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,讀者及用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本論壇受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者及用戶發現有留言出現問題,請聯絡我們比思論壇有權刪除任何留言及拒絕任何人士上載留言 (刪除前或不會作事先警告及通知 ),同時亦有不刪除留言的權利,如有任何爭議,管理員擁有最終的詮釋權。用戶切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。

    手機版| 廣告聯繫

    GMT+8, 2024-11-22 00:36 , Processed in 0.012875 second(s), 16 queries , Gzip On, Memcache On.

    Powered by Discuz! X2.5

    © 2001-2012 Comsenz Inc.

    回頂部