圖源:英偉達(dá)

英偉達(dá)率先發(fā)布了相對(duì)經(jīng)濟(jì)型的顯卡,售價(jià)549美元的RTX 5070 GPU。據(jù)英偉達(dá)稱(chēng),它將通過(guò)多種方式利用人工智能,以三分之一的價(jià)格提供RTX 4090的性能,還能讓筆記本電腦實(shí)現(xiàn)更高的性能水平,移動(dòng)版RTX 5070的功耗僅為RTX 4090的一半。

此次發(fā)布的50系列其余產(chǎn)品陣容包括:旗艦產(chǎn)品RTX 5090,售價(jià)1999美元,具備3400人工智能每秒萬(wàn)億次運(yùn)算(TOPS)的性能;RTX 5080將提供超過(guò)一半的人工智能性能,達(dá)到1800 TOPS,價(jià)格更具吸引力,為999美元——沿用了即將退市的RTX 4080 Super的價(jià)格;接下來(lái)是售價(jià)749美元的RTX 5070 Ti,性能為1400 TOPS;最后是RTX 5070,性能為1000 TOPS,前面已提到其售價(jià)為549美元。

顯而易見(jiàn)的是,英偉達(dá)相對(duì)于Ada Lovelace 架構(gòu)已將人工智能計(jì)算操作翻倍——至少對(duì)于8位整數(shù)(INT8)工作負(fù)載而言是如此。同時(shí),英偉達(dá)展示了Blackwell架構(gòu)的RTX通過(guò)著色器可提供125萬(wàn)億次單精度浮點(diǎn)運(yùn)算的圖形計(jì)算能力,這比其Ada架構(gòu)同代產(chǎn)品高出1.5倍,而人工智能性能將高出3倍。因此,相對(duì)于著色器性能而言,人工智能性能翻倍了。

圖源:英偉達(dá)

DLSS 4功能搶眼

DLSS 全稱(chēng)為Deep Learning Super Sampling,是基于AI深度學(xué)習(xí)的提升畫(huà)質(zhì)的技術(shù),是一款由 AI 驅(qū)動(dòng)的性能倍增器,通過(guò)降低游戲中的渲染分辨率,同時(shí)通過(guò)人工智能算法模型和AI加速硬件單元(Tensor Core)來(lái)拉伸輸出畫(huà)面,可以讓玩家在不花費(fèi)額外成本的情況下運(yùn)行更高分辨率和更高幀率的游戲。

在上一代DLSS 3中,GeForce RTX 40 系列 GPU 所搭載的第四代 Tensor Core 和光流加速器提供動(dòng)力支持,可在不影響畫(huà)質(zhì)和響應(yīng)速度的前提下,利用 AI 創(chuàng)造更多高質(zhì)量幀。在 DLSS 3 中,英偉達(dá)在渲染兩幀的同時(shí),利用人工智能插入一個(gè)中間幀。這會(huì)給游戲渲染管線(xiàn)增加一些延遲,還會(huì)引發(fā)一些幀節(jié)奏方面的問(wèn)題。

黃仁勛表示,DLSS 4 是在 “預(yù)測(cè)未來(lái)”,而非 “對(duì)過(guò)去進(jìn)行插值”。這極大地改變了它的工作方式、對(duì)硬件性能以及延遲方面的表現(xiàn)?;谙惹颁秩镜膸?、運(yùn)動(dòng)矢量以及其他數(shù)據(jù),DLSS 4 會(huì)生成新的幀以營(yíng)造更流暢的體驗(yàn)。

再比如使用DLSS 3 ,如果僅獲得 40 幀的生成幀率,即便畫(huà)面看起來(lái)還算流暢,操作起來(lái)也會(huì)感覺(jué)非常遲緩、卡頓。這是因?yàn)橛脩?hù)輸入是以 20 幀每秒的速率進(jìn)行采樣的。而對(duì)于 DLSS 4 來(lái)說(shuō),你可以在用戶(hù)采樣率為 20 幀每秒的情況下獲得 80 幀每秒的生成幀率。換種說(shuō)法,我們通常感覺(jué)在使用幀生成功能時(shí),游戲要想操作起來(lái)有響應(yīng)感,采樣率至少需要達(dá)到 40 到50 幀每秒。

英偉達(dá)如何利用其游戲GPU翻倍的AI計(jì)算能力?

最有可能的應(yīng)用場(chǎng)景之一將是基于人工智能的紋理壓縮。我們過(guò)去就聽(tīng)說(shuō)過(guò)這個(gè)技術(shù),并且此前曾在老一代硬件上展示過(guò)其運(yùn)行效果……但當(dāng)時(shí)幀率并不高。2023年5月的神經(jīng)紋理壓縮(Neural Texture Compression,NTC)運(yùn)行速度還不到標(biāo)準(zhǔn)BTC(塊截?cái)嗑幋a)壓縮速度的一半。但18個(gè)月后,隨著人工智能計(jì)算能力的提升以及更多的訓(xùn)練,我們可以想象神經(jīng)紋理壓縮(NTC)能夠達(dá)到與傳統(tǒng)BTC相同的運(yùn)行速度。

鑒于我們以及其他人都對(duì)現(xiàn)代游戲中GPU顯存耗盡的問(wèn)題有所擔(dān)憂(yōu),所以神經(jīng)紋理壓縮(NTC)成為Blackwell這一代硬件的主要新特性之一也就不足為奇了。它號(hào)稱(chēng)能在僅使用三分之一內(nèi)存的情況下實(shí)現(xiàn)更高的圖像質(zhì)量,如果得以應(yīng)用,甚至能讓8GB顯存的顯卡更具實(shí)用性。但有一個(gè)小問(wèn)題:許多游戲都是跨平臺(tái)游戲,會(huì)在采用AMD GPU的游戲機(jī)上運(yùn)行。

除了桌面GPU,英偉達(dá)還公布了移動(dòng)端產(chǎn)品陣容的型號(hào)。將會(huì)有對(duì)應(yīng)的RTX 5090、5080、5070 Ti和5070筆記本電腦產(chǎn)品,將于2025年3月上市。雖然型號(hào)與桌面產(chǎn)品線(xiàn)相匹配,但性能會(huì)顯著降低,我們預(yù)計(jì)其他規(guī)格也會(huì)有類(lèi)似的削減。

RTX 5090筆記本電腦GPU將提供1850人工智能TOPS性能,起售價(jià)為2899美元。這意味著它基本上與桌面版RTX 5080相當(dāng)。移動(dòng)端5080的性能降至1350 AI TOPS,略低于桌面版5070 Ti。移動(dòng)端5070 Ti將具備與桌面版5070相同的1000 TOPS性能,而普通的5070筆記本電腦GPU將提供高達(dá)800 AI TOPS的性能——這可能是對(duì)即將推出的RTX 5060 Ti桌面版產(chǎn)品的一個(gè)預(yù)告。

主題演講花了大量時(shí)間談?wù)撊斯ぶ悄茉诟鱾€(gè)領(lǐng)域的應(yīng)用——汽車(chē)、醫(yī)療、倉(cāng)儲(chǔ)、機(jī)器人技術(shù)等等。這些都是我們?cè)谶^(guò)去幾年里不斷從英偉達(dá)那里聽(tīng)到的內(nèi)容。

此外,黃仁勛表示,AI Agent可能是下一個(gè)機(jī)器人行業(yè),很可能是一個(gè)價(jià)值數(shù)萬(wàn)億美元的機(jī)會(huì)。

2025是AI Agent的元年,你對(duì)此有哪些期待?

分享到

nina

相關(guān)推薦