黃仁勛CES演講亮相RTX 5090

在演講的高潮部分,身著嶄新皮衣的黃仁勛以模仿美國(guó)隊(duì)長(zhǎng)的姿勢(shì)亮相,瞬間點(diǎn)燃了現(xiàn)場(chǎng)的氣氛,引來(lái)陣陣笑聲。緊接著,他沒(méi)有讓觀眾久等,迅速揭曉了眾人期待已久的基于Blackwell架構(gòu)的新一代RTX 50系列顯卡。

其中,RTX 5090 GPU以其卓越的性能脫穎而出,成為了迄今為止速度最快的GeForce RTX GPU。它內(nèi)置了高達(dá)920億個(gè)晶體管,每秒可進(jìn)行超過(guò)3352萬(wàn)億次的AI運(yùn)算,相較于上一代RTX 4090,其性能提升幅度接近兩倍。

而RTX 5080的設(shè)計(jì)目標(biāo)則是直指性能翻倍,它配備了16GB的GDDR7顯存,內(nèi)存帶寬高達(dá)960GB/秒,并擁有10752個(gè)CUDA核心。英偉達(dá)方面明確表示,RTX 5080在性能上將遠(yuǎn)超上一代RTX 4080,為玩家和創(chuàng)作者帶來(lái)前所未有的使用體驗(yàn)。

文字編輯| 宋雨涵

1

RTX 50系列全線發(fā)布,最高3352TOPS

性能雙倍提升

英偉達(dá)Blackwell架構(gòu)的AI計(jì)算卡早已面世,而消費(fèi)者對(duì)于該架構(gòu)的消費(fèi)級(jí)GPU一直翹首以盼。今日,英偉達(dá)在CES展會(huì)上一次性滿足了大家的期待。

在萬(wàn)眾矚目的演講臺(tái)上,黃仁勛手舉RTX5090顯卡,自信滿滿地亮相。

從性能參數(shù)上看,Blackwell GPU的RTX 5090表現(xiàn)出色,它擁有920億個(gè)晶體管,AI運(yùn)算能力達(dá)到3352 TOPS(每秒萬(wàn)億次運(yùn)算次數(shù)),RT(光線追蹤)運(yùn)算能力為380 TFLOPS(每秒萬(wàn)億次浮點(diǎn)運(yùn)算次數(shù)),著色器運(yùn)算能力則高達(dá)125 TFLOPS。

RTX5090(及其衍生型號(hào)5090D)配備了32GB的GDDR7顯存,顯存位寬達(dá)到512位,CUDA核心數(shù)量多達(dá)21760個(gè),功耗為575W。更詳盡的性能指標(biāo)請(qǐng)參見(jiàn)下圖:

RTX 5090憑借其出色的性能,成為了迄今為止速度最快的GeForce RTX GPU。在Blackwell架構(gòu)的創(chuàng)新以及DLSS 4技術(shù)的加持下,RTX 5090的性能相較于RTX 4090提升了整整兩倍。

其他更多新技術(shù)

RTX 50系列顯卡采用了先進(jìn)的Blackwell架構(gòu),并配備了第五代Tensor Cores和第四代RT Cores,這些創(chuàng)新在AI渲染領(lǐng)域帶來(lái)了顯著的突破,涵蓋了神經(jīng)網(wǎng)絡(luò)著色器、數(shù)字人技術(shù)、幾何處理以及光照效果等多個(gè)方面?;贐lackwell架構(gòu)的NVIDIA Max-Q技術(shù)進(jìn)一步提升了電池續(xù)航能力,延長(zhǎng)高達(dá)40%。

DLSS 4技術(shù)首次引入了多幀生成功能,利用AI技術(shù)為每個(gè)渲染幀額外生成最多三幀,從而實(shí)現(xiàn)了性能的大幅提升,高達(dá)8倍。同時(shí),DLSS 4與NVIDIA Reflex技術(shù)緊密協(xié)作,確保了響應(yīng)速度的迅速。此外,DLSS 4還引入了圖形行業(yè)中首個(gè)實(shí)時(shí)應(yīng)用的Transformer模型架構(gòu),這一創(chuàng)新顯著提升了畫(huà)面的穩(wěn)定性、細(xì)節(jié)表現(xiàn)以及抗鋸齒效果。目前,已有超過(guò)75款游戲和應(yīng)用程序支持DLSS 4技術(shù)。

NVIDIA Reflex 2的Frame Warp技術(shù)則專(zhuān)注于降低游戲延遲,最多可減少75%的延遲,從而顯著提升游戲的響應(yīng)速度。RTX神經(jīng)網(wǎng)絡(luò)著色器技術(shù)的引入,使得實(shí)時(shí)游戲中的材質(zhì)和光照效果達(dá)到了電影級(jí)別的水準(zhǔn)。

RTX Neural Faces技術(shù)利用生成式AI進(jìn)行實(shí)時(shí)渲染,能夠呈現(xiàn)出逼真的面孔效果。結(jié)合全新的RTX技術(shù),這一創(chuàng)新進(jìn)一步提升了游戲的真實(shí)感。同時(shí),RTX Mega Geometry技術(shù)通過(guò)增加光線追蹤三角形的數(shù)量,最多可達(dá)100倍,為游戲角色和環(huán)境帶來(lái)了前所未有的真實(shí)感。

RTX 50系列顯卡的強(qiáng)大AI算力不僅優(yōu)化了游戲渲染效果,還為自主游戲角色提供了動(dòng)力。英偉達(dá)推出的ACE技術(shù)使得游戲角色能夠像人類(lèi)一樣感知、計(jì)劃和行動(dòng)。目前,ACE技術(shù)驅(qū)動(dòng)的自主角色已經(jīng)被整合到《絕地求生》、即將推出的《InZOI》以及《MIR5》等游戲中。

此外,NVIDIA Broadcast應(yīng)用提供了兩項(xiàng)AI驅(qū)動(dòng)的功能:音棚音效(Studio Voice)和虛擬補(bǔ)光(Virtual Key Light),分別用于提升麥克風(fēng)音頻質(zhì)量和對(duì)面部進(jìn)行重新打光。Streamlabs也推出了由NVIDIA ACE和Inworld驅(qū)動(dòng)的智能直播助手,這一助手能夠擔(dān)任助播、制作和技術(shù)助手的角色,從而顯著增強(qiáng)直播效果。

2

RTX AI PC本地可跑基礎(chǔ)模型

公開(kāi)具有視覺(jué)能力的PC虛擬化身

英偉達(dá)近期發(fā)布了專(zhuān)為RTX AI PC設(shè)計(jì)的本地運(yùn)行基礎(chǔ)模型,這些模型以NIM微服務(wù)的形式提供,并得到了RTX 50系列GPU的加速支持。這些AI基礎(chǔ)模型廣泛覆蓋了大語(yǔ)言模型、視覺(jué)語(yǔ)言模型、圖像生成模型、語(yǔ)音模型、檢索增強(qiáng)生成(RAG)嵌入模型、PDF信息提取以及計(jì)算機(jī)視覺(jué)模型等多個(gè)領(lǐng)域。為了確保在PC上流暢運(yùn)行AI,英偉達(dá)已經(jīng)對(duì)所有必要的組件進(jìn)行了優(yōu)化,以適配所有型號(hào)的英偉達(dá)GPU部署。

英偉達(dá)創(chuàng)始人黃仁勛表示,公司致力于將AI技術(shù)引入PC領(lǐng)域,期望將Windows PC打造成為具備世界級(jí)水平的AI平臺(tái)。為實(shí)現(xiàn)這一目標(biāo),英偉達(dá)提出了采用Windows WSL 2(Windows子系統(tǒng)Linux 2)的方案,這一方案集成了兩個(gè)操作系統(tǒng),專(zhuān)為云原生應(yīng)用程序優(yōu)化,提供了開(kāi)箱即用的便捷體驗(yàn)。

為了展示NIM在構(gòu)建AI代理和助手方面的應(yīng)用潛力,英偉達(dá)將攜手Black Forest Labs、Meta、Mistral、Stability AI等頂級(jí)開(kāi)發(fā)商,共同推出一系列基于NIM微服務(wù)和RTX AI PC的AI藍(lán)圖。這些藍(lán)圖將為用戶提供豐富的實(shí)踐案例和靈感來(lái)源。

此外,英偉達(dá)還推出了一款名為Project R2X的PC虛擬化身技術(shù),該技術(shù)賦予了PC視覺(jué)能力,使用戶能夠輕松獲取信息,并輔助完成桌面應(yīng)用操作、視頻會(huì)議參與、文檔閱讀及總結(jié)等任務(wù)。據(jù)英偉達(dá)透露,Project R2X預(yù)計(jì)將在數(shù)月內(nèi)向RTX 50系列及搭載相應(yīng)顯卡的筆記本電腦用戶開(kāi)放下載。

3

AI超級(jí)計(jì)算機(jī)Project DIGITS

英偉達(dá)已將其先前的AI超級(jí)計(jì)算機(jī)DGX-1升級(jí)為Project DIGITS,實(shí)現(xiàn)了體型縮減與性能提升的雙重飛躍。英偉達(dá)將其描述為“專(zhuān)為全球AI研究者、數(shù)據(jù)科學(xué)家及學(xué)生設(shè)計(jì)的個(gè)人AI超級(jí)計(jì)算機(jī),使他們能夠體驗(yàn)到NVIDIA Grace Blackwell平臺(tái)的強(qiáng)大力量”。

Project DIGITS搭載了全新的英偉達(dá)GB10 Grace Blackwell超級(jí)芯片,該芯片具備PFLOPS級(jí)別的AI計(jì)算能力,適用于原型設(shè)計(jì)、微調(diào)及運(yùn)行大型AI模型。用戶通過(guò)Project DIGITS,可以在個(gè)人桌面系統(tǒng)上開(kāi)發(fā)和運(yùn)行模型推理,并輕松地在加速云或數(shù)據(jù)中心基礎(chǔ)設(shè)施上實(shí)現(xiàn)模型的無(wú)縫部署。

GB10超級(jí)芯片,作為基于Grace Blackwell架構(gòu)的SoC,能夠在FP4精度下提供高達(dá)1PFLOPS的AI性能,同時(shí)保持高能效。它配備了Blackwell GPU,內(nèi)含最新一代CUDA核心和第五代Tensor Cores,并通過(guò)NVLink-C2C芯片間互連與高性能的Grace CPU相連,該CPU包含20個(gè)基于Arm架構(gòu)構(gòu)建的高能效核心。值得一提的是,聯(lián)發(fā)科也參與了GB10的設(shè)計(jì)工作。

憑借GB10超級(jí)芯片,Project DIGITS僅需標(biāo)準(zhǔn)電源插座即可提供卓越性能。每個(gè)Project DIGITS配備128GB內(nèi)存和最高4TB的NVMe存儲(chǔ),使開(kāi)發(fā)者能夠運(yùn)行參數(shù)多達(dá)2000億的大型語(yǔ)言模型,從而加速AI創(chuàng)新。此外,通過(guò)NVIDIA ConnectX網(wǎng)絡(luò),用戶還可以將兩臺(tái)Project DIGITS AI超級(jí)計(jì)算機(jī)連接起來(lái),運(yùn)行參數(shù)高達(dá)4050億的模型。

為了使AI超級(jí)計(jì)算更加普及,借助Grace Blackwell架構(gòu),企業(yè)和研究人員可以在搭載Linux版NVIDIA DGX OS的本地Project DIGITS系統(tǒng)上對(duì)模型進(jìn)行原型設(shè)計(jì)、微調(diào)和測(cè)試,隨后無(wú)縫部署至NVIDIA DGX Cloud、加速云實(shí)例或數(shù)據(jù)中心基礎(chǔ)設(shè)施。這允許開(kāi)發(fā)人員在Project DIGITS上進(jìn)行AI原型設(shè)計(jì),并在云或數(shù)據(jù)中心基礎(chǔ)設(shè)施上,利用相同的Grace Blackwell架構(gòu)和NVIDIA AI Enterprise軟件平臺(tái)進(jìn)行擴(kuò)展。

此外,Project DIGITS用戶還可以訪問(wèn)NVIDIA廣泛的AI軟件庫(kù)進(jìn)行實(shí)驗(yàn)和原型設(shè)計(jì),包括NVIDIA NGC目錄和NVIDIA開(kāi)發(fā)者門(mén)戶中提供的軟件開(kāi)發(fā)套件、編排工具、框架和模型。開(kāi)發(fā)人員可以利用NVIDIA NeMo框架微調(diào)模型,借助NVIDIA RAPIDS庫(kù)加速數(shù)據(jù)科學(xué)工作,并運(yùn)行如PyTorch、Python和Jupyter Notebooks等常用框架。

英偉達(dá)及其頂級(jí)合作伙伴計(jì)劃于5月推出Project DIGITS,起售價(jià)為3000美元。

結(jié)語(yǔ)

這場(chǎng)發(fā)布會(huì),無(wú)疑是英偉達(dá)在AI領(lǐng)域勃勃雄心的精彩展現(xiàn)。從浩瀚的數(shù)據(jù)中心延伸至個(gè)人的電腦桌面,AI的浪潮正以雷霆萬(wàn)鈞之勢(shì),席卷每一個(gè)計(jì)算終端。英偉達(dá),作為這場(chǎng)技術(shù)革命的領(lǐng)航者,正將AI的智慧種子深深根植于每一臺(tái)個(gè)人電腦之中。

RTX 50系列顯卡的橫空出世,讓游戲玩家們首次親身體驗(yàn)到了AI技術(shù)帶來(lái)的極致性能飛躍;而Project Digits項(xiàng)目的推出,更是將曾經(jīng)高不可攀的超級(jí)計(jì)算能力,變?yōu)榱巳藗冇|手可及的現(xiàn)實(shí)。這一連串的壯舉,不僅預(yù)示著AI將無(wú)處不在的未來(lái)正加速向我們走來(lái),更彰顯了英偉達(dá)長(zhǎng)久以來(lái)所不懈追求的理想愿景——一個(gè)由AI技術(shù)全面賦能的美好未來(lái)。

分享到

lixiangjing

算力豹主編

相關(guān)推薦