寧暢CEO秦曉寧

據寧暢CEO秦曉寧介紹,“全局智算”戰(zhàn)略六“全”特點分別是全體系、全液冷、全服務、全場景、全行業(yè)、全階段。

全體系,是指從通用、A1、邊緣計算、整機柜、AI工作站、AI算力棧等硬件軟件、平臺、應用、開發(fā)工具支撐與適配整體的軟硬件棧全部具備,并且把服務器和數據中心級別的AI算力帶到了桌面。

全場景,寧暢AI全棧能力,全面支持大模型開發(fā)適配、部署場景。

全液冷覆蓋服務器、機柜、數據中心多形態(tài),支持風冷、冷板式液冷、浸沒液冷多方式,秉承“冷靜“計算策略,有效化解額外能耗以及成本居高不下的問題。

全行業(yè),滿足互聯網、金融、科研、自動駕駛等幾乎所有重要行業(yè)業(yè)務需求。

全服務,提供從前期咨詢、設計到制造、咨詢及后續(xù)運維、售后等全時算力服務,一個明顯的特征是不只交付硬件,如今有更多的軟件交付。

全階段,滿足客戶從大模型的開發(fā)、適配、部署、全場景不同業(yè)務發(fā)展階段關鍵需求,提供最具價比的定制化智算中心方案。

“全局智算”戰(zhàn)略:六層邏輯能力

寧暢“全局智算”戰(zhàn)略包括六層邏輯能力。

最底層是硬件資源層,包括傳統的通用服務器、GPU、整機柜、存儲、網絡多種形態(tài)的產品。

硬件上層是集群設計層。這一層并非海量硬件的簡單連接與堆疊。寧暢基于整體業(yè)務的運行特征和系統的量化需求,提供從微架構、網絡、存儲、AI模型特征等一系列的方案化的設計。

集群層之上是軟件層。

寧暢CTO趙雷

為什么寧暢要做軟件?寧暢CTO趙雷解釋說,未來越來越多的情況下,軟件將成為進一步提升AI的運算能力和產品使用率的最優(yōu)方案。

在計算能力方面,通過分析出什么樣的算力不足,哪個地方的算力存在缺口,從而對網絡和系統進行針對性的優(yōu)化與升級,確定算力的均衡負載并做出最好的選擇。其中,在算子優(yōu)化能力方面,寧暢以硬件資源優(yōu)勢,減少模型執(zhí)行的時間,降低資源消耗,提高了能效比,以NEX AIOM軟件支持Slam,快速部署IaaS、PaaS、SaaS層,實現系統工程能力的優(yōu)化;在AI中臺層,寧暢提供全面支持NVAIE中臺系統,實現AI算力棧在軟件層面包括基礎的操作、運行庫以及MPI、NCCL和其他基礎框架的快速部署與實現。

在模型優(yōu)化層,寧暢可集合用戶內部即時通信軟件的聊天數據,并對數據進行清洗和優(yōu)化,形成良好的數據集,防止在訓練過程中出現過擬合問題。此舉一方面方便公司內部員工的檢索與問答,另一方面則是檢驗自己開發(fā)的軟件系統所構建的AI解決方案能力和服務能力。目前還在不斷完善中。

最上層是業(yè)務層和場景層。大模型的落地過程中,無論是算法、算力、數據,還是算效、精度和服務,都面臨各種變化和需求,“全局智算”戰(zhàn)略,以六“全”能力矩陣,既化解了極致算效、精度增強、高效穩(wěn)定問題,也能夠賦能千行百業(yè),讓大模型真正成為各行各業(yè)的新質生產力。

1)首個“AI算力?!盢EX AI Lab落地桐鄉(xiāng)

集成了寧暢在AI計算領域能力,以底層硬件到頂層應用平臺系統化方案的“AI算力?!盢EX AI Lab(Nettrix AI Open Lab)新近在桐鄉(xiāng)落成。

NEX AI Lab由X640G50組成,搭配GPU及400G網絡,以及可支持X680G55液冷服務器與全閃存儲節(jié)點,可滿足大模型落地所需的計算、存儲、網絡、建設、管理、應用及液冷等全方位需求,以其全面、靈活、深度的支撐能力,為中高端智算中心的構建提供強有力的支持。

值得一提的是,X680G55系列液冷服務器除了單獨使用,還可以與風冷CPU結合使用,有效地實現傳統機房的液冷改造,讓性能得到最大程度釋放的同時保護客戶的投資成本。

目前,NEX AI Lab已先期開放預約免費的算力,支持用戶嘗試不同的業(yè)務組合、不同的網絡方案與不同的軟件和框架,并進行相應地調整,以便快速做出購買決策。

NEX AI Lab的應用,還有力地證明寧暢具備了從軟件到硬件全平臺服務的能力。

2)成功打造以全面AI體系支撐的自動駕駛系統

基于“全局智算”戰(zhàn)略,寧暢綜合某車企客戶的各種需求,最終選擇預制模塊化機房,成功搭建了一個面向自動駕駛領域的算力系統。

在機柜方面,液冷覆蓋率超過95%、功率高達100KW每柜的整機柜,電液盲插方式非常便于運維和部署,同時還為特定的硬件平臺推薦最優(yōu)能耗比配置,PUE最低可至1.09。

為滿足自動駕駛對實時性和延遲性要求,寧暢基于AI軟件棧提供優(yōu)化的深度學習框架和加速庫,充分平衡訓練,提升了推理效率;數據預處理自動標注方式,提高了數據的利用效率。

自動駕駛對安全性有更高的要求,車企需要進行大量的模擬測試。寧暢AI智駕中臺提供強大的模擬和測試工具,支持虛擬環(huán)境的創(chuàng)建與場景的重現,測試運率的自動生成和執(zhí)行,加速了模型的訓練過程,實現模型訓練閉環(huán)。

通過種種舉措,寧暢以覆蓋數據收集、數據處理、模型訓練、參數調優(yōu)、模型評估、模型發(fā)布全流程的技術支持,幫助客戶專注業(yè)務,提升計算和測試效率,縮短了新產品上市的進程。

與生態(tài)伙伴互補融合,構建起“全局智算”能力

秦曉寧表示,“全局智算”僅憑寧暢一己之力難以完成,無論是硬件、集群、中臺、內容,還是服務層,都離不開各方面伙伴的通力合作。

“只有通過每一個個體的能力互補與融合,才能夠真正構建起‘全局智算’的能力,開拓智算未來的產業(yè)發(fā)展局面?!扒貢詫幭M麑帟衬軌蛞愿鼜姶蟮腁I算力,推動大模型在各個行業(yè)的實際落地添磚加瓦,加速科技快速發(fā)展、造福人民,提升人民生活幸福感。

分享到

xiesc

相關推薦