關(guān)于「算力豹」(微信公眾號搜索:dethinktank)
▲算力豹·算力先鋒計劃以“算力創(chuàng)變,致勝未來”為主題,采訪對象覆蓋多數(shù)國內(nèi)服務器、云服務、GPU、CPU、大模型等創(chuàng)企,邀請企業(yè)核心人物講述創(chuàng)業(yè)故事和產(chǎn)業(yè)見解。
算力先鋒本期邀請嘉賓:
近期,OpenAI的Sora和谷歌Gemini 1.5的推出使得AI技術(shù)的應用場景進一步拓寬,無論是多模態(tài)模型的訓練還是應用側(cè)推理都將對算力及其基礎(chǔ)設施提出更高要求,加劇了市場對“硬通貨”——AI服務器的爭搶,產(chǎn)業(yè)中涌現(xiàn)出了一大批有技術(shù)、有實力的國產(chǎn)服務器品牌。
作為中國領(lǐng)先的計算產(chǎn)品方案提供商和AI服務器市場TOP3,寶德計算機系統(tǒng)股份有限公司(以下簡稱“寶德計算”),在這AI熱潮中是第一線受益者,據(jù)寶德計算IA BU總經(jīng)理和紅星研究院總經(jīng)理黃文杰介紹,寶德計算2023年在英偉達企業(yè)級業(yè)務出貨同比增長的幅度達到接近200%。
當前AI行業(yè)面對巨大的算力缺口無非兩條出路:一是力大出奇跡,暴力囤積新設備,靠增量來提升算力;二是持續(xù)的創(chuàng)新服務器,靠提質(zhì)來提升算力。寶德計算黃文杰談道,他認為身處AI狂潮中的廠家需要對市場有判斷能力,還要找準自己在行業(yè)中的定位,這意味著企業(yè)需要具備研發(fā)力來“造血”,以及將產(chǎn)品競爭力作為“硬功底”。最后他提出,企業(yè)需打造差異定制化來為客戶場景找到綜合最優(yōu)解。
01 發(fā)力多元算力,演繹賦能故事
從1993年中國第一臺服務器誕生至今,國產(chǎn)服務器的發(fā)展已走過31個年頭?;ヂ?lián)網(wǎng)是IT產(chǎn)業(yè)的第一波大熱潮持續(xù)了50年, AI是接替甚至是超過互聯(lián)網(wǎng)的第二波大熱潮。黃文杰介紹說,在2016年GPU的性價比突破了臨界點,算力、數(shù)據(jù)、算法三個方面都達到一個臨界點,AI便駛上了快車道。
早在1997年,寶德計算便進入服務器領(lǐng)域,經(jīng)20多年的技術(shù)沉淀和市場經(jīng)驗,目前已完整布局了AI訓練、AI推理、AI邊緣以及AI集群等全棧算力產(chǎn)品解決方案?!?strong>經(jīng)歷了互聯(lián)網(wǎng)和AI兩個時代,寶德計算始終以滿足客戶的需求來為導向規(guī)劃自己的產(chǎn)品圖譜。”黃文杰談道。
在互聯(lián)網(wǎng)時代,寶德計算2014年開始用AI服務器來做高性能計算(HPC)的加速節(jié)點。2016年起,AI服務器在互聯(lián)網(wǎng)行業(yè)快速發(fā)展,彼時寶德計算大批量出貨AI服務器,專注互聯(lián)網(wǎng)領(lǐng)域的兩大應用——智能推薦和在線內(nèi)容審核,滿足互聯(lián)網(wǎng)客戶對于視頻的需求。當大模型場景在去年初爆發(fā),預示AI大模型時代接替互聯(lián)網(wǎng)時代,寶德計算提前推出AI大模型需要的服務器產(chǎn)品,積極擁抱大模型的發(fā)展需求。
為應對AIGC和大模型的AI算力困局,寶德與NVIDIA GPU、英特爾?GPU和英特爾?至強CPU Max系列等業(yè)界領(lǐng)先產(chǎn)品加速適配和測試,迅速整機化和系統(tǒng)化,為大模型訓練和推理夯實算力根基。
以寶德自研AI服務器PR4910E為例,它搭載了第五代/四代英特爾?至強?可擴展處理器,最大核心數(shù)高達64,支持10張GPU加速卡,能為大模型訓練和推理提供強有力的算力支撐。該產(chǎn)品可以滿足完成文本生成圖像、數(shù)據(jù)傳輸、復雜的圖形渲染、視頻解碼等需求。
02 定制化需求下沉,加速滲透行業(yè)解決方案
傳統(tǒng)的按需定制都體現(xiàn)在應用層,如今隨著AI勢頭洶涌,在操作系統(tǒng)以及芯片級方面的定制化與標準化結(jié)合成為趨勢。黃文杰認為,AI最主要的場景是訓練、推理以及邊緣端,所以不同應用場景對算力和技術(shù)的需求側(cè)重點不同,需要靈活地調(diào)整和重新構(gòu)建系統(tǒng)的各個方面。
黃文杰在訪談中聊到,他剛畢業(yè)便投身進了計算機硬件產(chǎn)品和解決方案的工作,2008年加入寶德計算,歷任研發(fā)、產(chǎn)品、市場等核心崗位。作為一個資深產(chǎn)品人,黃文杰深知服務對于AI服務器市場競爭的重要性,抓住AI基礎(chǔ)設施的定制化趨勢,堅持為寶德計算打造產(chǎn)品差異定制化。據(jù)他描述,寶德計算在AI服務器差異定制化方面已與競爭對手拉開差距。寶德計算的產(chǎn)品覆蓋高中低端,已達到高度的靈活性,根據(jù)不同的應用場景推出不同的產(chǎn)品,進而找到實現(xiàn)AI的最佳途徑。
如今,不少AI公司爭相采購AI服務器,尤其是大型互聯(lián)網(wǎng)公司如百度、阿里、騰訊、字節(jié)跳動等等,也有“扎堆跨界”AI服務器的公司。黃文杰分享到,互聯(lián)網(wǎng)大廠在GPU方面,有豐富的技術(shù)經(jīng)驗積累,懂應用,也有大量的數(shù)據(jù),而跨界公司大部分著力點在算力租賃,與寶德計算是合作關(guān)系。寶德計算這類廠商在過去被稱作設備商,黃文杰談到,在AI行業(yè)的發(fā)展中,有定制化需求的客戶逐漸不滿足于只購買設備,希望得到一體化的解決方案,以集成的解決方案來體現(xiàn)自己的品牌,這就給了寶德計算探索AI解決方案的動力。
基于客戶和行業(yè)的具體需求來做延伸,寶德計算在軟硬件方面都有加強投入。
在硬件方面,黃文杰表示,一方面,寶德計算將成立新的項目組,持續(xù)投入到如4U16卡液冷、4u8卡風冷、8U16卡風冷等AI產(chǎn)品的研發(fā)創(chuàng)新。同時,加強在單機性能方面的研發(fā)和技術(shù)創(chuàng)新,通過更高帶寬、更低延遲、更快計算來提升整機性能。在軟件方面,英特爾今年將在北京啟動創(chuàng)新中心,寶德計算攜手英特爾AI軟硬件基礎(chǔ)技術(shù),推出AI數(shù)字人,為數(shù)據(jù)中心打造高效便利、普惠的AI基礎(chǔ)設施。
03 算力需求匹配,液冷降低能耗
AI服務器的建設并非純粹的堆積,在產(chǎn)業(yè)發(fā)展過程中,技術(shù)創(chuàng)新應用與算力需求之間也出現(xiàn)了某些不和諧,如硬件可用性、算力成本、系統(tǒng)集成和擴展等原因,都可能致使某些工作負載過度浪費GPU資源。
注重算力對應供求關(guān)系的匹配,促進數(shù)字經(jīng)濟和實體經(jīng)濟深度融合成為最廣泛的共識。據(jù)黃文杰描述,寶德計算積極攜手產(chǎn)業(yè)鏈上下游生態(tài)伙伴,加強軟硬件生態(tài)測試、適配以及方案創(chuàng)新,加強更多細分應用場景的豐富和深化。
黃文杰分享到,寶德計算兄弟公司中青寶旗下子公司寶騰互聯(lián)在深圳觀瀾和四川樂山擁有兩座自建高等級數(shù)據(jù)中心,并且投資建設運營成都智算中心B區(qū)云數(shù)據(jù)中心部分,提供機柜租賃等服務,具備云計算數(shù)據(jù)基礎(chǔ)架構(gòu)環(huán)境,可提供機架1500個,按國標GB50174 A級標準和國際標準T3+以上標準設計。
【為深入探討算力、存力與數(shù)據(jù)要素如何共同促進數(shù)字經(jīng)濟的發(fā)展,DOIT將于4月24日在成都舉辦“2024數(shù)據(jù)基礎(chǔ)設施技術(shù)峰會”。此次峰會將匯集業(yè)界專家、學者、技術(shù)開發(fā)者和企業(yè)決策者,共同探討數(shù)據(jù)基礎(chǔ)設施技術(shù)的未來趨勢,以及如何利用這些關(guān)鍵要素共塑企業(yè)和社會的未來】
寶德計算在北京也有智能生產(chǎn)基地布局,旗下昌平工廠采取“京牌京造”+“京產(chǎn)京銷”模式,產(chǎn)品覆蓋信創(chuàng)和通用領(lǐng)域,預計年產(chǎn)能15萬臺PC和2萬臺服務器、存儲。
AI算力提升也帶動液冷行業(yè)需求快速增長,目前業(yè)界已經(jīng)開始試點采用液冷技術(shù)以及綠色電力等技術(shù)降低算力能耗。黃文杰談道,液冷在2023年和2024年相對前一年的同比增長均在50%左右,液冷在數(shù)據(jù)中心里的比例將來會逐漸地提升。寶德研發(fā)推出單機、機柜級和數(shù)據(jù)中心級一體化液冷解決方案,產(chǎn)品覆蓋全線,包括冷板、浸沒等。黃文杰分享說,寶德計算液冷業(yè)務在2023年有上億元的出貨,發(fā)展勢頭強勁。
據(jù)介紹,寶德計算單機液冷首推PR2715WL/PR2715EL,分別采用第三代/第四代英特爾?至強?可擴展處理器,基于冷板式液冷技術(shù),部件級精確制冷、降低制冷成本和提升制冷效率等優(yōu)勢。整機柜液冷以寶德液冷整機柜系統(tǒng)Poseidon1000E為優(yōu)選,依據(jù)不同液冷規(guī)模分別提供風冷-液冷和液冷-液冷的機柜液冷方案。前者改造成本低,即買即用,適用于小規(guī)模,后者散熱功率范圍大,適用大規(guī)模散熱集群。
結(jié)語:算力建設熱度持續(xù),AI服務器奇貨可居
IT產(chǎn)業(yè)發(fā)展長期以芯片為主導,算力設備的上游現(xiàn)今受AI芯片供應限制,如CoWoS制程產(chǎn)能和HBM高速顯存產(chǎn)能有限,而服務器產(chǎn)品的更新基本與芯片發(fā)布同頻,高端AI服務器供不應求的局面短期難有緩解的跡象。
“服務器公司看到需求是爆發(fā)的,但是供應極度緊缺。”黃文杰坦言,各個廠家如果想抓住機會,首先是對市場有一個正確的判斷,第二個是提前做好備貨、周轉(zhuǎn)的準備。若沒有足夠的產(chǎn)出準備來迎接機遇,那就只能跟在后面“吃土”。“我們是幾乎每天都在研判趨勢”,黃文杰說,而通用服務器則是看每個公司的產(chǎn)品競爭力。
據(jù)了解,寶德計算的產(chǎn)品備貨覆蓋當下大部分需求,對于市面上缺貨產(chǎn)品制定了半年的備貨計劃,其他產(chǎn)品有三個月以內(nèi)的備貨計劃,保障滾動出貨?!罢麄€產(chǎn)業(yè)快速發(fā)展,我相信寶德計算的業(yè)績能夠持續(xù)保持快速增長?!秉S文杰坦言。
如同黃文杰描述的那樣,寶德計算坐擁20多年的技術(shù)沉淀和寶貴市場經(jīng)驗,在技術(shù)創(chuàng)新中深度融合人工智能、機器學習等新技術(shù),將AI的能力帶到更接近數(shù)據(jù)和終端用戶的地方。另一方面,寶德計算協(xié)同操作系統(tǒng)和中間件等生態(tài)伙伴完善算力布局,未來在賦能AI、云計算、大數(shù)據(jù)等新興技術(shù)創(chuàng)新和應用,推動金融、電力、醫(yī)療、教育等行業(yè)數(shù)字化轉(zhuǎn)型發(fā)展的道路上,寶德計算或?qū)⑹斋@滿滿。
*為深入探討算力、存力與數(shù)據(jù)要素如何共同促進數(shù)字經(jīng)濟的發(fā)展,DOIT將于4月24日在成都舉辦“2024數(shù)據(jù)基礎(chǔ)設施技術(shù)峰會”,寶德計算將在峰會分論壇智算中心創(chuàng)新論壇進行主題分享,敬請期待!
關(guān)于「算力豹」(微信公眾號搜索:dethinktank)
·END·