關于「算力豹」(微信公眾號搜索:dethinktank)
▲算力豹·算力先鋒計劃以“算力創(chuàng)變,致勝未來”為主題,采訪對象覆蓋多數國內服務器、云服務、GPU、CPU、大模型等創(chuàng)企,邀請企業(yè)核心人物講述創(chuàng)業(yè)故事和產業(yè)見解。
算力先鋒本期邀請嘉賓:
近期,OpenAI的Sora和谷歌Gemini 1.5的推出使得AI技術的應用場景進一步拓寬,無論是多模態(tài)模型的訓練還是應用側推理都將對算力及其基礎設施提出更高要求,加劇了市場對“硬通貨”——AI服務器的爭搶,產業(yè)中涌現出了一大批有技術、有實力的國產服務器品牌。
作為中國領先的計算產品方案提供商和AI服務器市場TOP3,寶德計算機系統(tǒng)股份有限公司(以下簡稱“寶德計算”),在這AI熱潮中是第一線受益者,據寶德計算IA BU總經理和紅星研究院總經理黃文杰介紹,寶德計算2023年在英偉達企業(yè)級業(yè)務出貨同比增長的幅度達到接近200%。
當前AI行業(yè)面對巨大的算力缺口無非兩條出路:一是力大出奇跡,暴力囤積新設備,靠增量來提升算力;二是持續(xù)的創(chuàng)新服務器,靠提質來提升算力。寶德計算黃文杰談道,他認為身處AI狂潮中的廠家需要對市場有判斷能力,還要找準自己在行業(yè)中的定位,這意味著企業(yè)需要具備研發(fā)力來“造血”,以及將產品競爭力作為“硬功底”。最后他提出,企業(yè)需打造差異定制化來為客戶場景找到綜合最優(yōu)解。
01 發(fā)力多元算力,演繹賦能故事
從1993年中國第一臺服務器誕生至今,國產服務器的發(fā)展已走過31個年頭?;ヂ摼W是IT產業(yè)的第一波大熱潮持續(xù)了50年, AI是接替甚至是超過互聯網的第二波大熱潮。黃文杰介紹說,在2016年GPU的性價比突破了臨界點,算力、數據、算法三個方面都達到一個臨界點,AI便駛上了快車道。
早在1997年,寶德計算便進入服務器領域,經20多年的技術沉淀和市場經驗,目前已完整布局了AI訓練、AI推理、AI邊緣以及AI集群等全棧算力產品解決方案?!?strong>經歷了互聯網和AI兩個時代,寶德計算始終以滿足客戶的需求來為導向規(guī)劃自己的產品圖譜。”黃文杰談道。
在互聯網時代,寶德計算2014年開始用AI服務器來做高性能計算(HPC)的加速節(jié)點。2016年起,AI服務器在互聯網行業(yè)快速發(fā)展,彼時寶德計算大批量出貨AI服務器,專注互聯網領域的兩大應用——智能推薦和在線內容審核,滿足互聯網客戶對于視頻的需求。當大模型場景在去年初爆發(fā),預示AI大模型時代接替互聯網時代,寶德計算提前推出AI大模型需要的服務器產品,積極擁抱大模型的發(fā)展需求。
為應對AIGC和大模型的AI算力困局,寶德與NVIDIA GPU、英特爾?GPU和英特爾?至強CPU Max系列等業(yè)界領先產品加速適配和測試,迅速整機化和系統(tǒng)化,為大模型訓練和推理夯實算力根基。
以寶德自研AI服務器PR4910E為例,它搭載了第五代/四代英特爾?至強?可擴展處理器,最大核心數高達64,支持10張GPU加速卡,能為大模型訓練和推理提供強有力的算力支撐。該產品可以滿足完成文本生成圖像、數據傳輸、復雜的圖形渲染、視頻解碼等需求。
02 定制化需求下沉,加速滲透行業(yè)解決方案
傳統(tǒng)的按需定制都體現在應用層,如今隨著AI勢頭洶涌,在操作系統(tǒng)以及芯片級方面的定制化與標準化結合成為趨勢。黃文杰認為,AI最主要的場景是訓練、推理以及邊緣端,所以不同應用場景對算力和技術的需求側重點不同,需要靈活地調整和重新構建系統(tǒng)的各個方面。
黃文杰在訪談中聊到,他剛畢業(yè)便投身進了計算機硬件產品和解決方案的工作,2008年加入寶德計算,歷任研發(fā)、產品、市場等核心崗位。作為一個資深產品人,黃文杰深知服務對于AI服務器市場競爭的重要性,抓住AI基礎設施的定制化趨勢,堅持為寶德計算打造產品差異定制化。據他描述,寶德計算在AI服務器差異定制化方面已與競爭對手拉開差距。寶德計算的產品覆蓋高中低端,已達到高度的靈活性,根據不同的應用場景推出不同的產品,進而找到實現AI的最佳途徑。
如今,不少AI公司爭相采購AI服務器,尤其是大型互聯網公司如百度、阿里、騰訊、字節(jié)跳動等等,也有“扎堆跨界”AI服務器的公司。黃文杰分享到,互聯網大廠在GPU方面,有豐富的技術經驗積累,懂應用,也有大量的數據,而跨界公司大部分著力點在算力租賃,與寶德計算是合作關系。寶德計算這類廠商在過去被稱作設備商,黃文杰談到,在AI行業(yè)的發(fā)展中,有定制化需求的客戶逐漸不滿足于只購買設備,希望得到一體化的解決方案,以集成的解決方案來體現自己的品牌,這就給了寶德計算探索AI解決方案的動力。
基于客戶和行業(yè)的具體需求來做延伸,寶德計算在軟硬件方面都有加強投入。
在硬件方面,黃文杰表示,一方面,寶德計算將成立新的項目組,持續(xù)投入到如4U16卡液冷、4u8卡風冷、8U16卡風冷等AI產品的研發(fā)創(chuàng)新。同時,加強在單機性能方面的研發(fā)和技術創(chuàng)新,通過更高帶寬、更低延遲、更快計算來提升整機性能。在軟件方面,英特爾今年將在北京啟動創(chuàng)新中心,寶德計算攜手英特爾AI軟硬件基礎技術,推出AI數字人,為數據中心打造高效便利、普惠的AI基礎設施。
03 算力需求匹配,液冷降低能耗
AI服務器的建設并非純粹的堆積,在產業(yè)發(fā)展過程中,技術創(chuàng)新應用與算力需求之間也出現了某些不和諧,如硬件可用性、算力成本、系統(tǒng)集成和擴展等原因,都可能致使某些工作負載過度浪費GPU資源。
注重算力對應供求關系的匹配,促進數字經濟和實體經濟深度融合成為最廣泛的共識。據黃文杰描述,寶德計算積極攜手產業(yè)鏈上下游生態(tài)伙伴,加強軟硬件生態(tài)測試、適配以及方案創(chuàng)新,加強更多細分應用場景的豐富和深化。
黃文杰分享到,寶德計算兄弟公司中青寶旗下子公司寶騰互聯在深圳觀瀾和四川樂山擁有兩座自建高等級數據中心,并且投資建設運營成都智算中心B區(qū)云數據中心部分,提供機柜租賃等服務,具備云計算數據基礎架構環(huán)境,可提供機架1500個,按國標GB50174 A級標準和國際標準T3+以上標準設計。
【為深入探討算力、存力與數據要素如何共同促進數字經濟的發(fā)展,DOIT將于4月24日在成都舉辦“2024數據基礎設施技術峰會”。此次峰會將匯集業(yè)界專家、學者、技術開發(fā)者和企業(yè)決策者,共同探討數據基礎設施技術的未來趨勢,以及如何利用這些關鍵要素共塑企業(yè)和社會的未來】
寶德計算在北京也有智能生產基地布局,旗下昌平工廠采取“京牌京造”+“京產京銷”模式,產品覆蓋信創(chuàng)和通用領域,預計年產能15萬臺PC和2萬臺服務器、存儲。
AI算力提升也帶動液冷行業(yè)需求快速增長,目前業(yè)界已經開始試點采用液冷技術以及綠色電力等技術降低算力能耗。黃文杰談道,液冷在2023年和2024年相對前一年的同比增長均在50%左右,液冷在數據中心里的比例將來會逐漸地提升。寶德研發(fā)推出單機、機柜級和數據中心級一體化液冷解決方案,產品覆蓋全線,包括冷板、浸沒等。黃文杰分享說,寶德計算液冷業(yè)務在2023年有上億元的出貨,發(fā)展勢頭強勁。
據介紹,寶德計算單機液冷首推PR2715WL/PR2715EL,分別采用第三代/第四代英特爾?至強?可擴展處理器,基于冷板式液冷技術,部件級精確制冷、降低制冷成本和提升制冷效率等優(yōu)勢。整機柜液冷以寶德液冷整機柜系統(tǒng)Poseidon1000E為優(yōu)選,依據不同液冷規(guī)模分別提供風冷-液冷和液冷-液冷的機柜液冷方案。前者改造成本低,即買即用,適用于小規(guī)模,后者散熱功率范圍大,適用大規(guī)模散熱集群。
結語:算力建設熱度持續(xù),AI服務器奇貨可居
IT產業(yè)發(fā)展長期以芯片為主導,算力設備的上游現今受AI芯片供應限制,如CoWoS制程產能和HBM高速顯存產能有限,而服務器產品的更新基本與芯片發(fā)布同頻,高端AI服務器供不應求的局面短期難有緩解的跡象。
“服務器公司看到需求是爆發(fā)的,但是供應極度緊缺。”黃文杰坦言,各個廠家如果想抓住機會,首先是對市場有一個正確的判斷,第二個是提前做好備貨、周轉的準備。若沒有足夠的產出準備來迎接機遇,那就只能跟在后面“吃土”?!?strong>我們是幾乎每天都在研判趨勢”,黃文杰說,而通用服務器則是看每個公司的產品競爭力。
據了解,寶德計算的產品備貨覆蓋當下大部分需求,對于市面上缺貨產品制定了半年的備貨計劃,其他產品有三個月以內的備貨計劃,保障滾動出貨。“整個產業(yè)快速發(fā)展,我相信寶德計算的業(yè)績能夠持續(xù)保持快速增長?!秉S文杰坦言。
如同黃文杰描述的那樣,寶德計算坐擁20多年的技術沉淀和寶貴市場經驗,在技術創(chuàng)新中深度融合人工智能、機器學習等新技術,將AI的能力帶到更接近數據和終端用戶的地方。另一方面,寶德計算協(xié)同操作系統(tǒng)和中間件等生態(tài)伙伴完善算力布局,未來在賦能AI、云計算、大數據等新興技術創(chuàng)新和應用,推動金融、電力、醫(yī)療、教育等行業(yè)數字化轉型發(fā)展的道路上,寶德計算或將收獲滿滿。
*為深入探討算力、存力與數據要素如何共同促進數字經濟的發(fā)展,DOIT將于4月24日在成都舉辦“2024數據基礎設施技術峰會”,寶德計算將在峰會分論壇智算中心創(chuàng)新論壇進行主題分享,敬請期待!
關于「算力豹」(微信公眾號搜索:dethinktank)
·END·