GLM-Z1-32B-0414 是具有深度思考能力的推理模型,這是在智譜最新32B基座模型的基礎上,通過冷啟動和擴展強化學習,以及在數(shù)學、代碼和邏輯等任務上對模型的進一步訓練得到的。相對于基礎模型,顯著提升了數(shù)理能力和解決復雜任務的能力。在訓練的過程中,智譜還引入了基于對戰(zhàn)排序反饋的通用強化學習,進一步增強了模型的通用能力。
在部分任務的性能表現(xiàn)上,在僅使用 32B 參數(shù)的情況下,可與參數(shù)高達 6710 億的 DeepSeek-R1 相媲美。在AIME 24/25、LiveCodeBench、GPQA 等基準測試中,GLM-Z1-32B-0414 展現(xiàn)了較為強大的數(shù)理推理能力、指令遵循能力和綜合工具調(diào)用能力,為更多復雜任務的解決提供了支持。
GLM-Z1-9B-0414 是一個驚喜。智譜沿用了上述一系列技術,訓練了一個 9B 的小尺寸模型。雖然參數(shù)量更少,但是在數(shù)學推理及通用任務上依然表現(xiàn)出色,整體性能已躋身同尺寸開源模型的領先水平。特別是在資源受限的場景下,該模型可以很好地在效率與效果之間取得平衡,為需要輕量化部署的用戶提供強有力的選擇。
此前,優(yōu)刻得就憑借自身在云計算領域的深厚積淀,為智譜 AI 提供底層算力支持,可靠支撐大模型應用智譜清言、AI智能體AutoGLM等多款AIGC項目的快速上線和對外服務。合作中,優(yōu)刻得烏蘭察布智算中心的定制化高電機柜和 GPU 算力,幫助智譜大模型迅速搭建起訓練和推理集群,并不斷擴大規(guī)模,極大地提升了智譜大模型的研發(fā)效率,使得大模型應用能夠快速上線并對外服務,為智譜 AI 后續(xù)的模型研發(fā)筑牢根基。
優(yōu)刻得模型服務平臺融合豐富的行業(yè)模型資源,可針對不同行業(yè)需求定制,提供精準高效推理能力。合作期間,雙方還以 “大模型一體機” 為載體,聯(lián)合探索行業(yè)大模型解決方案,助力金融、醫(yī)療、汽車、制造等行業(yè)快速落地大模型業(yè)務。
此次首批接入在推理能力、端側(cè)算力、運行成本等方面具有獨特優(yōu)勢的智譜GLM Z1系列推理模型,標志著優(yōu)刻得與智譜在智能算力基礎設施領域的進一步深化合作。通過將 GLM-Z1-32B 深度思考能力與優(yōu)刻得智算集群能力相結合,助力客戶獲取極致推理體驗。
優(yōu)刻得深耕 AI 領域多年,構建了覆蓋AI訓練、推理、應用落地的全棧服務體系,至今已為超千款 AI 應用提供智能算力服務,支持超大規(guī)模分布式訓練、多模態(tài)模型加速及云邊端協(xié)同部署,并以異構算力調(diào)度引擎實現(xiàn) GPU 資源利用率的大幅提升。
優(yōu)刻得將持續(xù)以”技術普惠”為核心理念,通過構建開放兼容的智能算力平臺,攜手更多像智譜這樣的國內(nèi)頂尖 AI 企業(yè),共同推動中國大模型技術應用創(chuàng)新,為數(shù)字經(jīng)濟高質(zhì)量發(fā)展注入新動能。