H3C UniCube DeepSeek大模型一體機
產品規(guī)格與型號
中科曙光
2月14日,曙光云推出的全國產DeepSeek大模型超融合一體機,主要應用場景為政務云、企業(yè)數(shù)據(jù)中心還有多行業(yè)適配。產品亮點第一個我們就能關注到的——全國產化。這款一體機采用了國產X86 CPU和國產GPGPU加速卡,支持全精度和半精度混合訓練與推理,這樣能有更高的計算性價比。
另外一體機全面適配DeepSeek系列模型(如V3、R1、Janus Pro),并支持全系列量化蒸餾版本,同時兼容QWen2.5、LLama3.2、ChatGLM等主流大模型。而且內置文心雕龍智能化應用,通過快速問答和知識庫管理,幫助企業(yè)高效處理信息,提升運營效率。
寧暢
2月14日,寧暢發(fā)布DeepSeek大模型一體機解決方案。DeepSeek 大模型一體機解決方案從底層技術到業(yè)務場景深度優(yōu)化。除了易部署,這些不同版本還集成了多款行業(yè)知識庫與模板,并且通過內置資源監(jiān)控與自優(yōu)化算法,算力利用率可提升至85%,大幅降低總擁有成本,幫助企業(yè)實現(xiàn)高效、低成本的運維管理。
DeepSeek 大模型一體機解決方案產品矩陣
華為
2月13日,華為對外推出昇騰DeepSeek一體機,深度融合昇騰高性能算力底座與DeepSeek全系列大模型能力,覆蓋語言理解、圖像分析、知識推理等全場景需求。以DeepSeek-R1-Distill-Llama-70B為例,其系統(tǒng)每秒吞吐量可達3300 Tokens,輕松應對海量文本分析和復雜業(yè)務場景模擬。
一體機還支持低至50ms的每用戶時延,就是哪怕很多人同時用,系統(tǒng)對每個用戶的時延也控制在50ms以內(簡單來說就是打游戲不卡的程度),可以提升個人辦公效率。以DeepSeek V3/R1滿血版為例,能支持高達192個用戶的并發(fā),滿足大型企業(yè)多部門協(xié)同工作的需求。
一體機采用華為Atlas800l A2推理服務器,搭載鯤鵬920+昇騰AI處理器,支持全精度和半精度混合訓練與推理?;旌贤评砀锕馓岬降狞c相同,就是回答你的問題,簡單的要求能快速批量處理(半精度),復雜的精密任務就會更注重細節(jié)(全精度)。
截止2月12日,已有13家伙伴基于昇騰產品打造自有DeepSeek一體機產品。
宏杉科技
2月13日,宏杉科技對外推出基于DeepSeek的大模型一體機解決方案。宏杉科技DeepSeek一體機解決方案除了易部署,還提到了靈活擴展性,能滿足私有化部署對海量數(shù)據(jù)存儲的需求。同時,內置多種數(shù)據(jù)保護模式,并可根據(jù)數(shù)據(jù)訪問級別配置性價比更高的存儲介質。
宏杉科技還內置了自研功能組件,可無縫對接各類型生產系統(tǒng),實現(xiàn)數(shù)據(jù)自由流轉。同時,搭載智能AI文檔庫產品,支持知識協(xié)作共享和跨領域多模態(tài)檢索,提升企業(yè)數(shù)據(jù)管理效率。
聯(lián)想集團
2月初,聯(lián)想集團與國產GPU企業(yè)沐曦股份聯(lián)合發(fā)布了基于DeepSeek大模型的首個國產一體機解決方案。方案以“聯(lián)想服務器/工作站+沐曦訓推一體國產GPU+自主算法”為核心架構,配合聯(lián)想AI Force智能體開發(fā)平臺,推出智能體一體機與訓推一體服務器雙產品形態(tài)。
聯(lián)想創(chuàng)新性推出兩大產品:面向敏捷部署的DeepSeek智能體一體機采用ThinkStation PX工作站為載體,搭載沐曦曦思N260國產GPU。實測數(shù)據(jù)顯示,在相同并發(fā)條件下,沐曦曦思N260國產GPU在Qwen2.5-14B模型推理實測性能達到NVIDIA L20 GPU的110%-130%,可支持本地部署DeepSeek各種參數(shù)蒸餾模型推理。而面向更廣泛場景的DeepSeek訓推一體機則基于聯(lián)想問天WA5480 G3 AI服務器,搭載8張曦云C500國產GPU,可為大模型訓練和推理提供強大的算力支撐。
基于聯(lián)想ThinkStation PX的智能體一體機
基于聯(lián)想問天WA5480 G3 AI服務器的訓推一體機
浪潮
2月7日,浪潮云聯(lián)合沐曦股份、銓興科技等生態(tài)伙伴,對外發(fā)布了預置DeepSeek-R1和DeepSeek-V3模型的海若一體機,實現(xiàn)671B DeepSeek大模型國產GPU單機推理服務。同樣是開箱即用,部署時間1-3天。大模型推理性能有大幅提升,解碼生成速度提升185.7%,平均首字時延降低55.9%。
開放兼容性高,支持浪潮海若、DeepSeek、GPT-4、通義千問等主流大模型;支持EmBedding、ReRanker、ASR、TTS多類型;內置模型池適配沐曦、昇騰等多種芯片。規(guī)格也有版本之分,有啟航版、進階版、旗艦版等多種規(guī)格,可根據(jù)模型參數(shù)和應用規(guī)模靈活選擇。
海若一體機產品能力全景圖
銓興科技
2月18日,銓興科技對外發(fā)布DeepSeek R1 671B 超顯存融合訓推一體機系列。包括三個版本:
671B 推理一體機入門版:價格 9.8W 起,支持 DeepSeek R1 671B 模型部署,強調極致性價比,輸出最高可達 12TPS。
671B 推理一體機滿血版:被稱為 “性能機皇”,支持 DeepSeek R1 671B 滿血版模型部署,超顯存融合賦能高效推理,配置為 RTX5880 ada 48GB x10、Intel 4410Y x 2、512GB DRAM。
671B 滿血版訓推一體機:成本再降 95%,助力國產模型訓練,支持 DeepSeek R1 671B 滿血版本地訓練,采用雙節(jié)點配置,每節(jié)點含 RTX5880 ada 48GB x 8、Intel 4410Y x 2、2TB DRAM、400Gb 網(wǎng)卡、AI Cache Pro 2TB x 4 。
超聚變
2月17日,超聚變對外發(fā)布deepseek大型一體機。其優(yōu)勢在于開箱即用,分鐘級交付。擁有一站式工具鏈,兼容主流模型,提供專業(yè)服務;多元算力融合,AI 資源可視可管,算力共享等。
產品規(guī)格包括:
輕量版:適用于低成本、低時延推理,如文本生成、簡單問答,支持 1.5B – 14B 模型。
標準版:平衡成本與性能,適用于代碼輔助、學術研究等,支持 32B – 70B 模型。
旗艦版:面向高性能推理,如尖端科研、商業(yè)決策,支持 671B 滿血模型。
紫光云
紫光云公司推出的是紫鸞大模型一體機,已經全系優(yōu)化適配并預制DeepSeek R1系列推理模型,支持英偉達、天數(shù)、昆侖芯、燧原科技等異構芯片的統(tǒng)一調度。通過一體化開箱即用私域部署,紫鸞大模型實現(xiàn)了DeepSeek的部署,為政企用戶提供高性價比的生產級AI解決方案。
京東云
2月8日,京東云對外發(fā)布DeepSeek大模型一體機,基于“本地化開箱即用”的理念,提供從底層算力、模型服務、推理能力、應用開發(fā)的全棧解決方案,支持華為昇騰、海光、寒武紀、摩爾線程、天數(shù)智芯等國產AI加速芯片,在滿足自主可控的同時,降低算力投資成本,主要面向金融、政府及企業(yè)用戶。
昆侖技術+中科加禾
2月18日,昆侖技術與中科加禾攜手推出的DeepSeek本地化部署一體機,產品基于昆侖技術的KunLun AI服務器算力和中科加禾的SigInfer模型推理引擎,提供穩(wěn)定可靠的生產級DeepSeek-R1和V3服務。這個要簡單說兩句,河南昆侖技術有限公司成立于2022年10月,核心團隊來自鯤鵬與昇騰的原班人馬,是一家專注于算力基礎設施與服務的高科技企業(yè)。中科加禾的 SigInfer 模型推理引擎可以理解為是一個非常聰明的 “大腦助手”。它主要做的事情就是幫助各種人工智能模型快速、準確地 “理解” 和處理數(shù)據(jù),然后給出相應的結果或判斷。這個是昨天才發(fā)布的,但是兩家公司一個背靠華為一個背靠中科院,產品應該不會差,這里先備注一下。
產品優(yōu)勢生態(tài)兼容:全面兼容昇騰生態(tài),滿足本地化部署需求。
靈活配置:2節(jié)點起配,支持64并發(fā),可按需線性擴容。
性能定制:高性能推理引擎,支持靈活定制以實現(xiàn)領先推理性能。
開發(fā)加速:集成 AI Space 開發(fā)平臺,加速 AI 場景化持續(xù)創(chuàng)新。
技術支持:超100人的 FAE 團隊提供安裝部署及調優(yōu)技術支持。