基于當前大模型技術發(fā)展現(xiàn)狀,中國電子云認為構建一個好用的大模型應該具備以下幾個建設思路:
◆ 應用場景滿足度高;
◆ 可通過數(shù)據(jù)飛輪讓大模型持續(xù)給業(yè)務提供價值;
◆ 通過L1大模型+場景小模型高效解決實際問題;
◆ 推理引擎和芯片深度優(yōu)化,提升應用落地的性價比。
為實現(xiàn)以上四個目標,中國電子云聯(lián)合天數(shù)智芯、清程極智從芯片、AI-Infra(智能基礎設施)、模型、工具鏈、應用5個層面進行了布局優(yōu)化。
在芯片層面,天數(shù)智芯與中國電子云通用芯片對大模型算子的指令集、矩陣乘、片上緩存以及流水線進行了深度優(yōu)化,充分發(fā)揮通用架構在靈活性、兼容性與擴展性上的優(yōu)勢。通過軟硬協(xié)同,顯著提升訓推效率與資源利用率,目前在同等并發(fā)情況下,芯片成本可以下降15%;
AI-Infra:中國電子云聯(lián)合清程極智推出并行加速框架以及AI編譯器,并協(xié)助芯片廠商對通信庫以及芯片編程語言進行了優(yōu)化,在不損失精度前提下,極致優(yōu)化推理效率,在同等硬件配置下,并發(fā)提升10倍以上,響應延遲降低50%;
在模型、工具鏈及應用層面:中國電子云主導設計了最優(yōu)的匹配方案,中國電子云L1模型相比業(yè)界的SOTA模型冷啟動時間縮短至1天,冷啟動的效果提升20%以上;并提供系統(tǒng)級的支撐優(yōu)化,模型開發(fā)時間可縮短了70%;使得黨政及關鍵行業(yè)用戶可通過中國電子云提供的工具平臺構建相應的智能體應用。
中國電子云聯(lián)合天數(shù)智芯以及清程極智芯片和訓推引擎的整體優(yōu)化,實現(xiàn)了在分布式訓練場景下加速效果接近2倍,推理吞吐量提升10倍,單機硬件成本下降10%以上。
當前,中國電子云已經構建了端到端的AI解決方案,中國電子云的大模型應用是基于異構算力平臺、模型開發(fā)平臺、大模型應用平臺構建。其中算力平臺支持異構算力的統(tǒng)一調度與管理。模型開發(fā)平臺、大模型應用平臺通過各種工具加速智能體應用的生產,上層應用分為通用應用和行業(yè)應用,通用主要解決客戶跨行業(yè)的通用需求,行業(yè)應用主要是針對具體的行業(yè),需要深入行業(yè),了解行業(yè)know-how和行業(yè)的知識才能構建的應用。
目前,中國電子云AI解決方案已經成功在石家莊、天津紅橋、湖北江陵、南航、湖北機場集團、深圳龍崗城投集團、山東公用集團等政企行業(yè)客戶進行了落地應用。未來,中國電子云將深化AI技術與解決方案在千行百業(yè)落地應用,助力千行百業(yè)向“全要素、全流程、全場景”智能化邁進