相比上一代模型,Qwen-Max在訓練中使用了更多的訓練數(shù)據(jù)、更大的模型規(guī)模、更強的人類對齊,最終達到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個權威基準上,Qwen-Max表現(xiàn)接近GPT-4o,數(shù)學能力、代碼能力則超越了GPT-4o。數(shù)學和代碼所代表的推理能力是大模型智能水平的最重要體現(xiàn)。

語言模型方面,Qwen2.5開源了7個尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它們在同等參數(shù)賽道都創(chuàng)造了業(yè)界最佳成績,型號設定充分考慮下游場景的不同需求,3B是適配手機等端側設備的黃金尺寸;32B是最受開發(fā)者期待的“性價比之王”,可在性能和功耗之間獲得最佳平衡,Qwen2.5-32B的整體表現(xiàn)超越了Qwen2-72B。

重磅開源Qwen2.5,性能超越Llama座

通義千問新一代開源模型Qwen2.5中的旗艦模型Qwen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。Qwen2.5全系列涵蓋多個尺寸的大語言模型、多模態(tài)模型、數(shù)學模型和代碼模型,每個尺寸都有基礎版本、指令跟隨版本、量化版本,總計上架100多個模型,刷新業(yè)界紀錄。

Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進行預訓練,相比Qwen2,整體性能提升18%以上,擁有更多的知識、更強的編程和數(shù)學能力。Qwen2.5-72B模型在MMLU-rudex基準(考察通用知識)、MBPP 基準(考察代碼能力)和MATH基準(考察數(shù)學能力)的得分高達86.8、88.2、83.1。

Qwen2.5支持高達128K的上下文長度,可生成最多8K內(nèi)容。模型擁有強大的多語言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語言。模型能夠絲滑響應多樣化的系統(tǒng)提示,實現(xiàn)角色扮演和聊天機器人等任務。在指令跟隨、理解結構化數(shù)據(jù)(如表格)、生成結構化輸出(尤其是JSON)等方面Qwen2.5都進步明顯。

通義萬相全面升級,全新視頻生成模型發(fā)布

同日,可生成影視級高清視頻的通義萬相全面升級,在影視創(chuàng)作、動畫設計、廣告設計等領域大顯身手。即日起,所有用戶可通過通義APP及通義萬相官網(wǎng)免費體驗。

據(jù)介紹,通義萬相首批上線文生視頻、圖生視頻功能,在文生視頻功能中,用戶輸入任意文字提示詞,即可生成一段高清視頻,支持中英文多語言輸入,并可以通過靈感擴寫功能智能豐富視頻內(nèi)容表現(xiàn)力,支持16:9、9:16等多種比例生成;在圖生視頻功能中,支持用戶將任意圖片轉化為動態(tài)視頻,按照上傳的圖像比例或預設比例進行生成,同時可以通過提示詞來控制視頻運動。

現(xiàn)場,阿里云演示了該模型強大的運動生成和概念組合能力,輸入「穿著滑冰鞋的小兔子在冰面上靈活移動的可愛場景」,通義萬相僅用數(shù)分鐘就能生成一段高清、逼真的視頻。

通義萬相視頻生成大模型集成了多項創(chuàng)新技術,有效解決畫面表現(xiàn)力和大幅度運動等視頻生成技術難題。針對運動生成和物理模擬等難點優(yōu)化算法,實現(xiàn)了大幅度主體運動和運鏡控制,并有效模擬真實世界物理特性;設計了高壓縮比、高質(zhì)量視頻VAE框架,有效降低視頻信息冗余,并保持高質(zhì)量視頻重構能力;同時,基于輕量微調(diào)框架和精選數(shù)據(jù)集優(yōu)化訓練,在中式傳統(tǒng)元素、風格化視頻生成上表現(xiàn)更好。

去年7月,通義萬相圖像生成大模型首次亮相,目前已累計生成7500萬張圖片。云棲大會現(xiàn)場,通義萬相宣布視覺生成大模型全面升級為Diffusion Transformer框架,同時結合通義千問復雜提示詞解釋能力,有效提升畫面表現(xiàn)力、語義理解能力、可控生成能力。隨著通義萬相視頻生成模型的發(fā)布,通義大模型已覆蓋文本生成、圖像理解、視頻理解、音頻理解、圖像生成、視頻生成等全模態(tài)場景。

通義靈碼AI編程能力再進化,說幾句話就能開發(fā)網(wǎng)頁

隨著通義大模型能力的全面提升,阿里云通義靈碼迎來重磅升級,從一年前只能完成基礎的輔助編程任務,進化到幾句話就能完成需求理解、任務拆解、代碼編寫、修改BUG、測試等開發(fā)任務,最快幾分鐘可從0到1完成應用開發(fā),提升數(shù)十倍開發(fā)效率。

自去年首次亮相以來,通義靈碼已入職中華財險、哈啰集團、長安汽車等公司,累計生成代碼超10億行,是國內(nèi)最受歡迎的輔助編程工具。全新升級的通義靈碼模擬了人類程序員的能力,可完成更復雜、更全面的任務;通義靈碼還可以脫離專業(yè)IDE軟件,在web端直接執(zhí)行缺陷修改、需求分析、代碼實現(xiàn)、問題排查等任務工作流,兼具架構師、開發(fā)工程師、測試工程師等多種崗位技能,大幅縮短了應用的開發(fā)周期。

例如,真人程序員手動開發(fā)一個網(wǎng)頁,通常需要1天的時間完成需求分解、寫代碼、測試等任務;現(xiàn)在,人類只需要輸入需求,通義靈碼5分鐘就能完成整個過程。阿里云表示,未來只要有創(chuàng)意,不懂代碼也能開發(fā)應用和軟件。

大會現(xiàn)場,一位13歲的中學生在通義靈碼上輸入幾句話,2分鐘就生成了一個python語言編寫的倒計時網(wǎng)頁;現(xiàn)場還有參會者,用通義靈碼修改開源魂斗羅游戲代碼,在9個代碼文件2000多行代碼里,幾分鐘就精準修改了游戲角色的生命值、跳躍高度等參數(shù)。

目前,通義靈碼已廣泛應用于金融、制造、互聯(lián)網(wǎng)、交通、汽車、能源等行業(yè)。在 Gartner 首個AI代碼助手魔力象限報告中,阿里云成為唯一進入挑戰(zhàn)者象限的中國科技公司。

三款主力模型再次降價

繼5月首次大幅降價后,阿里云百煉平臺上的三款通義千問主力模型再次降價。Qwen-Turbo價格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。其中,Qwen-Plus推理能力追平GPT4,可應用于復雜任務,是效果、速度及成本均衡的最優(yōu)選擇,降價后,Qwen-Plus性價比達到業(yè)界最高,同等規(guī)模較行業(yè)價格低84%。同時,阿里云百煉平臺還為所有新用戶免費贈送超5000萬tokens及4500張圖片生成額度。

自首次宣布降價后,阿里云百煉付費客戶數(shù)較上一個季度增長超過200%,大批企業(yè)和開發(fā)者放棄私有化部署,選擇直接在百煉上調(diào)用各類AI大模型。目前,阿里云百煉已服務超30萬客戶,包括一汽、金山、獵聘、哈啰集團、國家天文臺等眾多知名企業(yè)和機構。本次通義第二輪降價,將繼續(xù)提升AI在各行各業(yè)的滲透率。

分享到

xiesc

相關推薦