共 134 篇文章
標(biāo)簽:大模型 第3頁(yè)

導(dǎo)讀 3月27日,由上海市計(jì)算機(jī)學(xué)會(huì)指導(dǎo),DOIT傳媒主辦,算力豹、百易存儲(chǔ)研究院、CXL技術(shù)應(yīng)用俱樂(lè)部、上海市計(jì)算機(jī)學(xué)會(huì)存儲(chǔ)技術(shù)專(zhuān)委會(huì)、上海交通大學(xué)計(jì)算機(jī)系支持的“2025人工智能基礎(chǔ)設(shè)施峰會(huì)”在上海龍之夢(mèng)萬(wàn)麗酒店盛大召開(kāi)。在...

導(dǎo)讀 2025年3月26日 | 科技前沿 北京時(shí)間今日凌晨,全球AI領(lǐng)域迎來(lái)“雙響炮”——OpenAI與谷歌幾乎同步發(fā)布重磅模型更新,前者推出GPT-4o圖像生成功能,后者則祭出號(hào)稱“最強(qiáng)推理模型”的Gemini Pro...

導(dǎo)讀 當(dāng)千億參數(shù)模型從實(shí)驗(yàn)室走向產(chǎn)業(yè)主戰(zhàn)場(chǎng),一場(chǎng)關(guān)乎效率與成本的“開(kāi)發(fā)馬拉松”正在上演。在2025年這個(gè)AI大模型爆發(fā)元年,千億參數(shù)模型已從實(shí)驗(yàn)室走向產(chǎn)業(yè)落地。然而,開(kāi)發(fā)者正面臨訓(xùn)練周期長(zhǎng)、算力成本高、調(diào)試復(fù)雜的“三重困境” 在這樣的背景下...

2025年3月24日,傳神語(yǔ)聯(lián)A紀(jì)元系列線上發(fā)布活動(dòng)的第一天,傳神語(yǔ)聯(lián)重磅發(fā)布任度雙腦深度思考大模型-T1(以下簡(jiǎn)稱任度大模型-T1),為大模型領(lǐng)域貢獻(xiàn)了又一創(chuàng)新性成果。 那么,你或許會(huì)好奇,在大模型層出不窮的今天,傳神語(yǔ)聯(lián)為什么還執(zhí)著于推...

導(dǎo)讀 在人工智能狂飆突進(jìn)的今天,神經(jīng)網(wǎng)絡(luò)模型的規(guī)模已突破千億參數(shù)門(mén)檻,訓(xùn)練過(guò)程中所需的內(nèi)存消耗呈指數(shù)級(jí)增長(zhǎng)。以GPT-4為代表的多模態(tài)大模型,其訓(xùn)練內(nèi)存需求甚至超過(guò)1000GB。然而,GPU顯存容量受制于物理芯片規(guī)格,傳統(tǒng)訓(xùn)練方法面臨“內(nèi)存...

3月21日,騰訊宣布推出自研深度思考模型混元T1正式版,目前已上線騰訊云官網(wǎng),并即將在騰訊元寶灰度上線。 該模型以騰訊于 2 月底發(fā)布的新一代快思考模型混元Turbo S為基座打造,是一款能秒回、吐字快、擅長(zhǎng)超長(zhǎng)文處理的強(qiáng)推理模型...

導(dǎo)讀 2025年3月17日,由圖靈獎(jiǎng)得主、Meta首席AI科學(xué)家楊立昆(Yann LeCun)領(lǐng)銜發(fā)起的國(guó)際權(quán)威大模型評(píng)測(cè)榜單LiveBench公布了最新一期結(jié)果,全球大模型格局再次迎來(lái)洗牌。? ? 阿里巴巴最新開(kāi)源的推理模型通義千問(wèn)QwQ...

AI 存儲(chǔ)廠商焱融科技宣布,其自主研發(fā)的分布式文件存儲(chǔ)系統(tǒng) YRCloudFile 已成功支持大模型推理場(chǎng)景的 KV Cache 特性,為 AI 推理帶來(lái)顯著價(jià)值提升。KV Cache 通過(guò)高效緩存機(jī)制加速數(shù)據(jù)讀取,顯著提升推理性能,突破 ...

導(dǎo)讀 3月16日,百度宣布正式發(fā)布文心大模型4.5及文心大模型X1,在文心一言官網(wǎng)即可免費(fèi)使用這兩款大模型。 此前,百度曾宣布文心一言將于4月1日免費(fèi)。在最新發(fā)布兩款大模型的同時(shí),為全面提升用戶體驗(yàn),百度將免費(fèi)時(shí)間提前。 文心4.5是多模態(tài)...

在不少人眼中,亞信科技仿佛“一夜之間”轉(zhuǎn)型成為了一家大模型交付公司。 始于1993年,2018年12月19日在香港聯(lián)交所主板上市的亞信科技控股有限公司(01675.HK),是一家領(lǐng)先的數(shù)智化全棧能力提供商。本輪人工智能市場(chǎng)爆發(fā)之前,亞信科技...