(圖片說明:SkySense在17項評測中均超過國際上最新的遙感模型)

隨著人工智能的發(fā)展,大模型技術與衛(wèi)星遙感技術相結合產(chǎn)生了新突破。SkySense是螞蟻集團基于螞蟻百靈大模型平臺能力開發(fā)的多模態(tài)遙感模型。

SkySense在總計17項國際權威公開數(shù)據(jù)集進行了測評,其測試任務類型包括了土地利用監(jiān)測、高分辨率目標識別、地物變化檢測等7種常見遙感感知任務,并與國際上已發(fā)布的包括IBM和NASA聯(lián)合研發(fā)的Prithvi等共18個全球主流同類模型做了測試結果比較。數(shù)據(jù)顯示,17項測評中SkySense均名列第一。譬如,在國際高清遙感地物檢測榜單FAIR1M 2.0中,SkySense平均精度(mAP)領先第二名超3%。

在剛剛公布的CVPR2024論文入選結果上,SkySense的研究成果亦被收錄。CVPR是由IEEE舉辦的計算機視覺和模式識別領域的頂級會議,是國際計算機視覺三大頂會之一。

傳統(tǒng)的遙感影像理解技術,往往側重于針對單一模態(tài)單一任務建模,缺乏對多模態(tài)數(shù)據(jù)、時間序列、地理先驗知識的綜合建模和利用,限制了其在海量數(shù)據(jù)和多種任務中的泛化能力。SkySense突破以上技術瓶頸,實現(xiàn)了文本、紅外光、可見光、SAR雷達多種模態(tài)、多分辨率的時序遙感影像建模,在多樣化的任務中展現(xiàn)出優(yōu)異性能。在螞蟻百靈大模型多模態(tài)能力支持下,研發(fā)人員基于內部構建的19億遙感影像數(shù)據(jù)集進行預訓練,得到了20.6億參數(shù)量的模型SkySense,這也是迄今為止國際上參數(shù)規(guī)模最大、覆蓋任務最全、識別精度最高的多模態(tài)遙感大模型。SkySense可廣泛應用于城市規(guī)劃、森林保護、應急救災、綠色金融、農業(yè)監(jiān)測等重要領域,目前通過螞蟻內部MEarth平臺提供數(shù)據(jù)與識別服務。

據(jù)了解,螞蟻集團正在計劃開放Skysense模型參數(shù),與行業(yè)共建,促進智能遙感技術與應用發(fā)展。

SkySense由螞蟻AI創(chuàng)新研發(fā)部門NextEvo與武漢大學聯(lián)合研發(fā)。NextEvo是螞蟻AI核心技術研發(fā)團隊,主導了螞蟻百靈大模型的研發(fā)工作,其研發(fā)方向涉及CV、NLP、多模態(tài)、AIGC、數(shù)字人、AI工程化等核心技術。去年,該部門升級了多模態(tài)團隊,由楊銘帶隊全面布局多模態(tài)技術。楊銘美國西北大學博士,F(xiàn)acebook AI Research (FAIR)創(chuàng)始成員,去年加入螞蟻集團,先后就職于NEC美國實驗室、FAIR、地平線機器人公司,是世界知名計算機視覺研究專家。

目前,螞蟻集團多模態(tài)研究成果已應用于支付寶五福節(jié)AI大規(guī)模互動、螞蟻醫(yī)療數(shù)字人等場景。

分享到

xiesc

相關推薦