數(shù)據(jù)庫是事關(guān)國計(jì)民生的基礎(chǔ)軟件技術(shù),數(shù)據(jù)庫技術(shù)的更新影響著數(shù)字時(shí)代的千行百業(yè),其中一個(gè)前沿領(lǐng)域即是數(shù)據(jù)庫智能化(AI4DB,AI for Database)?,F(xiàn)在的數(shù)據(jù)庫系統(tǒng)非常復(fù)雜,對穩(wěn)定性要求極高,即便將單一AI算法與單一數(shù)據(jù)庫作匹配調(diào)試,也需要雙方工程師緊密配合數(shù)周甚至數(shù)月,效率低、效果差,導(dǎo)致業(yè)界遲遲無法將日新月異的AI算法應(yīng)用到數(shù)據(jù)庫中。
針對這一難題,阿里云提出了新解法:通過在數(shù)據(jù)庫和AI系統(tǒng)級抽象和通用化模塊及接口定義,研發(fā)出一個(gè)全新的中間件系統(tǒng)平臺PilotScope,讓AI算法在數(shù)小時(shí)乃至數(shù)分鐘內(nèi)在數(shù)據(jù)庫內(nèi)實(shí)現(xiàn)“一鍵部署”。VLDB評議認(rèn)為,PilotScope基于應(yīng)用場景開創(chuàng)性的系統(tǒng)設(shè)計(jì),將開啟數(shù)據(jù)庫智能化的全新方向。
據(jù)了解,PilotScope針對參數(shù)調(diào)優(yōu)、索引推薦、基數(shù)估計(jì)、查詢優(yōu)化等數(shù)據(jù)庫主流任務(wù),預(yù)置了10多種AI算法,并完成PostgreSQL和Spark等兩大主流開源數(shù)據(jù)庫的適配打樣。實(shí)驗(yàn)數(shù)據(jù)顯示,使用PilotScope將AI算法嵌入數(shù)據(jù)庫,較傳統(tǒng)“硬植入”方法,查詢優(yōu)化等任務(wù)提速1到2倍不等,且PilotScope本身對部署產(chǎn)生的額外代價(jià)基本可忽略,表現(xiàn)突出。
“PilotScope就像個(gè)數(shù)據(jù)庫AI‘超級管理員’,通過這一平臺,AI工程師只需專注于設(shè)計(jì)通用算法,可實(shí)現(xiàn)對不同數(shù)據(jù)庫的部署和應(yīng)用;而數(shù)據(jù)庫使用者可像調(diào)用API那樣,方便又高效地用上AI?!痹擁?xiàng)目負(fù)責(zé)人朱鎔介紹說,PilotScope對數(shù)據(jù)庫“零侵入”,并設(shè)計(jì)了智能檢測、回退、隔離等機(jī)制,降低AI幻覺風(fēng)險(xiǎn),在確保數(shù)據(jù)庫穩(wěn)定性的前提下實(shí)現(xiàn)智能化提升。
目前,PilotScope已在阿里云內(nèi)部展開試點(diǎn)應(yīng)用,相關(guān)技術(shù)也通過GitHub及Modelscope魔搭社區(qū)對外免費(fèi)開源。
據(jù)了解,VLDB是數(shù)據(jù)庫三大國際頂級會議之一,每年僅收錄在學(xué)術(shù)界和產(chǎn)業(yè)實(shí)踐中產(chǎn)生重要影響的新成果,是權(quán)威的數(shù)據(jù)庫技術(shù)風(fēng)向標(biāo)。第50屆VLDB大會預(yù)計(jì)于2024年8月在中國廣州舉辦。
——————
附開源地址:
https://github.com/alibaba/pilotscope