VLDB(International Conference on Very Large Data Bases)是數(shù)據(jù)庫三大國際頂級學(xué)術(shù)會議之一,設(shè)有研究(Research Track)、工業(yè)(Industrial Track)等方向。每年入選VLDB的成果對于推動數(shù)據(jù)驅(qū)動決策、智能系統(tǒng)演進(jìn)、應(yīng)用創(chuàng)新等具有重要意義,在計算機(jī)科學(xué)和產(chǎn)業(yè)實踐中均產(chǎn)生了深遠(yuǎn)影響。
VLDB至今已舉辦至第49屆。今年,清華、北大、MIT、蘇黎世聯(lián)邦理工學(xué)院等科研院所,以及阿里、字節(jié)、谷歌、AWS等科技公司,均有論文成果入選VLDB。阿里云、達(dá)摩院及合作方共有17篇文章入選VLDB,在中國企業(yè)中排名第一;其中,全部作者均來自阿里云的7篇論文入選工業(yè)賽道,在全球企業(yè)中拔得頭籌。
大會現(xiàn)場,李飛飛受特邀發(fā)表主旨演講《Modernization of Databases in the Cloud Era: Building Databases that Run Like Legos》,他表示 ,云計算的成熟與AI技術(shù)的發(fā)展,給數(shù)據(jù)庫架構(gòu)更新帶來了新機(jī)遇:“以阿里云瑤池數(shù)據(jù)庫的最佳實踐為例,PolarDB通過存儲-內(nèi)存-計算三層解耦,可實現(xiàn)極致Serverless能力,并支持客戶按需增加行級多主多寫、HTAP、密態(tài)計算等多項核心能力,就像搭樂高積木一樣方便、高效。同時,AI技術(shù)的發(fā)展為云原生數(shù)據(jù)庫注入了全新的智能化潛力,可更好滿足用戶多樣化的新需求?!?/p>
阿里云論文《PolarDB-SCC: A Cloud-Native Database Ensuring Low Latency for Strongly Consistent Reads》入選了本次VLDB工業(yè)賽道。實現(xiàn)從庫的強(qiáng)一致性,一直以來都是數(shù)據(jù)庫業(yè)內(nèi)難以突破的技術(shù)難題。阿里云論文提出了一種全新的數(shù)據(jù)庫架構(gòu):利用RDMA的多種算子,全面重構(gòu)了主-從節(jié)間的數(shù)據(jù)通信模式,并通過追蹤細(xì)粒度的數(shù)據(jù)修改以及新的時間戳方案設(shè)計,融合基于時間序的新一代事務(wù)系統(tǒng),在業(yè)務(wù)無感知的情況下實現(xiàn)了高性能全局一致性讀。目前,該架構(gòu)已在PolarDB上線,極大滿足客戶對于高性能一致性的海量需求。
在研究賽道中,阿里云與達(dá)摩院合作的論文《CatSQL: Towards Real World Natural Language to SQL Applications》,介紹了自研的自然語句轉(zhuǎn)可執(zhí)行SQL語句(NL2SQL)技術(shù)——CatSQL,幫助非專業(yè)人士更好實現(xiàn)數(shù)據(jù)庫的專業(yè)應(yīng)用。CatSQL創(chuàng)新地融合了傳統(tǒng)的編譯原理技術(shù)和最新的深度模型技術(shù),可在理解語義的基礎(chǔ)上保障語法的正確性,并通過領(lǐng)域知識配置和高效的微調(diào)技術(shù),將專域場景的準(zhǔn)確率提升到80%以上。據(jù)了解,CatSQL已在阿里云PolarDB等產(chǎn)品中落地使用。
當(dāng)前,以阿里云為代表的中國科技企業(yè),正在成為引領(lǐng)全球數(shù)據(jù)庫技術(shù)創(chuàng)新的中堅力量。過去幾年,阿里巴巴有近80篇論文成果被國際數(shù)據(jù)庫頂級會議和期刊收錄,研究范圍覆蓋云原生、智能化、HTAP、安全可信等前沿方向,數(shù)量居中國企業(yè)第一。今年,阿里云聯(lián)合浙江大學(xué)斬獲2023 SIGMOD最佳論文獎,該獎項歷史上首次頒給完全來自中國大陸的科研團(tuán)隊,相關(guān)成果已率先應(yīng)用在PolarDB等云原生數(shù)據(jù)庫產(chǎn)品中。