第三個是類似圖數據庫所處理的圖譜數據的檢索和查詢。
一句話,數據類型是多種多樣,所謂業(yè)務創(chuàng)新就是對不同類型數據進行組合、挖掘和使用。
接下來的問題,我們采用什么樣工具或者手段來使用這些數據。
大模型會是我們的手段嗎?現在一種流行的說法是:一切盡在大模型,大模型解決一切問題。但是對于企業(yè)而言,數據就是企業(yè)的財富,安全性是首要的問題。大模型與企業(yè)數據的結合,或者企業(yè)訓練大模型,都是比較復雜的問題。這就是從應用層面解決數據的問題,這會比較復雜,需要專業(yè)人才和經驗。
另外一種使用數據的方法就是Oracle Database 23ai的用法,簡單說就是結合了大模型的融合數據庫的用法,也可以簡單立即為用SQL對各種數據進行組合和查詢,用SQL查詢向量數據、JSON數據,以及各種圖譜數據,各種方式的組合查詢。不同方式的組合查詢需求,會支撐起不同的業(yè)務應用和需求。如果不會用SQL怎么辦?在這里大模型就派上了用場,你可以使用自然語言,大模型會幫助你生成SQL。
Oracle Database 23ai中的大模型生成SQL,SQL生成數據或者說找到數據,數據創(chuàng)造價值,是不是非常符合中國道教“一生二,二生三,三生萬物”的思想。Oracle Database 23ai就給我們帶來了這樣的一種思路。
簡單說,就是一個數據庫解決各種數據創(chuàng)新使用的需求,這個就是所謂融合數據庫。
除此之外,還有很多使用中的具體問題需要解決,如SQL的安全性問題,防范未經授權的 SQL以及SQL 注入攻擊;如數據主權所要求的數據本地駐留的問題,確保數據在本地,同時公開給多個應用使用的問題;如利用內存高速緩存數據中間層的問題,……,這些都是具體應用場景中使用時遇到的問題。
在最新發(fā)布的Oracle Database 23ai中,提供超過 300 個新功能。
據甲骨文公司中國區(qū)技術咨詢部高級總監(jiān)李珈介紹,這些功能可以分為三類:面向數據的 AI、關鍵任務數據、面向應用的加速開發(fā)。其中,用戶可以重點關注Oracle AI Vector Search、Oracle Exadata System Software 24ai、OCI GoldenGate 23ai、JSON Relational Unification、Graph Relational Unification、Oracle Globally Distributed Database with RAFT、Oracle True Cache,以及In-Database SQL Firewall。這些功能對應以上所說的數據,以及數據的使用。
我認為最有價值的就是Database 23ai 引入的AI Vector Search,這不僅僅是一項強大的新技術,幫助用戶利用新一代 AI 模型來生成和存儲向量,更重要的是這個向量數據是跟原有的Oracle數據庫里面存儲的業(yè)務數據放在一個數據庫里面。這些向量是文檔、圖像、視頻、聲音等的多維表示。通過將這些對象編碼為向量,用戶可以使用數學計算來查找它們之間的相似性。Oracle新的向量函數可以利用數據庫能力直接生成向量數據,Oracle Database 的關鍵任務功能可以與 AI 向量透明地協(xié)同工作,即使是非常關鍵的任務應用,用戶也可以運行 AI Vector Search。通過在同一高性能數據庫中存儲和處理業(yè)務和向量數據,用戶可以將 AI Vector Search 無縫集成到現有業(yè)務應用中,實現新的創(chuàng)新 AI 使用場景,并且不會影響數據安全性。這樣無須移動數據,無須把數據提供給一些專門做AI數據處理的第三方,客戶在自己的數據庫上就可以采用AI能力,直接用SQL來實現,大大加速了AI應用的落地。
這是一個大模型備受關注的時代,如何使行業(yè)業(yè)務應用快速對接大模型技術,Oracle Database 23ai給我們做出了示范的同時,也帶給我們了一種使用數據的方法。
殊途同歸!哪個簡單,就用哪一個!