回到云計算和 AI 服務提供商這邊,雖然面向企業(yè)賣 AI 理論上潛力巨大。但現實是每家客戶都有大量需要定制解決的需求,往往要投入眾多行業(yè)專家、算法架構師、軟硬件工程師來解決一些細小問題。這樣做出來的成果雖然可觀,但其實只具備案例性質,缺乏推廣可能。
另一方面,疫情導致美國 AI 行業(yè)創(chuàng)新緩慢,頭部公司算法突破不理想。同時歐美的 AI to B 市場凈值較高,客戶數字化能力較強。谷歌云、微軟云的崛起雖然都與 AI 息息相關,但適配的更多是大規(guī)模、分散式的企業(yè)軟件市場。反而中國市場中的 AI 目標用戶更多是政企、實體經濟企業(yè),需要一對一的 AI 能力與行業(yè)化的 AI 解決方案。
這種情況下,把 AI 技術推向高度工業(yè)化、標準化,就猛然間變成了中國科技界的獨立任務。雖然在 2019 年谷歌等頭部 AI 公司已經開始推動機器學習簡單化的相關技術,但其目標更多集中在所謂“AI 民主化”,而非今天中國云計算與 AI 廠商面向的大規(guī)模 AI 部署與工業(yè)級 AI 場景。
不夸張地說,低成本的 AI 工業(yè)化,已經成為目前中國 AI 產業(yè)的主線任務,但相關分析卻并不充沛。本文希望討論一下中國 AI 工業(yè)化這條賽道的幾種產品邏輯,以及代表案例、商業(yè)模型。由于各家廠商的命名方案與產品標準并不統(tǒng)一,為免誤會這里選擇隱去具體的廠商與技術名稱。但將相關技術邏輯帶入到幾家大廠,不難發(fā)現聚焦程度已經不低。
看過東野圭吾《神探伽利略》系列的朋友,可能對主角湯川學鐘愛速溶咖啡鐘愛印象深刻??此屏畠r、低端的速溶咖啡,其實凝結了噴霧干燥等 20 世紀初人類科學與工業(yè)能力的精髓。也正是速溶咖啡的出現,才讓咖啡大規(guī)模生產、運輸、存儲成為可能。
如果說,深度學習是人類發(fā)現了咖啡這種飲料;那么中國 AI 正在努力完成的,就是炮制出一杯進擊的速溶咖啡。
真正的咖啡時代,或許更可能開啟于后者。
對于大部分企業(yè)用戶來說,AI 提供的都是機器視覺、NLP 體系下的幾種固定能力?;谶@些能力衍生出企業(yè)的定制化變體復雜度很高。但有一種 AI 技術卻很容易與企業(yè)和行業(yè)的特殊需求進行適配,那就是知識圖譜。
知識圖譜的技術邏輯是將一些知識進行人為關聯,從而在調用 A 知識時驅動 B 知識,從而達成近乎“智能”的效果。這并不是多么新穎的技術,甚至早已機器學習誕生前,知識圖譜已經在很多領域有了廣泛應用。今天在搜索引擎和電商產品中的相關推薦功能,很大一部分都依靠知識圖譜來完成。
在 AI to B 的應用中,一個巨大問題在于企業(yè)處在特定行業(yè)里。每個行業(yè)不同的知識,或者說經驗,決定了應用 AI 的需求不同、成本各異。比如說,安防場景需要的 AI 識別,就和質檢場景大相徑庭。
因此一種新的 AI 產品服務模式,是技術供應商上升為行業(yè)信息化服務商,主動打造符合具體行業(yè)需求的知識圖譜產品。比如工業(yè)知識圖譜里可能包含分揀、質檢、產品流程等方方面面,當工業(yè)識別解決方案與之結合,AI 就不僅能夠完成單點任務,還可以依據行業(yè)知識圖譜完成一定程度的復雜需求,比如知識推理、知識預測等等。
類似的行業(yè)知識圖譜擁有廣泛的應用可能性,無論是在工業(yè)、能源這樣注重“經驗”的場景,還是金融、物流這樣看重“數據關系”的領域。另外,行業(yè)知識圖譜也可以幫助 AI 打入那些通識類算法難以奏效的行業(yè),比如說油氣勘探、生物醫(yī)藥等等。最重要的是,如果云計算廠商提供有效的行業(yè)知識圖譜服務,那么就可以免除一個個訂單去給企業(yè)做知識、經驗適配,從而降低人工成本。
但行業(yè)知識圖譜的問題在于,行業(yè)知識是一個非常抽象、難以標準化的版圖。每個行業(yè)有多少知識可以取公約數也是個問題。因此市面上的類似服務,都大體集中在金融、能源、工業(yè)質檢等幾個基礎板塊,難以細化到更具體、小眾的行業(yè)。并且行業(yè)知識圖譜已經極大改變了云計算、AI 供應商的角色,使其從算法等基礎能力提供商變成了行業(yè)咨詢、行業(yè)數字化解決方案提供商,這對商業(yè)模式和行業(yè)認可也提出了挑戰(zhàn)。
目前,與機器視覺、NLP 等基礎能力適配的行業(yè)知識圖譜,還是中國 AI 界獨一份的產業(yè)板塊。它能走到多遠,或許是接下來 AI 產業(yè)一個非常重要的發(fā)展指示物。
雖然蘇大強都知道手磨咖啡好喝,但讓每個人都去磨咖啡顯然不現實。速溶咖啡的價值也因此得到了確認。
這就像 AI 雖好,但每家企業(yè)都高價聘用算法架構師,花費大量時間做數據調優(yōu)、分類、提取也很不現實。為了解決這個問題,谷歌早在 2018 年就推出了 AutoML,也就是自動機器學習的相關工具。這類工具的基礎邏輯在于,盡量讓普通開發(fā)者,甚至不會寫代碼的 AI 應用者,都能通過按要求上傳圖片的方式生成固定的 AI 模型。這些模型雖然簡單,但勝在零門檻,低成本。大眾熟知的類似應用,可能就是以給明星換臉而出圈的 deepfake。當這東西被全球集體封殺,或許也側面證明了自動機器學習的威力。
隨著產業(yè)發(fā)展,自動機器學習也不再僅僅能做簡單的視頻處理。尤其隨著大廠的不斷投入,今天中國 AI 產業(yè)的自動機器學習平臺與工具,在能力的多元化與工業(yè)化上已經遠遠超過了谷歌等美國公司。廣義來看,從數據處理到數據特征提取,再到數據調參和訓練,幾乎每一個 AI 步驟都可以在今天找到一些辦法來進行自動或半自動簡化。而國內幾大相關廠商也推出了自動機器學習平臺的升級版,以此來提升復雜模型的開發(fā)效率,或者幫助進行行業(yè)化的 AI 落地。
在產業(yè)端,自動機器學習的最突出價值在于可以快速滲透那些缺乏 AI,甚至缺乏信息化基礎,同時也無法進行定制化服務的微型領域。比如說農業(yè)、醫(yī)療,甚至校園場景。即使缺乏 AI 能力甚至編程能力的個人開發(fā)者,也可以依靠自動機器學習平臺很快完成一個簡單 AI 模型的開發(fā),并且在手機、攝像頭等設備上完成部署。比如在一個案例中,農村扶貧干部可以依靠類似平臺快速開發(fā)一個識別房屋、果樹、農作物的軟件,從而加強扶貧工作標準化以及提升工作效率。
當然了,自動機器學習類軟件既然瞄準的是低門檻,那么問題也隨之產生。這類平臺的自動化能力,導致其往往難以處理復雜數據或者完成算法創(chuàng)新。而一旦給平臺加強更多技術能力,又容易變得更為專業(yè)復雜,不適配缺少技術能力的企業(yè)和開發(fā)者。其中的平衡點很難拿捏。
無論如何,近兩年我們在看到越來越多的工業(yè)級 AI 項目開始基于自動機器學習平臺來搭建,AI 開發(fā)的時間成本與人力成本也在極速下降。
這些真正面向解放生產力的升級,構成了中國 AI 的最佳風景。
說到工業(yè)級 AI,那么就不得不提 AI 應用的另兩個核心問題:數據量和訓練算力。
在工業(yè)、能源、金融、醫(yī)療這些行業(yè)中應用的 AI,需求特征是參數精度高、訓練數據需求量大。但問題也來了,一家傳統(tǒng)企業(yè)去哪搞那么多數據,又哪來的算力進行長時間、需要復雜調參優(yōu)化的模型訓練呢?
面對這個問題,業(yè)界也有個辦法。就是平臺提供預訓練模式,然而企業(yè)買回去進行二次加工,從而生成自己想要的 AI 能力。這個邏輯很容易理解,有點像買熟食回家再二次烹飪一下。家里人還是會夸你手藝好,誰又在乎前面 98% 的步驟都是在餐廳完成的呢?
在 AI 領域,這個用半成品再加工的邏輯被叫做遷移學習。其在大數據集訓練的預訓練模型上再完成小數據的遷移,最終在企業(yè)用戶時間、人力成本的基礎上,保證了模型的精度和使用效果。
大規(guī)模預訓練模型的邏輯很早就被提出,但近兩年在中國 AI 產業(yè)中開始不斷得到重視,形成了解決 AI 工業(yè)化的核心思路之一。一般來說,云計算企業(yè)會提供 NLP、機器視覺等主要品類的 AI 預訓練模型,或者重要行業(yè)、重要工作場景中的預訓練模型,供企業(yè)下載部署。一方面以此帶動企業(yè)用云量,另一方面還可以衍生出更多的智能化解決方案服務。
預訓練模型這個領域的競爭主要集中在兩個方向:
最典型的預訓練模型應用場景,應該是工業(yè)巡檢、質檢等領域。這些領域的絕大部分數據精度要求都是一樣的,就是識別能力的精準度。這個可以在云計算廠商進行大數據預訓練。而廠商到底是要識別劃痕還是識別污垢,就可以回到廠里進行遷移訓練來搞定。
最后說說問題,預訓練模型目前還更多屬于云計算廠商提供的附加產品,不像基礎 AI 算法一樣有穩(wěn)定的市場空間。究竟其前景如何還有待檢驗。另外預訓練模型雖然比較受企業(yè)用戶的歡迎,但商業(yè)模式還有待探索,給供應商帶來的實際價值不太清晰。
當中國 AI 走到 2021,工業(yè)級、產業(yè)級成為了三句不離口的關鍵詞。但真正具備工業(yè)化特征的 AI,其實就像齒輪、軸承、鋼筋一樣,是標準化、規(guī)模化、低成本的產物,而不是某種美好的智能魔法。
中國 AI 開始大面積擁抱工業(yè)化、流程化、標準化,也許將構成一個交叉點。這條賽道上的 AI,不那么受資本關注,理論上更接近企業(yè) IT 而非傳統(tǒng)意義上的 AI 生態(tài),至少一點也不極客,不夠酷炫。
但這條路很重要,或者可以說是全球 AI 產業(yè)的一個拐點。尤其重要的是,中國 AI 的前景,不能一直被美國 AI 的上限所制約。行業(yè)知識圖譜、自動機器學習這些東西其實都發(fā)源于美國,但在應用化、平臺化和標準化上,美國 AI 并沒有中國業(yè)界來的干脆有力度。
至少在今天看來,沉默前行的 AI 工業(yè)化是一條孤獨的路。