三年三變化,引領AI數(shù)據(jù)服務市場新變革

云測數(shù)據(jù)參加服貿(mào)會的三次重大成果發(fā)布,可以說是云測數(shù)據(jù)不斷深入市場動態(tài)趨勢,積累技術經(jīng)驗后對外提交的三次行動“答卷”。莊子《齊物論》中有“論而不議,議而不辯”一說,代表不同階段做該做的事,將它放到AI數(shù)據(jù)服務市場也許同樣適用。

起初,AI數(shù)據(jù)服務經(jīng)歷了從小作坊到規(guī)?;a(chǎn),從實驗室到實際場景的變革,由于企業(yè)需要更多的高質量數(shù)據(jù)作為“底層”燃料進行訓練和部署機器學習模型,高質量數(shù)據(jù)在一定程度上甚至決定了項目的成敗。云測數(shù)據(jù)在早期就已關注到AI數(shù)據(jù)服務的需求缺口和潛在的應用市場,立足高質量、場景化的AI訓練數(shù)據(jù)服務,對AI數(shù)據(jù)的質量、效率、場景化方面提出高要求,致力于推動數(shù)據(jù)標椎質量的進一步發(fā)展。

2020年的服貿(mào)會上,云測數(shù)據(jù)首次對外宣布其AI數(shù)據(jù)項目交付精準度最高達到99.99%,是當時數(shù)據(jù)標注領域可達到的最高服務標準。與此同時,云測數(shù)據(jù)還發(fā)布了智慧城市、智能家居、智能駕駛、智慧金融等不同行業(yè)的AI訓練數(shù)據(jù)服務方案。

接下來,當企業(yè)獲取了高質量數(shù)據(jù),如何管理數(shù)據(jù)資產(chǎn),針對其特定場景更好地發(fā)掘數(shù)據(jù)價值成為AI產(chǎn)業(yè)化的難題。比如在訓練過程中,規(guī)?;臄?shù)據(jù)資產(chǎn)往往出現(xiàn)無法充分利用、管理方式不完備等問題。

于是云測數(shù)據(jù)從助力企業(yè)進行數(shù)據(jù)管理,提升數(shù)據(jù)訓練的匹配度角度出發(fā),專注AI訓練數(shù)據(jù)全生命周期進程,形成了一套完整的數(shù)據(jù)服務實踐方法論,并在2021年的服貿(mào)會上正式發(fā)布了“AI數(shù)據(jù)集管理系統(tǒng)”,支持數(shù)據(jù)的上傳、管理、存儲、分享還有數(shù)據(jù)類型標簽化管理,標注結果存儲和可視化呈現(xiàn),幫助企業(yè)可持續(xù)管理、挖掘AI數(shù)據(jù)價值,助力企業(yè)快速開展模型訓練,完成對應的數(shù)據(jù)流轉閉環(huán)。

2022年,從AI工程化數(shù)據(jù)處理三大趨勢看新一代數(shù)據(jù)解決方案

數(shù)據(jù)集管理既成體系,隨著AI技術與產(chǎn)業(yè)的深度融合,需要進一步關注產(chǎn)品的迭代進程,加速AI產(chǎn)業(yè)化。行業(yè)的AI產(chǎn)品迭代過程通常是算法研發(fā)流程,然后嵌入到軟件工程里完成對應的聯(lián)調測試、灰度發(fā)布再發(fā)布到實際生產(chǎn)環(huán)境中去使用,通過在生產(chǎn)環(huán)境中持續(xù)回流的線上數(shù)據(jù)和用戶反饋進行產(chǎn)品迭代,與此同時再用相應數(shù)據(jù)進行算法模型的持續(xù)調優(yōu)。

其中數(shù)據(jù)處理伴隨研發(fā)迭代,并基于對數(shù)據(jù)需求不同分為三個階段——算法預研期,針對何種具體場景解決方案進行相關算法探索,這一階段下需要開源數(shù)據(jù)集和商業(yè)成品數(shù)據(jù)集幫助企業(yè)快速完成產(chǎn)品驗證。

第二階段是在算法研發(fā)期,企業(yè)明確了處理的場景和對傳感器算力的需求,需要基于定制化場景和對應傳感器進行相關數(shù)據(jù)采集、清洗和標注服務。

第三階段則是算法持續(xù)優(yōu)化期。企業(yè)擁有了相對完整的數(shù)據(jù)模型,這時需要的數(shù)據(jù)偏向支持持續(xù)集成和迭代算法的數(shù)據(jù)即MLOps(人工智能研發(fā)運營一體化)所需要的數(shù)據(jù),引入類似軟件DevOps的概念。

而第三階段的數(shù)據(jù)需求變化意味著傳統(tǒng)軟件工程的瀑布式開發(fā)逐漸轉化為數(shù)據(jù)的持續(xù)流轉,通過體系、流程推動算法與應用的有效開發(fā)和迭代,實現(xiàn)AI的敏捷開發(fā),即實現(xiàn)AI工程化。

賈宇航還指出了AI工程化數(shù)據(jù)處理的三大特征——API協(xié)同中臺化,支持與不同企業(yè)數(shù)字底座無縫對接;專業(yè)的人工處理流程,隨著AI融入更多行業(yè)應用,其處理內(nèi)容也變得越來越復雜,需要專業(yè)人員進行高時效、高質量的人工處理流程;還有就是數(shù)據(jù)安全性。

基于這三大特征,云測數(shù)據(jù)發(fā)布了面向AI工程化的新一代數(shù)據(jù)解決方案,從平臺工具、管理體系、數(shù)據(jù)安全三個維度延展產(chǎn)品服務。

平臺工具提供企業(yè)數(shù)據(jù)處理的各種工具和模板,并通過高度集成API實現(xiàn)數(shù)據(jù)底座無縫對接,幫助企業(yè)持續(xù)發(fā)掘數(shù)據(jù)價值。項目管理方面,針對人工數(shù)據(jù)處理流程中關于招聘、培訓、績效考核及對應項目管理、安全、企業(yè)責任、安全體系、相關行業(yè)知識背景培訓,云測數(shù)據(jù)總結出了一套完善的實踐方法路,包括一套完整的項目管理看板、績效看板持續(xù)追蹤對應的項目進度、任務進度和數(shù)據(jù)質量。

數(shù)據(jù)安全則是通過硬件配置、網(wǎng)絡安全、物理安全和人員安全管理實現(xiàn),完成了一套基于網(wǎng)絡VPN專線連接到云測自建數(shù)據(jù)標注基地的端到端數(shù)據(jù)標注安全交付方法,幫助企業(yè)完成數(shù)據(jù)合規(guī)、數(shù)據(jù)安全的相關數(shù)據(jù)操作流程。

云測數(shù)據(jù)還針對隱私安全設置了一系列嚴格措施,力圖做到步步保護、層層把關,完善布局AI數(shù)據(jù)處理對實效性、準確率和安全性的進一步要求。同時云測數(shù)據(jù)還是滿足ISO27001和ISO27701標準的人工智能數(shù)據(jù)服務廠商,此外,云測數(shù)據(jù)還先后獲得ISO9001、ISO20000、CMMI3等相關認證。

總結

每一家AI科技企業(yè)從初創(chuàng)到發(fā)展成熟,面對市場變化可能會經(jīng)歷以上的產(chǎn)品研發(fā)階段。云測數(shù)據(jù)將企業(yè)不同階段面臨的挑戰(zhàn)轉化為產(chǎn)品輸出,提供了一套全方位覆蓋的數(shù)據(jù)解決方案,未來隨著AI工程化快速落地,將助力越來越多的企業(yè)抓住市場機遇實現(xiàn)智能化迭代。

分享到

崔歡歡

相關推薦