基于目前行業(yè)主流的深度學(xué)習(xí)算法模式,無(wú)論是智能手機(jī)的人臉識(shí)別,還是智能音箱的語(yǔ)音喚醒,無(wú)論是自動(dòng)駕駛應(yīng)用的路況識(shí)別,還是火遍抖音、快手的表情動(dòng)作識(shí)別,人工智能應(yīng)用落地的一大前提都是——標(biāo)注好的大量數(shù)據(jù)集。

  2016年以前,人工智能行業(yè)普遍采用的是企業(yè)自建標(biāo)注團(tuán)隊(duì)、自己開(kāi)發(fā)工具的方式完成數(shù)據(jù)采集標(biāo)注。這樣做的好處是可以直接對(duì)接采集標(biāo)注人員,任務(wù)需求了解更到位,也不用擔(dān)心數(shù)據(jù)外泄。在需求較少且不緊迫的方式下能夠基本滿足企業(yè)需求,但是其弊端也相當(dāng)明顯:自建團(tuán)隊(duì)無(wú)法滿足高數(shù)量級(jí)采集標(biāo)注需求,自營(yíng)團(tuán)隊(duì)、開(kāi)發(fā)標(biāo)注系統(tǒng)來(lái)做這種密集型勞動(dòng)也極大提高了新應(yīng)用開(kāi)發(fā)成本。

  需求決定供給。龍貓數(shù)據(jù)不是第一個(gè)看到AI數(shù)據(jù)服務(wù)這片藍(lán)海的人,卻是第一個(gè)用互聯(lián)網(wǎng)思維——眾包模式解決數(shù)據(jù)需求的人,這和他們團(tuán)隊(duì)的互聯(lián)網(wǎng)基因有很大關(guān)系。公司CEO昝智曾先后擔(dān)任豌豆莢商業(yè)產(chǎn)品負(fù)責(zé)人、百度聯(lián)盟產(chǎn)品經(jīng)理,離職后聯(lián)合原豌豆莢游戲頻道技術(shù)負(fù)責(zé)人姚毅創(chuàng)辦龍貓數(shù)據(jù),流量入口公司的經(jīng)驗(yàn)讓他們擁有良好的互聯(lián)網(wǎng)產(chǎn)品思維和粉絲運(yùn)營(yíng)技巧,采用眾包模式——將客戶需求分發(fā)給眾多團(tuán)隊(duì)和個(gè)人來(lái)解決AI數(shù)據(jù)服務(wù)行業(yè)痛點(diǎn)的方式大獲成功。

  龍貓數(shù)據(jù)CEO 昝智

  “保守估計(jì),我們的方式可以為客戶節(jié)省下30%-60%的數(shù)據(jù)支出成本”,在一次采訪中昝智曾表示,“我們不是行業(yè)的攪局者,我們是通過(guò)我們的方式真真正正把成本壓縮了下來(lái),我們從來(lái)不搞惡意低價(jià)競(jìng)爭(zhēng)?!饼堌垟?shù)據(jù)之后,新成立的數(shù)據(jù)服務(wù)公司大都采用這一高效高性價(jià)比的模式,行業(yè)里也很難再見(jiàn)到從事AI開(kāi)發(fā)的公司建立自己標(biāo)注團(tuán)隊(duì)的情況。

  亞馬遜的蝴蝶扇動(dòng)翅膀帶來(lái)了始料未及的影響,由于人員素質(zhì)要求低、工作輕松簡(jiǎn)單,大量三四五線人工開(kāi)始加入數(shù)據(jù)采集標(biāo)注大軍,從河北到貴州,從山西到重慶,專(zhuān)職或兼職從事過(guò)AI數(shù)據(jù)采集標(biāo)注的人員超千萬(wàn),一股轟轟烈烈的采集標(biāo)注之風(fēng)開(kāi)始猛烈刮起來(lái)。

  新方式也無(wú)疑為開(kāi)創(chuàng)者龍貓數(shù)據(jù)帶來(lái)諸多益處,2018年,公司合同額整體翻了5倍,服務(wù)百度、工商銀行、字節(jié)跳動(dòng)、京東、騰訊、小米、快手等大中型客戶超200家,平臺(tái)用戶超500萬(wàn),在龍貓數(shù)據(jù)注冊(cè)的專(zhuān)業(yè)渠道團(tuán)隊(duì)超2000個(gè),初步確立了AI數(shù)據(jù)服務(wù)領(lǐng)域領(lǐng)導(dǎo)地位,這對(duì)于從2016年底才開(kāi)始轉(zhuǎn)型做AI數(shù)據(jù)服務(wù)的他們來(lái)說(shuō),無(wú)疑是巨大的成功。

  對(duì)于具有互聯(lián)網(wǎng)思維的人來(lái)說(shuō),變革只有開(kāi)始,沒(méi)有結(jié)束?!拔ㄒ坏牟蛔兙褪歉淖儭?,從2017年開(kāi)始,AI創(chuàng)業(yè)就已經(jīng)走下高堂,向更傳統(tǒng)、更廣闊的領(lǐng)域下沉,醫(yī)療、安防、工業(yè)制造甚至畜牧養(yǎng)殖,各行各業(yè)都開(kāi)始出現(xiàn)AI創(chuàng)業(yè)風(fēng)潮,其實(shí)這也越來(lái)越接近AI本質(zhì)——AI是一項(xiàng)技術(shù),可以對(duì)各行各業(yè)賦能的技術(shù),如果把它束之高閣,只用于自動(dòng)駕駛、機(jī)器人等“高端領(lǐng)域”,反而脫離了技術(shù)初衷。

  新的轉(zhuǎn)變意味著新的機(jī)遇,新的機(jī)遇都是從新的問(wèn)題開(kāi)始的。AI應(yīng)用的賽道上生面孔越來(lái)越多,很多初創(chuàng)企業(yè)和團(tuán)隊(duì)對(duì)于數(shù)據(jù)有更多樣化的需求,在傳統(tǒng)的AI數(shù)據(jù)服務(wù)過(guò)程中,數(shù)據(jù)定制化一直是行業(yè)普遍采取的做法:由數(shù)據(jù)需求方提出需求,剩下的所有步驟都交由數(shù)據(jù)服務(wù)公司完成。這無(wú)疑增加了需要多種類(lèi)、小批量數(shù)據(jù)的中小公司、初創(chuàng)企業(yè)的試錯(cuò)成本,如果能夠打造一個(gè)大一統(tǒng)的平臺(tái),讓客戶直面用戶,客戶可以輕松發(fā)布任務(wù),用戶使用平臺(tái)工具進(jìn)行采集標(biāo)注,不僅將極大提升AI數(shù)據(jù)需求方使用體驗(yàn),也將使AI數(shù)據(jù)服務(wù)方更專(zhuān)注技術(shù)開(kāi)發(fā),打造更好的采集、標(biāo)注體驗(yàn)。

  基于此,龍貓數(shù)據(jù)重磅推出數(shù)據(jù)采集標(biāo)注開(kāi)放平臺(tái)。

  龍貓數(shù)據(jù)開(kāi)放平臺(tái)是完全開(kāi)放化的,任何進(jìn)入開(kāi)放平臺(tái)的客戶,只要注冊(cè),就能夠使用整套數(shù)據(jù)采集標(biāo)注系統(tǒng),也能夠調(diào)用其中百萬(wàn)級(jí)的專(zhuān)業(yè)采標(biāo)人員。平臺(tái)上實(shí)現(xiàn)了全面的通用型標(biāo)注工具免費(fèi)使用,包括超像素分割語(yǔ)義處理系統(tǒng)、ASR智能語(yǔ)音標(biāo)注系統(tǒng)、NLP自然語(yǔ)言處理系統(tǒng)等,可實(shí)現(xiàn)語(yǔ)音波形圖展示、無(wú)縫時(shí)間戳選取,圖像與自然語(yǔ)言精準(zhǔn)標(biāo)注,滿足各種數(shù)據(jù)類(lèi)型需求。

  簡(jiǎn)單來(lái)說(shuō),開(kāi)放平臺(tái)就是搭建了一個(gè)針對(duì)供需雙方的發(fā)布需求和提供服務(wù)的開(kāi)放的第三方平臺(tái),可以最大限度地節(jié)省企業(yè)的時(shí)間成本和開(kāi)發(fā)成本,同時(shí)提高工作效率。相比傳統(tǒng)定制模式,平臺(tái)可以為客戶實(shí)現(xiàn)實(shí)時(shí)響應(yīng)需求,500萬(wàn)注冊(cè)用戶,2000個(gè)以上的專(zhuān)業(yè)團(tuán)隊(duì)隨時(shí)待命。借助咨詢顧問(wèn)全程跟蹤,可以為企業(yè)快速配置個(gè)性化任務(wù)流。在開(kāi)放平臺(tái)上,企業(yè)直接發(fā)布任務(wù),對(duì)需求理解更透徹,數(shù)據(jù)質(zhì)量更高;直接對(duì)接采集、標(biāo)注用戶,省去中間環(huán)節(jié),企業(yè)甚至可以自主定價(jià),又一次為企業(yè)減少成本支出30%以上。

image.png

  開(kāi)放平臺(tái)降低了人工智能的入行門(mén)檻,保證了數(shù)據(jù)需求方的任務(wù)能夠獲得更多樣從業(yè)者的關(guān)注,專(zhuān)業(yè)團(tuán)隊(duì)也能夠迅速響應(yīng)。在數(shù)據(jù)安全方面,開(kāi)放平臺(tái)數(shù)據(jù)加密環(huán)節(jié)安全可控,在數(shù)據(jù)傳輸過(guò)程中數(shù)據(jù)同樣會(huì)被加密,以保證數(shù)據(jù)的安全。同時(shí),在使用開(kāi)放式平臺(tái)的過(guò)程中,龍貓數(shù)據(jù)會(huì)和客戶簽署一套電子協(xié)議,保證客戶在使用數(shù)據(jù)的過(guò)程中要做到合法合規(guī)。如果在數(shù)據(jù)使用過(guò)程中出現(xiàn)了問(wèn)題,平臺(tái)完全可以根據(jù)任務(wù)去追溯到應(yīng)用,追究相關(guān)機(jī)構(gòu)或者個(gè)人的責(zé)任。這樣一來(lái),對(duì)于平臺(tái)使用者而言就有所約束,但更是一種有效地保護(hù)。

  開(kāi)放平臺(tái)的推出無(wú)疑為行業(yè)發(fā)展帶來(lái)新思路。像上一次一樣,新模式把企業(yè)開(kāi)發(fā)AI應(yīng)用的成本又一次拉下一大截——企業(yè)自主定價(jià)基本保證了數(shù)據(jù)服務(wù)價(jià)格見(jiàn)底。但與上次所不同的是,這次龍貓數(shù)據(jù)推出的新模式,或許不再那么好模仿。首先,開(kāi)放平臺(tái)需要擁有完善的采集、標(biāo)注系統(tǒng),這屬于數(shù)據(jù)服務(wù)企業(yè)的“家底”,沒(méi)有足夠的技術(shù)投入就沒(méi)有足夠的底氣亮出來(lái)。其次,究竟有多少用戶和團(tuán)隊(duì)在平臺(tái)上做任務(wù),究竟他們的水平如何,有沒(méi)有完善合理的制度來(lái)管理,都將是對(duì)開(kāi)放平臺(tái)的一大考驗(yàn)。

  得益于在技術(shù)領(lǐng)域的默默耕耘,龍貓數(shù)據(jù)標(biāo)注平臺(tái)現(xiàn)在擁有超像素分割、ASR智能預(yù)標(biāo)注、3D-box標(biāo)注等諸多領(lǐng)先行業(yè)的采集標(biāo)注工具集。而在用戶層面,除了數(shù)量級(jí)上的絕對(duì)優(yōu)勢(shì),則不得不提龍貓數(shù)據(jù)力推的規(guī)范化、流程化、自動(dòng)化管理體系——同樣是基于互聯(lián)網(wǎng)思維打造而成。

  數(shù)據(jù)標(biāo)注公司

  長(zhǎng)久以來(lái),龍貓數(shù)據(jù)因?yàn)閷?zhuān)業(yè)、專(zhuān)注、負(fù)責(zé)和對(duì)數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量的嚴(yán)格把控而得到了很多客戶的認(rèn)可,同時(shí)也吸引了大批渠道商尋求合作,如果按照目前的模式,借助當(dāng)下的資源,本可以只和熟悉的渠道商合作,“舒適安逸”的走下去,但這絕不符合互聯(lián)網(wǎng)公司“程序化”的思維模式,畢竟關(guān)系具有不穩(wěn)定性,只有靠系統(tǒng)和機(jī)制,才能最大程度保證服務(wù)質(zhì)量和效率。

  他們把用戶、渠道管理自動(dòng)化作為數(shù)據(jù)生產(chǎn)系統(tǒng)自動(dòng)化的重要部分,借助自主開(kāi)發(fā)的分發(fā)系統(tǒng),對(duì)所有上線的任務(wù)進(jìn)行分發(fā)。合作商可以根據(jù)自己能力選擇任務(wù)量,同一個(gè)任務(wù)可以由不同渠道商合作完成,而任務(wù)價(jià)格都是相同且公開(kāi)的,如果渠道商繳納一定任務(wù)保證金,在任務(wù)完成后還會(huì)獲得額外獎(jiǎng)勵(lì)。任務(wù)領(lǐng)取、完成提交、結(jié)算全部由系統(tǒng)自動(dòng)完成,減少了人工干預(yù),為數(shù)據(jù)采集標(biāo)注規(guī)范流程化提供了范例。

  在行業(yè)內(nèi)眾多公司都還需要渠道合作商“刷臉”獲取任務(wù)的時(shí)候,龍貓數(shù)據(jù)率先砍掉“白名單”制度,將數(shù)據(jù)需求在全平臺(tái)分發(fā)。借助經(jīng)驗(yàn)評(píng)價(jià)系統(tǒng)龍貓數(shù)據(jù)會(huì)針對(duì)完成任務(wù)的人員進(jìn)行經(jīng)驗(yàn)值增減,每個(gè)在平臺(tái)上做任務(wù)的人員都有一張“能力圖譜”,借助能力畫(huà)像,可以將數(shù)據(jù)需求精準(zhǔn)匹配給合適經(jīng)驗(yàn)值等級(jí)人群,極大提升了任務(wù)完成效率。同時(shí)自動(dòng)化管理也極大保障了個(gè)人用戶和渠道合作商的權(quán)益,不會(huì)出現(xiàn)人為拖欠收入的情況,也正因此,龍貓數(shù)據(jù)才能聚集起越來(lái)越多的優(yōu)質(zhì)個(gè)人用戶和渠道合作商。

  開(kāi)放平臺(tái)+自動(dòng)管理的模式又一次為龍貓數(shù)據(jù)帶來(lái)新的增長(zhǎng)點(diǎn),平臺(tái)推出一月已經(jīng)有十余家企業(yè)完成需求對(duì)接,與一些企業(yè)自建團(tuán)隊(duì)、系統(tǒng)“做重”不同,龍貓數(shù)據(jù)開(kāi)放系統(tǒng)明顯是在“做輕”,通過(guò)企業(yè)自助的形式加入,輕松滿足企業(yè)數(shù)據(jù)需求。當(dāng)然,面對(duì)一些量級(jí)特別大、難度特別高的數(shù)據(jù)需求,龍貓數(shù)據(jù)依然會(huì)采取定制化服務(wù),提升客戶需求滿足效率。定制化服務(wù)與開(kāi)放化系統(tǒng)相得益彰,互為補(bǔ)充,最終形成數(shù)據(jù)服務(wù)閉環(huán),分層次滿足企業(yè)AI數(shù)據(jù)服務(wù)需求,這就是互聯(lián)網(wǎng)思維下的“龍貓打法”。

  龍貓數(shù)據(jù)部分客戶

  龍貓數(shù)據(jù)2017年11月完成由金沙江創(chuàng)投領(lǐng)投,九合創(chuàng)投、不惑創(chuàng)投跟投的3370萬(wàn)人民幣A輪融資,目前正在進(jìn)行B輪融資。

分享到

zhangnn

相關(guān)推薦