數(shù)據(jù)被視為AI學(xué)習(xí)的核心教材。然而,AI在工業(yè)等復(fù)雜場景落地時,常面臨行業(yè)知識匱乏、高質(zhì)量數(shù)據(jù)稀缺等瓶頸,急需專業(yè)人才參與建設(shè)。專業(yè)的AI數(shù)據(jù)標(biāo)注師,被譽(yù)為“AI教官”,他們通過精確標(biāo)注和修正,確保訓(xùn)練數(shù)據(jù)準(zhǔn)確、無偏見,以此提升模型輸出的安全性與可靠性,并持續(xù)“教導(dǎo)”AI理解語義、更通人情。
趙秋燕是某財經(jīng)大學(xué)金融學(xué)本科畢業(yè),曾從事會計工作,擅長糾正AI回答的金融問題。學(xué)法律的嚴(yán)馮娜,主要工作是標(biāo)注大模型輸出文字中涉及的“紅線”問題,教AI“什么能說,什么不能說”。標(biāo)注師李寧曾經(jīng)是個美術(shù)老師,他需要面對大量圖片數(shù)據(jù),標(biāo)注其中的“內(nèi)容風(fēng)險”。醫(yī)學(xué)、外語、旅游等領(lǐng)域的專業(yè)人才也正加入各垂類模型的數(shù)據(jù)標(biāo)注工作。
“螞蟻數(shù)科AI標(biāo)注師隊伍的平均學(xué)歷在本科以上,太倉政府在園區(qū)建設(shè)、人才招募、生態(tài)企業(yè)入駐等方面提供了強(qiáng)力支持?!蔽浵仈?shù)科AI科技事業(yè)部總經(jīng)理張凱介紹,螞蟻數(shù)科已與江蘇多所高校開展產(chǎn)教融合、孵化AI實戰(zhàn)人才。按計劃,基地未來將擴(kuò)展至300人規(guī)模。
技術(shù)層面,螞蟻數(shù)科自研的AI數(shù)據(jù)標(biāo)注平臺可智能推薦標(biāo)注內(nèi)容、自動補(bǔ)全標(biāo)簽,結(jié)合自動化質(zhì)檢與人工抽檢雙重保障數(shù)據(jù)質(zhì)量。當(dāng)前其標(biāo)注服務(wù)已覆蓋金融風(fēng)控、內(nèi)容審核、自動駕駛、智能客服等數(shù)十個場景,為多領(lǐng)域大模型產(chǎn)業(yè)化提供可靠的數(shù)據(jù)基石。