數(shù)據(jù)被視為AI學(xué)習(xí)的核心教材。然而,AI在工業(yè)等復(fù)雜場景落地時,常面臨行業(yè)知識匱乏、高質(zhì)量數(shù)據(jù)稀缺等瓶頸,急需專業(yè)人才參與建設(shè)。專業(yè)的AI數(shù)據(jù)標注師,被譽為“AI教官”,他們通過精確標注和修正,確保訓(xùn)練數(shù)據(jù)準確、無偏見,以此提升模型輸出的安全性與可靠性,并持續(xù)“教導(dǎo)”AI理解語義、更通人情。
趙秋燕是某財經(jīng)大學(xué)金融學(xué)本科畢業(yè),曾從事會計工作,擅長糾正AI回答的金融問題。學(xué)法律的嚴馮娜,主要工作是標注大模型輸出文字中涉及的“紅線”問題,教AI“什么能說,什么不能說”。標注師李寧曾經(jīng)是個美術(shù)老師,他需要面對大量圖片數(shù)據(jù),標注其中的“內(nèi)容風險”。醫(yī)學(xué)、外語、旅游等領(lǐng)域的專業(yè)人才也正加入各垂類模型的數(shù)據(jù)標注工作。
“螞蟻數(shù)科AI標注師隊伍的平均學(xué)歷在本科以上,太倉政府在園區(qū)建設(shè)、人才招募、生態(tài)企業(yè)入駐等方面提供了強力支持?!蔽浵仈?shù)科AI科技事業(yè)部總經(jīng)理張凱介紹,螞蟻數(shù)科已與江蘇多所高校開展產(chǎn)教融合、孵化AI實戰(zhàn)人才。按計劃,基地未來將擴展至300人規(guī)模。
技術(shù)層面,螞蟻數(shù)科自研的AI數(shù)據(jù)標注平臺可智能推薦標注內(nèi)容、自動補全標簽,結(jié)合自動化質(zhì)檢與人工抽檢雙重保障數(shù)據(jù)質(zhì)量。當前其標注服務(wù)已覆蓋金融風控、內(nèi)容審核、自動駕駛、智能客服等數(shù)十個場景,為多領(lǐng)域大模型產(chǎn)業(yè)化提供可靠的數(shù)據(jù)基石。