先聲教育成立于2016年,是一家教育領域的AI技術服務商,做的是智能語言學習,AI技術服務能力主要包括:智能語音評測技術、智能寫作批改技術、自適應學習技術、智能對話技術以及情感識別五個方面,以云服務的形式把技術提供給B端企業(yè)用戶,比如一些教育企業(yè)或者教育機構。而不是直接面向最終用戶的,這是與許多AI教育創(chuàng)業(yè)公司的不同之處。?
秦龍表示,之所以提供2B的服務,一方面是因為我們對技術更專業(yè)一些,技術我們可以做得很好。另外一方面還在于,做2B的服務,可以通過教育機構把技術應用交付給學生來用。我們都知道,機器學習需要大量的數(shù)據(jù),讓用戶快速用起來對于產(chǎn)品的升級迭代有很大的積極作用。
憑借對行業(yè)的認知,他坦言,如果做2C業(yè)務,很難在兩年時間內達到100萬日活。目前來看,很多國內大的教育企業(yè)的產(chǎn)品也沒有100萬日活。然而,先聲教育已經(jīng)做到了。?
先聲教育是一家技術驅動的公司,“先聲”名字源于在語音技術上的積累,有技術自信,“先聲”做的業(yè)務是先從語音技術入手。
先聲教育的核心競爭力在人工智能語音服務,做的是語音測評而不是簡單的語音識別,語音識別有很多開源的框架和模型,而先聲教育做的測評則是更深入而且有廣泛應用場景的技術路線,語音評測涉及發(fā)音的方方面面,對語速,連貫性,流利度,語調,音量,停頓,韻律,語氣內涵的情緒、態(tài)度都會記錄,用技術模型來打分評判,而且可以給出改進的意見。
CTO秦龍與語音智能技術結緣已久,在中國科學技術大學上學期間就曾進入了科大訊飛的實驗室,如今科大訊飛在中國乃至全球的語音處理方面都有領先地位,當時,他在實驗室里做一些語音合成方面的工作,從中國科學技術大學畢業(yè)之后,他又去到卡內基梅隆大學讀博士,所學專業(yè)也是語音識別,畢業(yè)之后加入到美國的語音教育平臺Duolingo(多鄰國)。?
然而,當他看到國內市場的機遇之后,毅然決定回國,開始加入先聲教育。秦龍表示,我們看到國內人群在口語方面問題很大,絕大多數(shù)學生很難獲得口語上的指導和提升,因為絕大多數(shù)英語老師沒辦法做出好的指導。
酒香也怕巷子深,2B的方向是為了讓好酒走的更遠,先聲教育的這一做法已然奏效。?
據(jù)介紹,先聲教育的客戶列表中已然有了好未來集團、新東方在線、全通教育、等各種不同類型的教育公司和企業(yè),全國加起來有數(shù)百家家企業(yè)用戶,先聲教育現(xiàn)每天服務數(shù)百萬萬學生,每天處理一萬小時的語音數(shù)據(jù),相當于416天不間斷的時長,更大的挑戰(zhàn)是需要應對幾千甚至上萬的并發(fā)請求,對穩(wěn)定的服務質量有很高需求。?
雖然是在2016年才成立,但先聲教育的發(fā)展速度非???,飛速成長中的先聲教育在IT基礎架構上自然會考慮上云,為了向用戶提供穩(wěn)定的服務,先聲教育選擇了AWS,秦龍對AWS的易用性和穩(wěn)定性非常認可,希望用比較成熟的云服務來向企業(yè)用戶提供穩(wěn)定的服務。
在實際應用中,先聲教育主要用的是AWS的一些基礎服務,計算,存儲,網(wǎng)絡資源。?
當學生發(fā)音朗讀之后,系統(tǒng)把音頻文件傳輸?shù)?span lang="EN-US">AWS的服務商,過程中會用到CDN加速,然后數(shù)據(jù)主要的存儲空間是S3對象存儲,先聲教育的AI系統(tǒng)調用的計算資源主要還是CPU,為了應對洶涌而來的高并發(fā),自然還需要用到EBL負載均衡服務,當然,配套的還需要用到Autoscaling自動擴展的服務,計算會輸出模型,最后通過API向用戶提供服務,為了進一步降低數(shù)據(jù)存儲的成本,先聲教育還使用了AWS的歸檔存儲Glacier來存放音頻。?
秦龍本人對AWS還是比較熟悉的,除了這些基本的服務以外,先聲教育還在嘗試一些新的服務,比如使用了AWS的Polly語音合成服務,該服務能提供多種語言的發(fā)音,在計算資源上,先聲也在考慮使用GPU服務,另外,在圖像識別方面,先聲教育也在嘗試AWS的OCR服務,對新技術保持著非常開放的態(tài)度,只做自己最擅長最專業(yè)的那部分。