云棲大會浪潮發(fā)布FPGA加速方案現(xiàn)場
AI是最壯觀云棲大會的熱點
“飛天·智能”是本屆大會的主題,對于人工智能的發(fā)展與未來,馬云在首日的演講中談到“當(dāng)同一件事情幾個方向都在談的時候,意味著一個時代的到來。”他認(rèn)為“人工智能,機器應(yīng)該像人一樣會學(xué)習(xí),而不是和人一樣思考”,同時也提醒到“對于下一次技術(shù)革命,如果沒有想象、沒有擔(dān)當(dāng)、沒有學(xué)習(xí)能力和認(rèn)知能力,人類是悲哀的。”
異構(gòu)計算是當(dāng)今IT業(yè)界公認(rèn)的實現(xiàn)高效人工智能計算、加速人工智能創(chuàng)新的新一代計算架構(gòu),通過使用特性不同、架構(gòu)不同的不同計算單元,人工智能計算能夠獲得最佳的計算性能、計算效率和計算經(jīng)濟性。
在云棲大會的異構(gòu)計算&高性能計算分論壇上,阿里云異構(gòu)計算高級專家龍欣就表示:“阿里云正在以異構(gòu)計算為核心構(gòu)建業(yè)務(wù)永續(xù)、高性能、高性價比、彈性的人工智能引擎?!倍鴮τ诋悩?gòu)計算中正扮演越來越重要角色FPGA,龍欣強調(diào):FPGA具有能耗比、低延遲、高帶寬、常規(guī)浮點運算力迅速迭代提升等突出優(yōu)勢。此外,F(xiàn)PGA作為硬件加速+硬件可編程的技術(shù),可以“在云上運行運行硬件自定義邏輯”的特點可以滿足不同的應(yīng)用定制化需求,是“專用計算中的多面手”。
浪潮推出領(lǐng)先的FPGA AI加速方案
AI同樣是浪潮最重視的未來戰(zhàn)略級技術(shù),并致力于為高速發(fā)展的人工智能應(yīng)用需求不斷創(chuàng)新設(shè)計&提供頂尖的AI計算產(chǎn)品方案。2017年浪潮在人工智能計算的數(shù)據(jù)中心產(chǎn)品創(chuàng)新、深度學(xué)習(xí)算法框架優(yōu)化、生態(tài)系統(tǒng)建設(shè)等方向已全面發(fā)力。
此次浪潮發(fā)布的三大FPGA加速方案全部基于自主研發(fā)的F10A,這是目前業(yè)界支持OpenCL的最高密度、最高性能的FPGA加速設(shè)備。F10A的單芯片峰值運算能力為1.5TFlops,而功耗僅35W,每瓦特性能達(dá)到42GFlops。同時,F(xiàn)10A設(shè)計半高半長PCI-E插卡,具有靈活的板卡內(nèi)存配置,最大支持32G雙通道內(nèi)存,能夠寄存更多的并行任務(wù)數(shù)據(jù)。此外,F(xiàn)10A支持2個10Gb光口,可以實現(xiàn)數(shù)據(jù)直接從網(wǎng)絡(luò)到板卡處理,無需經(jīng)過CPU,減低了傳輸延時。
基于FPGA具有可編程專用性,高性能及低功耗的特點,浪潮F10A AI線上推理加速方案針對CNN卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)算法進(jìn)行優(yōu)化和固化,可加速ResNet等神經(jīng)網(wǎng)絡(luò),能夠應(yīng)用于圖片分類、對象檢測和人臉識別等應(yīng)用場景。
實測數(shù)據(jù)顯示,在進(jìn)行ResNet殘差網(wǎng)絡(luò)的圖片識別分類任務(wù)時,浪潮F10A加速方案圖片處理速度可達(dá)每秒742張,Top-5識別準(zhǔn)確率達(dá)到99.6%,相比同檔次GPU能效比提升7倍以上。而與通用CPU對比,在處理這種高并行、小計算量的任務(wù)時,F(xiàn)10A的優(yōu)勢將更明顯。
值得一提的,浪潮F10A AI線上推理加速方案部署非常簡單,用戶只需要將目前深度學(xué)習(xí)的算法和模型編譯成與浪潮深度學(xué)習(xí)加速解決方案的配置腳本,即可進(jìn)行線上應(yīng)用,省去至少3個月到半年的開發(fā)周期和相關(guān)成本。
此外,浪潮推出的WebP圖片轉(zhuǎn)碼F10A加速方案,針對圖片數(shù)據(jù)的壓縮嵌入基于FPGA計算環(huán)境下的WebP編解碼優(yōu)化算法,通過充分利用硬件流水設(shè)計和任務(wù)級并行,大大提升WebP圖像壓縮編碼算法的處理性能,能夠?qū)崿F(xiàn)JPEG-WebP圖片格式的快速轉(zhuǎn)換,比傳統(tǒng)實現(xiàn)方式的整體處理效率平均高9.13倍左右,最高性能可比CPU提高14倍。而為了解決傳統(tǒng)壓縮架構(gòu)的弊端,浪潮F10A GZip算法加速方案充分利用板卡硬件流水設(shè)計和任務(wù)級并行,大幅提升了壓縮任務(wù)的吞吐量并有效降低CPU的負(fù)載,壓縮率最高可達(dá)94.8%,壓縮速度達(dá)到3.2GB/s,10倍于傳統(tǒng)方法的壓縮效率。
目前,浪潮已占有中國AI計算服務(wù)器市場60%以上份額,與百度、阿里、騰訊、科大訊飛、奇虎360、搜狗、今日頭條、Face++等人工智能領(lǐng)先公司保持在系統(tǒng)與應(yīng)用方面的深入緊密合作,幫助客戶在語音、圖像、視頻、搜索、網(wǎng)絡(luò)等方面取得數(shù)量級的應(yīng)用性能提升。相信隨著三大場景FPGA加速方案的推出,將讓浪潮在AI計算領(lǐng)域保持更大的競爭力與領(lǐng)先優(yōu)勢。