當時作為論壇出品人的是上海交通大學計算機科學與工程系副研究員、博士生導師吳晨濤,而今年的論壇出品人還是吳晨濤。
在吳晨濤的策劃和組織之下,邀請到了包括之江實驗室研究專家曾令仿、華東師范大學海內(nèi)外公開招聘教授,博士生導師,上海市計算機學會存儲專委主任石亮、浙江大學研究員,博士生導師何水兵、上??萍即髮W信息學院 助理教授、研究員殷樹四位老師。
在峰會召開期間,有杭州本地的芯片設(shè)計公司找到作為工作人員的我,希望我能介紹某位學校的演講嘉賓,能讓他們?nèi)プ鰧W校做校招,可見其對于人才的迫切需求,也從側(cè)面看到了杭州科技公司的朝氣。
而在學術(shù)論壇現(xiàn)場,幾位老師的介紹不僅內(nèi)容很前沿,很有干貨,也極具實用價值。
吳晨濤老師分享的內(nèi)容是關(guān)于用糾刪碼來解決云存儲系統(tǒng)面臨嚴重的數(shù)據(jù)丟失問題,研究主要是針對于閃存陣列里,特別有糾刪碼場景下怎么樣去降低寫延時。
云存儲系統(tǒng)通常有兩種提高數(shù)據(jù)可靠性的方式,一種多副本,一種就是糾刪碼,多副本的方式適合熱數(shù)據(jù),溫冷數(shù)據(jù)適合采用糾刪碼機制,既可以保證很高的可靠性,也可以降低存儲成本。
基于糾刪碼的技術(shù)存在著寫放大的問題,有可能會帶來性能下降的問題,吳晨濤的分享總結(jié)了現(xiàn)有一些寫更新方法,提出一種基于圖匹配算法來解決數(shù)據(jù)更新策略和垃圾回收策略,減少更新中讀寫IO放大問題,進行了許多優(yōu)化。
這一種技術(shù)適合用在超大規(guī)模數(shù)據(jù)中心里,實際應用中,這些技術(shù)研究是在于阿里云的合作中完成,并在阿里云得到了實際應用。
之江實驗室研究專家曾令仿分享的主題是《面向新型存儲器的雙模文件系統(tǒng)》,閃存要實現(xiàn)容量和性能之間要平衡,就需要有多種模態(tài),如果容量更大就需要模數(shù)增加,但可靠性會急劇下降。SLC的性能非常好,但MLC和TLC性能就比較差,做雙模文件系統(tǒng)工作需要就需要比較深入的考慮。
之江實驗室成立于2017年9月6日,是浙江省委、省政府深入實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略、探索新型舉國體制浙江路徑的重大科技創(chuàng)新平臺。實驗室主攻智能感知、人工智能、智能網(wǎng)絡(luò)、智能計算和智能系統(tǒng)五大科研方向。
華東師范大學海內(nèi)外公開招聘教授,博士生導師,上海市計算機學會存儲專委主任石亮教授分享的是移動分布式智能終端存儲系統(tǒng)方面的研究,這一研究已經(jīng)在手機廠商的手機里得到了實際應用。
石亮教授分享的內(nèi)容是一種內(nèi)存交換技術(shù),解決手機系統(tǒng)因內(nèi)存不足導致打開應用過多時,需要重新加載應用的問題,普通手機能在兩三個應用之間無縫切換,當打開應用過多時,就需要重新打開,究其根本是因為內(nèi)存不足造成的。
石亮的分享提到了內(nèi)存交換技術(shù)是將部分不是特別關(guān)鍵的內(nèi)存數(shù)據(jù)遷移到NAND存儲中,當需要用這部分內(nèi)存的時候再加載回來,以此實現(xiàn)多個應用隨時可用的狀態(tài),提高手機用戶的使用體驗。
當然,這一過程需要做很多優(yōu)化,也需要做安卓系統(tǒng)層次上的調(diào)整,需要以比較高的性能完成數(shù)據(jù)在內(nèi)存和閃存之間的來回遷移。
石亮的分享還提到了跨設(shè)備內(nèi)存共享的技術(shù),讓手機通過無線網(wǎng)絡(luò)傳遞內(nèi)存數(shù)據(jù),讓手里的手機使用別的設(shè)備上的內(nèi)存,這一做法還是非常新穎的,如果將來能實現(xiàn)這一技術(shù),可以解決大部分設(shè)備上內(nèi)存不足的問題,聽起來就讓人激動。
浙江大學研究員,博士生導師何水兵介紹的主題是基于憶阻器的自動深度神經(jīng)網(wǎng)絡(luò)剪枝和映射,使得機器學習運算中的矩陣向量運算更加高效和正確。
深度神經(jīng)網(wǎng)絡(luò)在自動駕駛、自然語言處理、圖像識別等領(lǐng)域應用的越來越多,市場上出現(xiàn)了包括GPU、TPU、ASIC的各種加速器,主流的深度學習計算架構(gòu)主要還是基于傳統(tǒng)的馮·諾伊曼體系結(jié)構(gòu),隨著摩爾定律失效,馮·諾伊曼結(jié)構(gòu)會帶來延遲強和功耗強的問題。
而新的存算一體技術(shù)因為少了在計算完成再寫入數(shù)據(jù)的過程,少掉很多數(shù)據(jù)傳輸?shù)牟僮?,不僅降低了延時,還降低了功耗,目前比較流行的存算一體化介質(zhì)就是憶阻器(ReRAM),在存算一體化的工作中,如果不加修改的進行比較完全的矩陣操作則會存在精度下降的問題。
經(jīng)研究發(fā)現(xiàn),可以去掉應用矩陣里的一些不重要的值,從而降低部分資源開銷,這就是量化或者裁減。研究提出的軟硬件協(xié)同設(shè)計的卷積神經(jīng)網(wǎng)絡(luò)裁剪和映射方案,使得矩陣向量運算更加高效和正確。
上海科技大學信息學院助理教授、研究員殷樹介紹如何為生物分子動力學可視化應用提供計算就緒數(shù)據(jù),落點是一個叫ADA的輕量級文件系統(tǒng)層。
如今的高性能計算不再只是做仿真和科學模擬,還要處理數(shù)據(jù)分析的問題。高性能計算在存儲方面的特點是寫入一次讀取多次,需要優(yōu)化讀性能。
Molecula Dynamics(MD是分子動力學應用)是科學計算領(lǐng)域或者傳統(tǒng)高性能計算領(lǐng)域是常見的應用,生物學家更希望看到分子的運動的圖,這需要用一系列可視化工具。
可視化工具需要加載大量的數(shù)據(jù),其中包括水分子的數(shù)據(jù),研究發(fā)現(xiàn)可以剔除水分子部分的數(shù)據(jù),從而節(jié)省很大部分的內(nèi)存,反復的加載過程需要反復進行多次壓縮和解壓縮操作,耗費CPU算力。
輕量級文件系統(tǒng)中間層ADA,轉(zhuǎn)為分子動力學可視化應用做了優(yōu)化,性能最高提升達14倍,內(nèi)存利用率提高大概2倍多,而且能耗也大幅下降。
以上是此次學術(shù)論壇的精彩內(nèi)容梗概,受限于作者本人的知識體系限制,只能部分呈現(xiàn)精彩內(nèi)容。
如需了解更多2021全球閃存峰會的最新動態(tài),可點擊閱讀原文進入官方查看,感謝您的關(guān)注!