硬球流體的相互作用

這被業(yè)內(nèi)認(rèn)為是首次使用計(jì)算機(jī)成功模擬多粒子系統(tǒng)動力學(xué)的嘗試。

當(dāng)時(shí)的算力條件遠(yuǎn)比不上今天,但這項(xiàng)工作為后續(xù)物理學(xué)、生物學(xué)和化學(xué)等領(lǐng)域的研究開辟了新的路徑。這些領(lǐng)域的科學(xué)家們一直在尋求從物質(zhì)的微觀結(jié)構(gòu)洞察其宏觀物理性質(zhì)的高效研究工具,基于計(jì)算模擬的分子動力學(xué)正是為了這個(gè)需求而誕生。

分子動力學(xué):粒子運(yùn)動的「顯微鏡」

分子動力學(xué)的基本思想源于牛頓時(shí)代,即只要已知系統(tǒng)組分的初始條件和相互作用力,就能通過計(jì)算來預(yù)測整個(gè)系統(tǒng)的行為。

簡單概括一下,分子動力學(xué)的計(jì)算模擬過程,就是按照一定規(guī)則為模擬對象(各種粒子)賦予初始位置和速度,讓其遵循力學(xué)規(guī)律運(yùn)動。然后計(jì)算出粒子在每個(gè)時(shí)間步長的運(yùn)動狀態(tài),得到原子和分子在模擬系統(tǒng)中的運(yùn)動軌跡、相對位置和能量轉(zhuǎn)化等豐富的信息。依據(jù)這些信息,研究人員就可以分析體系的動力學(xué)行為、熱力學(xué)性質(zhì)等,進(jìn)而解釋和預(yù)測物質(zhì)的各種宏觀特性。

計(jì)算模擬如今是除了理論和實(shí)驗(yàn)之外的第三種主要研究手段,也是分子動力學(xué)方法的核心優(yōu)勢。分子動力學(xué)也因此兼具理論和實(shí)驗(yàn)的雙重性質(zhì),一方面,它可以做預(yù)測,為實(shí)驗(yàn)提供可能性和可行性的理論分析;另一方面,它也可以做解釋,通過模擬解釋實(shí)驗(yàn)現(xiàn)象、探討過程機(jī)理等。

經(jīng)過幾十年的發(fā)展,分子動力學(xué)模擬技術(shù)逐漸成熟,從最初的小尺度簡單模型模擬能力,升級到能夠模擬大尺度復(fù)雜模型,成為許多領(lǐng)域不可或缺的科研利器。

例如,在生物化學(xué)領(lǐng)域,該方法可以用來復(fù)制和預(yù)測生物分子如蛋白質(zhì)的折疊和對接,揭示生命的奧秘;在材料領(lǐng)域,利用分子動力學(xué)可以模擬材料在特定環(huán)境下的性質(zhì)、相變過程和穩(wěn)定性,從而發(fā)現(xiàn)高性能的新材料。

分子動力學(xué)被發(fā)明后的很長一段時(shí)間內(nèi),登上各領(lǐng)域頂級刊物的研究論文可謂碩果累累,但回顧起來會發(fā)現(xiàn),這門技術(shù)在產(chǎn)業(yè)落地方面卻很少見比較亮眼的成績。其實(shí),在算法探索方面,分子動力學(xué)方法已經(jīng)走得比較遠(yuǎn)了,最大的瓶頸就在于計(jì)算效率。

而究其原因,分子動力學(xué)的核心優(yōu)勢,同時(shí)也是導(dǎo)致它計(jì)算效率低下的局限性所在。

持續(xù)多年的計(jì)算效率難題

這要如何理解呢?

我們知道,與其他的分子模擬方法如蒙特卡洛方法顯著不同的是,分子動力學(xué)引入了時(shí)間這一重要維度,可以計(jì)算粒子系統(tǒng)隨時(shí)間推移而發(fā)生的動態(tài)性質(zhì)演化,模擬的質(zhì)量也更高。

與此同時(shí),分子動力學(xué)的痛點(diǎn)也在于時(shí)間。為了能夠與自然過程的動力學(xué)相匹配,我們想要的模擬時(shí)間跨度當(dāng)然是要足夠長的,這樣才能從模擬中得出在統(tǒng)計(jì)學(xué)上有效的結(jié)論,如果模擬時(shí)間過短,就無異于僅通過觀察一個(gè)不完整的腳步就聲稱得出了人類如何行走的結(jié)論。

但現(xiàn)實(shí)的難題是,計(jì)算機(jī)的算力有限,需要對模擬體系的大小、時(shí)間步長和總持續(xù)時(shí)間的選擇加以限制,以便計(jì)算任務(wù)可以在合理的時(shí)間內(nèi)完成,當(dāng)計(jì)算資源受限時(shí),必須縮小模擬體系規(guī)?;蚩s短體系的演化時(shí)間,否則模擬效果就會大打折扣。如果要對于大體系(數(shù)十萬上百萬量級)進(jìn)行計(jì)算模擬,就只能在模擬速度和模擬質(zhì)量之間做出取舍了。一般來說,現(xiàn)有超級計(jì)算機(jī)每天能夠?qū)崿F(xiàn)的大體系分子動力學(xué)模擬時(shí)長,幾乎都是在皮秒到納秒的時(shí)間尺度。

這無疑是攔在分子動力學(xué)技術(shù)邁向產(chǎn)業(yè)落地的路上的一堵高墻。

拿藥物研發(fā)行業(yè)舉例,一直以來,分子動力學(xué)技術(shù)都難以成為科研人員選取的主流研究方法,這是因?yàn)橐胙芯克幬镄》肿拥慕Y(jié)構(gòu)和性質(zhì),模擬的時(shí)長至少也需要到微秒級別(可能還不夠),即便是每天模擬10納秒的高性能計(jì)算機(jī),都需要100天的時(shí)間才能模擬1微秒的蛋白動態(tài)構(gòu)象,而為了找到合適的藥物分子結(jié)構(gòu),需要模擬的分子數(shù)量至少也是成百上千的,因此如果硬是要靠分子動力學(xué)來取代傳統(tǒng)實(shí)驗(yàn)的篩選,完全是天方夜譚中的天方夜譚。分子動力學(xué)模擬要想真正步入新藥研發(fā)的產(chǎn)業(yè)應(yīng)用,至少還需要三四個(gè)數(shù)量級的加速,人們普遍認(rèn)為這需要好幾個(gè)代際的軟硬件效率革命,等上幾十年都不為過。

誰曾想,分子動力學(xué)發(fā)展歷史上的一位傳奇人物的登場,直接掀起了一場顛覆性的計(jì)算效率革命。

David E. Shaw,這位叱咤金融量化領(lǐng)域多年的大牛,在他人生的五十歲之際,毅然轉(zhuǎn)身投入到生物計(jì)算的事業(yè)中,帶領(lǐng)一群頂尖的技術(shù)人才,于2007年發(fā)明出了分子動力學(xué)模擬加速專用超級計(jì)算機(jī)——Anton(安騰)。

它能夠以3-4個(gè)數(shù)量級的加速比更快地計(jì)算模擬更大體系規(guī)模、更長模擬時(shí)長的生物大分子運(yùn)動,將分子模擬從納秒時(shí)代帶入了微秒甚至毫秒時(shí)代。

超算安騰:為加速分子動力學(xué)模擬而生

事實(shí)上,為了適應(yīng)各領(lǐng)域計(jì)算密集型任務(wù)的需求,超級計(jì)算機(jī)最早在70年代就出現(xiàn)了,后來的Frontier(前沿)等世界最快超算設(shè)備也都算力驚人,能夠在極短的時(shí)間內(nèi)處理龐大的數(shù)據(jù)和復(fù)雜的計(jì)算任務(wù)。

但論針對分子動力學(xué)模擬的計(jì)算任務(wù),通用型超算卻遠(yuǎn)比不上安騰,安騰的實(shí)測計(jì)算效率比Frontier還要快至少幾十倍以上!這是因?yàn)榘豺v的設(shè)計(jì)初衷只有一個(gè),那就是為了專門加速分子動力學(xué)模擬計(jì)算。

超級計(jì)算機(jī)安騰(Anton)圖片來源 D.E Shaw Research

從硬件上的芯片、主板和布線,到配套的動力學(xué)模擬軟件,David E. Shaw團(tuán)隊(duì)都做了特殊定制。具體來說,超算安騰有兩大突出的創(chuàng)新:

一是采用深度定制的ASIC芯片,可以針對性地執(zhí)行分子動力學(xué)模擬中最消耗算力的任務(wù)模塊如分子之間相互作用力的計(jì)算,為其提供硬件算法上的優(yōu)化,同時(shí)由于這類任務(wù)屬于通訊密集型,每個(gè)節(jié)點(diǎn)需要執(zhí)行的運(yùn)算并不復(fù)雜,對單個(gè)計(jì)算單元的計(jì)算能力要求也就沒那么高,所以安騰并沒有使用其他并行計(jì)算硬件中常見的緩存,而是把更多的硅片面積留給通信和計(jì)算性能和優(yōu)化。

二是在通信網(wǎng)絡(luò)方面,為了滿足分子動力學(xué)模擬的快速大規(guī)模并行計(jì)算需求,安騰將整個(gè)服務(wù)器緊密排列在一個(gè)正方體機(jī)箱中,這樣就可以降低網(wǎng)絡(luò)的傳輸距離,提高節(jié)點(diǎn)間通訊效率。

經(jīng)過如此強(qiáng)大設(shè)計(jì)的超算安騰一問世,就成了生物計(jì)算領(lǐng)域當(dāng)之無愧的最強(qiáng)王者,破解了多年來分子動力學(xué)模擬的計(jì)算效率難題。隨之而來的,就是分子動力學(xué)終于不再局限于學(xué)術(shù)研究的范疇,而是真正實(shí)現(xiàn)了大規(guī)模的產(chǎn)業(yè)化應(yīng)用,尤其是在藥物研發(fā)行業(yè)顯示了巨大的市場潛力。

正是在超算安騰的幫助下,美國的一個(gè)年輕公司Relay Therapeutics在2016年成功確定了一款用于治療膽管癌的抑制劑藥物RLY-4008的結(jié)構(gòu),Relay利用安騰重塑了新藥研發(fā)的技術(shù)手段,把獲取對蛋白質(zhì)靶點(diǎn)的認(rèn)識從過去基于靜態(tài)圖轉(zhuǎn)變?yōu)榛诘鞍踪|(zhì)運(yùn)動的動態(tài)影像,這被他們稱為“基于運(yùn)動的藥物設(shè)計(jì)”(Motion Based Drug DesignTM,MBDD)。

Relay提出的MBDD范式 圖片來源 Relay官方

在這種新范式下,這款新藥的發(fā)現(xiàn)僅僅花費(fèi)了18個(gè)月、不到1億美金,極大地縮短了從藥物發(fā)現(xiàn)到臨床前研究過程中90%的投入時(shí)間與成本,打破了藥物研發(fā)行業(yè)的“雙十”魔咒。

回到1950年代,Alder和Wainwright曾在布魯塞爾的統(tǒng)計(jì)力學(xué)大會上,報(bào)告了他們關(guān)于使用分子動力學(xué)模擬多體系統(tǒng)的研究論文。論文中,他們不僅第一次令人信服地向人們展示了分子動力學(xué)的技術(shù)價(jià)值,而且還特別對這門技術(shù)的未來做了暢想:更強(qiáng)大的計(jì)算設(shè)備將帶來更大的可能性。

五十年后的超算安騰,就是對這一舊時(shí)預(yù)測的完美注腳,也必定會是將來分子動力學(xué)發(fā)展的重要路徑指引。在生物計(jì)算和藥物研發(fā)之外,更多運(yùn)用分子動力學(xué)技術(shù)的科學(xué)領(lǐng)域,正呼喚著類似安騰這樣的專用超級計(jì)算機(jī),以創(chuàng)造更多產(chǎn)業(yè)落地的可能性。

分享到

zhupb

相關(guān)推薦