一、拉高落地部署性價(jià)比,幫更多人搭上AlphaFold2的快車
AlphaFold2為生物學(xué)界帶來(lái)了原子級(jí)別的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)精度,但要讓這項(xiàng)突破性技術(shù)惠及更廣泛的科研機(jī)構(gòu)、高校實(shí)驗(yàn)室及生物、醫(yī)藥企業(yè),需進(jìn)一步降低部署應(yīng)用的難度和成本。
AlphaFold2的架構(gòu)有多項(xiàng)創(chuàng)新設(shè)計(jì),使整個(gè)方案從預(yù)處理到推理任務(wù)都面臨高通量的計(jì)算壓力。不同蛋白質(zhì)預(yù)測(cè)中,序列越長(zhǎng),張量運(yùn)算規(guī)模與推理計(jì)算復(fù)雜度就越大,再結(jié)合更多序列的并行計(jì)算,所需內(nèi)存容量越高。用戶在構(gòu)建和使用AlphaFold2時(shí),需要更快的推理來(lái)縮短預(yù)測(cè)時(shí)長(zhǎng)。
而支撐高通量計(jì)算、大規(guī)模推理及大內(nèi)存需求,是芯片企業(yè)的專長(zhǎng)。
活躍于AI for Science創(chuàng)新前沿的英特爾,已經(jīng)通過(guò)一系列軟硬件優(yōu)化舉措,為AlphaFold2提供算力支持與優(yōu)化,并為內(nèi)存“增量降耗”。其解決方案覆蓋AlphaFold2的預(yù)處理、模型推理和后處理三個(gè)階段,實(shí)現(xiàn)了端到端的性能優(yōu)化。
數(shù)據(jù)顯示,相比價(jià)格高昂的GPU平臺(tái),英特爾的AlphaFold2優(yōu)化方案結(jié)合了CPU的易獲取性和成本優(yōu)勢(shì),在提升推理效率的同時(shí)降低內(nèi)存消耗,既能滿足多實(shí)例、長(zhǎng)序列場(chǎng)景下的高通量計(jì)算與大規(guī)模推理需求,也能憑借大內(nèi)存優(yōu)勢(shì)支持更長(zhǎng)蛋白質(zhì)序列預(yù)測(cè)。
英特爾還為AlphaFold2提供了面向英特爾架構(gòu)優(yōu)化的PyTorch和PyTorch Just-In-Time(JIT)圖編譯技術(shù),并利用切分Attention模塊、算子融合、多實(shí)例并行等方案,提升計(jì)算效率,滿足高通量計(jì)算場(chǎng)景下同時(shí)處理多個(gè)蛋白質(zhì)序列的預(yù)測(cè)任務(wù)。
除了加速預(yù)測(cè)單個(gè)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè),基于英特爾架構(gòu)的方案同樣面向蛋白質(zhì)復(fù)合體預(yù)測(cè) (AlphaFold2 Multimer) 管線進(jìn)行了優(yōu)化與驗(yàn)證,提供更具性價(jià)比的算力支持。
目前,兼具高性價(jià)比、易獲取、廣泛生態(tài)支持等優(yōu)勢(shì)的英特爾架構(gòu)AlphaFold2解決方案已展開(kāi)實(shí)踐合作,加速走進(jìn)科研機(jī)構(gòu)、高校實(shí)驗(yàn)室以及生物制藥企業(yè),讓更多用戶能夠搭上AlphaFold2的“快車”。
二、給AI制藥裝上高速馬達(dá),加速藥物研發(fā)
在制藥行業(yè),AI技術(shù)正帶來(lái)效率的突破。
藥物研發(fā)長(zhǎng)期面臨高成本、長(zhǎng)周期、高風(fēng)險(xiǎn)的特點(diǎn),其效率與人們的健康息息相關(guān)。根據(jù)德國(guó)英戈?duì)柺┧毓I(yè)大學(xué)在2023年發(fā)表的一篇論文,2001-2020年期間,16家大型制藥公司的研發(fā)支出每年增長(zhǎng)6%,每款獲批新藥的平均研發(fā)費(fèi)用高達(dá)61.6億美元。
靶點(diǎn)發(fā)現(xiàn)是藥物發(fā)現(xiàn)早期的一個(gè)關(guān)鍵環(huán)節(jié)。而AI通過(guò)分析海量數(shù)據(jù),能夠快速識(shí)別潛在的藥物靶點(diǎn)和候選化合物,還能設(shè)計(jì)新的分子結(jié)構(gòu),大幅加速藥物開(kāi)發(fā)進(jìn)程。
國(guó)內(nèi)AI制藥龍頭企業(yè)英矽智能打造了AI靶點(diǎn)發(fā)現(xiàn)軟件平臺(tái)PandaOmics。該平臺(tái)通過(guò)內(nèi)置的20多種預(yù)測(cè)模型和生成生物學(xué)模型,囊括來(lái)自公開(kāi)文獻(xiàn)、科研基金、臨床試驗(yàn)的文本數(shù)據(jù),以及涵蓋遺傳學(xué)、蛋白質(zhì)組學(xué)和甲基化數(shù)據(jù)的多組學(xué)數(shù)據(jù),支持在藥物研發(fā)前期快速篩選出與特定疾病高度相關(guān)的潛在靶點(diǎn)和生物標(biāo)志物。
英特爾的處理器不僅能夠支持傳統(tǒng)的科學(xué)計(jì)算任務(wù),還能夠高效處理AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)任務(wù)。通過(guò)在其多元硬件產(chǎn)品上對(duì)基于C++開(kāi)發(fā)的晶體結(jié)構(gòu)預(yù)測(cè)類應(yīng)用實(shí)現(xiàn)軟硬協(xié)同優(yōu)化,英特爾進(jìn)一步增強(qiáng)了PandaOmics平臺(tái)的計(jì)算效率,并有助于降低研發(fā)成本。
例如,在第五代英特爾至強(qiáng)可擴(kuò)展處理器和酷睿Ultra 7處理器的算力支持下,PandaOmics平臺(tái)可以根據(jù)實(shí)際需求,靈活調(diào)用公有云SaaS服務(wù)或本地部署,加速藥物研發(fā)流程。
隨著大模型及生成式AI快速發(fā)展,AI在制藥行業(yè)的滲透率持續(xù)提升。在靈活高效的算力基座驅(qū)動(dòng)下,AI藥物發(fā)現(xiàn)工具將為醫(yī)生、科研人員及藥企提供更強(qiáng)助力,推動(dòng)研發(fā)效率提升、創(chuàng)新療法突破,加速探索更多疾病的治療路徑,最終為全球患者帶來(lái)挽救生命的希望。
三、壓低計(jì)算成本,讓基因組分析更加可持續(xù)
基因組分析是推動(dòng)醫(yī)學(xué)進(jìn)步的前沿學(xué)科。研究人員及醫(yī)療行業(yè)從業(yè)者可利用基因組分析來(lái)推動(dòng)新藥研發(fā)、為各種疾病探尋更奏效的診治方案?;蚪M分析還在全球范圍內(nèi)被廣泛應(yīng)用于群體測(cè)序、作物改良和人類微生物組研究。首次完成人類完整基因組測(cè)序耗時(shí)長(zhǎng)達(dá)13年,但如今,處理一個(gè)WGS(全基因組測(cè)序)樣本只需數(shù)小時(shí)。
英特爾通過(guò)與基因分析生態(tài)系統(tǒng)合作,持續(xù)加速基因組測(cè)序并降低成本。例如,其與科研機(jī)構(gòu)聯(lián)合開(kāi)發(fā)了一個(gè)由端到端軟硬件包構(gòu)成的基因組分析參考設(shè)計(jì),旨在優(yōu)化基因組分析解決方案的性能及簡(jiǎn)化解決方案的大規(guī)模部署,幫助用戶減少軟硬件評(píng)估的時(shí)間與成本。
該參考設(shè)計(jì)的組件經(jīng)調(diào)優(yōu),可充分發(fā)揮英特爾架構(gòu)的優(yōu)勢(shì)。第五代英特爾至強(qiáng)可擴(kuò)展處理器利用在內(nèi)核數(shù)量、主頻、內(nèi)存子系統(tǒng)和末級(jí)緩存方面的提升,及英特爾AVX-512指令集帶來(lái)的性能增益,既能節(jié)省功耗,又能以更低成本提供加速基因組研究所需的計(jì)算性能。
測(cè)試顯示,該研究機(jī)構(gòu)將基因組分析集群從第四代英特爾至強(qiáng)可擴(kuò)展處理器升級(jí)到第五代英特爾至強(qiáng)可擴(kuò)展處理器后,吞吐量提升高達(dá)61%,每節(jié)點(diǎn)每天處理的WGS樣本數(shù)量增加至多達(dá)3倍以上,可高達(dá)14.81個(gè)WGS樣本,從而解鎖更多可用于造福人類的基因信息。
在這個(gè)經(jīng)過(guò)驗(yàn)證的參考設(shè)計(jì)中,基因組分析的單位成本僅為2.34美元,每個(gè)WGS樣本的功耗僅為0.341千瓦時(shí),這意味著每個(gè)WGS樣本產(chǎn)生的二氧化碳排放僅為120.7克。
此外,英特爾開(kāi)發(fā)的基因組內(nèi)核庫(kù)(GKL)與研究機(jī)構(gòu)的基因組分析工具包 (Genomics Analytics Toolkit, GATK) 軟件集成后,進(jìn)一步優(yōu)化軟件,能更好地利用英特爾AVX-512提升計(jì)算密集型任務(wù)的性能。
英特爾參與合作開(kāi)發(fā)的基因組分析解決方案在高性能基因組計(jì)算與低功耗之間取得了平衡,可降低基因組測(cè)序的單位計(jì)算成本,加速WGS樣本處理,促進(jìn)解決方案的快速、便捷部署。該方案已在全球基因組研究與分析項(xiàng)目中得到應(yīng)用。
四、幫醫(yī)生“穿越時(shí)空”,實(shí)現(xiàn)優(yōu)質(zhì)醫(yī)療資源的共享
醫(yī)療資源不均的問(wèn)題,正被AI技術(shù)改善。
AI使高質(zhì)量的遠(yuǎn)程醫(yī)療服務(wù)成為可能,打破地域與經(jīng)濟(jì)的壁壘,讓偏遠(yuǎn)地區(qū)的患者也能獲得快速診斷和治療建議。加速這一進(jìn)程,離不開(kāi)高性能硬件的支持。
英特爾與復(fù)旦大學(xué)附屬中山醫(yī)院、聯(lián)影醫(yī)療等生態(tài)伙伴打造的“無(wú)界”智能虛擬元診室項(xiàng)目,利用計(jì)算機(jī)視覺(jué)、大模型、虛擬現(xiàn)實(shí)(VR)等技術(shù),將高水平醫(yī)療資源下沉到基層,為遠(yuǎn)程患者提供診前、診中、診后的全周期服務(wù),不僅使數(shù)字醫(yī)生能夠遠(yuǎn)程實(shí)時(shí)執(zhí)行真實(shí)醫(yī)生的指令,還為醫(yī)患雙方提供直觀、流暢、實(shí)時(shí)交互的交流體驗(yàn)。
在元診室的虛擬現(xiàn)實(shí)空間中,千里之外的醫(yī)患可實(shí)現(xiàn) “面對(duì)面” 交流。通過(guò)醫(yī)療設(shè)備數(shù)字孿生管理平臺(tái),在英特爾硬件的支持下,醫(yī)生可以精準(zhǔn)指導(dǎo)遠(yuǎn)程患者的檢查過(guò)程,患者也能通過(guò)三維重建的數(shù)字孿生模型,清晰直觀地了解病情和診療方案,進(jìn)而優(yōu)化醫(yī)患溝通體驗(yàn)。
基于英特爾計(jì)算機(jī)視覺(jué)及AI技術(shù),元診室提供打造了三維效果逼真的“數(shù)字醫(yī)生”。它由中山醫(yī)院的醫(yī)學(xué)知識(shí)訓(xùn)練而成,能夠?qū)崟r(shí)跟蹤以執(zhí)行醫(yī)生指令,輔助醫(yī)生進(jìn)行更全面的問(wèn)診,提高效率并減少誤診、漏診的風(fēng)險(xiǎn)。
英特爾優(yōu)化的醫(yī)療領(lǐng)域大模型技術(shù)與知識(shí)圖譜技術(shù)以及數(shù)字醫(yī)生,能夠有效幫助基層醫(yī)生完成針對(duì)疑難病癥的相關(guān)診斷工作。遇到一些復(fù)雜病情,基層醫(yī)生亦可以利用英特爾自由視角視頻技術(shù),通過(guò)云端算法和頭部追蹤算法將三維場(chǎng)景以數(shù)據(jù)形式傳輸至用戶端,向中山醫(yī)院專家實(shí)時(shí)展示患者病情,實(shí)現(xiàn)超越傳統(tǒng)視頻通話的多視角視頻會(huì)診體驗(yàn)。
尤其在醫(yī)療資源稀缺、醫(yī)療水平不足的地區(qū),這類推動(dòng)醫(yī)療服務(wù)數(shù)字化轉(zhuǎn)型的項(xiàng)目具有重要意義,有助于顯著提升診療效率和充分釋放醫(yī)療資源,實(shí)現(xiàn)優(yōu)質(zhì)醫(yī)療資源共享。
結(jié)語(yǔ):AI正為全球醫(yī)療健康帶來(lái)深遠(yuǎn)影響
在數(shù)字化浪潮的推動(dòng)下,算力成為數(shù)字經(jīng)濟(jì)時(shí)代的關(guān)鍵生產(chǎn)力,深刻地改變生物科學(xué)與醫(yī)療行業(yè)。從加速藥物研發(fā)、基因組分析到虛擬診療、患者管理,AI技術(shù)正全方位地推動(dòng)生命科學(xué)領(lǐng)域的創(chuàng)新突破和醫(yī)療體系的數(shù)字化轉(zhuǎn)型,為全球醫(yī)療健康與公共衛(wèi)生開(kāi)辟新的發(fā)展路徑。
坐擁龐大的CPU市場(chǎng)和生態(tài)系統(tǒng),英特爾通過(guò)軟硬件協(xié)同組合,向廣大醫(yī)生及科研人員提供性能強(qiáng)大且經(jīng)濟(jì)高效的算力底座,以潤(rùn)物細(xì)無(wú)聲的方式持續(xù)改善AI在生命科學(xué)和醫(yī)療領(lǐng)域的部署效率與體驗(yàn)。這些融入前沿技術(shù)的愛(ài)與責(zé)任,將推動(dòng)高質(zhì)量的醫(yī)療資源進(jìn)步與普及,為造福大眾醫(yī)療健康創(chuàng)造深遠(yuǎn)價(jià)值。