揚子科創(chuàng)中心
夯實健康醫(yī)療大數(shù)據(jù)應用基礎,數(shù)據(jù)互聯(lián)融合是關(guān)鍵
一直以來,阻礙醫(yī)療大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的問題有兩個,一個是數(shù)據(jù)互聯(lián)互通的融合問題,一個是數(shù)據(jù)共享機制的問題。在政策層面,國家出臺了一系列政策文件,以推動和深化我國健康醫(yī)療大數(shù)據(jù)的發(fā)展。國務院2016年印發(fā)《國務院辦公廳關(guān)于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》,強調(diào)要夯實健康醫(yī)療大數(shù)據(jù)應用基礎,重點任務包括加快建設統(tǒng)一權(quán)威、互聯(lián)互通的人口健康信息平臺,推動健康醫(yī)療大數(shù)據(jù)互聯(lián)融合、開放共享等。
作為推進健康醫(yī)療大數(shù)據(jù)應用發(fā)展的重點工程之一, 2016年10月,首批國家健康醫(yī)療大數(shù)據(jù)中心及產(chǎn)業(yè)園落戶在南京江北新區(qū)的揚子科創(chuàng)中心,規(guī)劃為 “1個中心+3個應用基地”四大功能片區(qū),分別是健康醫(yī)療大數(shù)據(jù)存儲中心、國際健康服務社區(qū)、南京生物醫(yī)藥谷及健康科技產(chǎn)業(yè)園。
杰若創(chuàng)牽頭籌建國家健康醫(yī)療大數(shù)據(jù)中心,為中心提供創(chuàng)新的企業(yè)級存儲服務和高性能計算服務,并負責整個中心的運維。公司依托在大數(shù)據(jù)、人工智能算法等新興技術(shù)領域的優(yōu)勢以及在數(shù)據(jù)中心建設與安全、大數(shù)據(jù)解決方案、高性能計算等方面的經(jīng)驗積累,圍繞國家健康醫(yī)療大數(shù)據(jù)(南京)中心和揚子云計算中心兩塊業(yè)務展開工作,一年多來成效卓著。目前已經(jīng)全面完成健康醫(yī)療大數(shù)據(jù)存儲中心一期工程,設置了三個機房,存儲容量達52PB,足以整合江蘇省8000萬人的個人健康檔案和電子病歷及全省174家三級醫(yī)院影像資料。
破解大數(shù)據(jù)存儲中安全與開放的矛盾
大數(shù)據(jù)是一種規(guī)模巨大,且從獲取、存儲、管理到分析都極大超越了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。
當前,健康醫(yī)療大數(shù)據(jù)規(guī)模及其存儲容量呈爆發(fā)式增長。健康醫(yī)療大數(shù)據(jù)存儲中心運營負責人、杰若創(chuàng)信息科技有限公司總經(jīng)理管曉寅認為,健康醫(yī)療大數(shù)據(jù)除了具備大數(shù)據(jù)的這些特征外,還具有對安全要求高、強調(diào)開放與共享等特點。安全是指,要保證醫(yī)療健康與生命科學這些數(shù)據(jù)的高度安全。開放與共享是指,要確保數(shù)據(jù)有充足的流動性和開放性,便于開放給科研單位、科研機構(gòu)與公司,讓數(shù)據(jù)得以充分挖掘、高效利用并釋放無限潛力。
而安全需求與開放共享,是一對與生俱來的矛盾,該如何解決這個矛盾呢?
在杰若創(chuàng)執(zhí)行董事兼CTO劉健看來,這是對IT系統(tǒng)提出綜合要求:
1、海量數(shù)據(jù)的實時存儲:比如正在開展的人類基因組計劃,測序一次全基因組得到的數(shù)據(jù)量超過90GB,存儲中心要對這些數(shù)據(jù)7×24小時不間斷的實時存儲;
2、嚴格的數(shù)據(jù)安全保護機制:必須保證收集到的這些異常珍貴的原始數(shù)據(jù)能安全、完整地進行存儲;
3、快速的數(shù)據(jù)傳輸:數(shù)據(jù)存儲之后能夠安全、快速、便捷地傳輸;
4、隨需應用:需要在現(xiàn)有的框架下合理、方便地管理數(shù)據(jù),在應用端發(fā)出數(shù)據(jù)請求時,第一時間把正確的數(shù)據(jù)傳輸?shù)叫枰挠脩裟抢镆詰獙`活調(diào)用。
傳統(tǒng)的IT平臺在面臨海量數(shù)據(jù)存儲、保護和業(yè)務應用需求時,難以協(xié)同高效地滿足以上需求,并且面臨資源耗費過大的問題。這就需要采用新的技術(shù)和手段,進行數(shù)據(jù)獲取、存儲和分析。
突破存儲江蘇8000萬人健康檔案的“不可能”
在國家健康醫(yī)療大數(shù)據(jù)(南京)中心,杰若創(chuàng)與IBM進行深度合作,建立起一整套的大數(shù)據(jù)平臺和高智能計算平臺,該平臺能對數(shù)據(jù)的采集、存儲和分析提供有力支撐,兼顧數(shù)據(jù)安全的同時,確保了數(shù)據(jù)的開放性和流動性。
混合架構(gòu)下的大數(shù)據(jù)和高智能計算平臺
這套大數(shù)據(jù)和高智能計算解決方案,包括三個層次的產(chǎn)品:在最底層采用IBM Cloud Object Storage (Cleversafe) 作為IBM云對象存儲,它的主要特點就是容量大、安全性好,目前配置容量達到15PB,導入了大量的基因組數(shù)據(jù);在此之上應用IBM ESS高性能存儲,解決了多用戶負載平衡的問題,高效的滿足不同用戶對數(shù)據(jù)的請求;在最上面的應用層,采用IBM Spectrum LSF調(diào)度系統(tǒng),IBM Spectrum LSF的主要作用是進行硬件計算資源的統(tǒng)一調(diào)度和管理,例如為上百個用戶提交的不同的任務高效地分配資源,并能支持未來開發(fā)針對智能診斷、精準醫(yī)學等方面的應用。
“這套解決方案滿足了我們對數(shù)據(jù)容量、數(shù)據(jù)安全、數(shù)據(jù)傳輸速率和數(shù)據(jù)管理等最基本的數(shù)據(jù)處理要求,節(jié)省了我們的人力成本,并且能足夠靈活地支撐我們對不同業(yè)務的需求,這些都是傳統(tǒng)平臺不可能完成的任務”,杰若創(chuàng)總經(jīng)理管曉寅表示。
與此同時,在杰若創(chuàng)運營的揚子云計算中心,IBM ESS高性能存儲和IBM云對象存儲(Cleversafe)也發(fā)揮著不可替代的作用。揚子云計算中心同樣坐落于南京江北新區(qū)的揚子科創(chuàng)中心,是全國首個完全商業(yè)化運行的高性能計算與大數(shù)據(jù)中心。該中心將常用的數(shù)據(jù)存在讀寫速度比較高的IBM ESS高性能存儲,不常用的數(shù)據(jù)存在成本更低的對象存儲,從而實現(xiàn)了更高效的資源配置。IBM ESS高性能存儲通過將存儲與計算分離、獨立按需擴容,保證集群能夠靈活多變的擴展,避免了傳統(tǒng)的分布式架構(gòu)必須要同時擴容存儲和計算而導致的容量或資源浪費。
IBM云對象存儲(Cleversafe)在應對海量增加的非結(jié)構(gòu)化數(shù)據(jù)的安全問題時極具優(yōu)勢。以跨站點數(shù)據(jù)切片的方式保存數(shù)據(jù),并采用先進的數(shù)據(jù)糾纏碼加密技術(shù),IBM云對象存儲(Cleversafe)比傳統(tǒng)存儲更安全。此外,IBM云對象存儲(Cleversafe)保證數(shù)據(jù)隨時可以訪問和使用,并且為用戶的未來做了規(guī)劃,比如未來三五年的擴容、數(shù)據(jù)向云端遷移,以及彈性拓展適應大數(shù)據(jù)需求和AI智能管理等。
“這樣的解決方案是對傳統(tǒng)的分布式架構(gòu)的顛覆性跨越,無論從經(jīng)濟性、安全性、可擴展性、可用性,還是數(shù)據(jù)的備份等各個方面看,都比傳統(tǒng)的分布式存儲更先進”,杰若創(chuàng)執(zhí)行董事兼CTO劉健總結(jié)說。
IBM大中華區(qū)硬件系統(tǒng)部存儲及軟件定義基礎架構(gòu)總經(jīng)理吳磊表示:“南京江北新區(qū)健康醫(yī)療大數(shù)據(jù)中心被公認為行業(yè)的標桿,為健康醫(yī)療行業(yè)深入挖掘大數(shù)據(jù)的潛力起到很好的示范引領作用。IBM領先的數(shù)據(jù)存儲技術(shù)能為大數(shù)據(jù)在健康醫(yī)療行業(yè)的深度應用奠定良好的軟硬件基礎,提供強力支撐。我們將一如既往地發(fā)揮IBM在大數(shù)據(jù)、人工智能、高性能服務器存儲等方面的技術(shù)優(yōu)勢,為推動健康醫(yī)療大數(shù)據(jù)應用發(fā)展、推進實施健康中國戰(zhàn)略做出積極貢獻。”
以此次合作為起點,雙方將共同描繪健康醫(yī)療大數(shù)據(jù)發(fā)展藍圖,朝著“健康中國”的愿景奮力前行。