端到端支持用友醫(yī)療數(shù)據(jù)大挖掘
許振新 發(fā)表于:13年05月20日 00:00 [原創(chuàng)] DOIT.com.cn
“2009年開始我們已經(jīng)開始做Hadoop,當時是作為一個創(chuàng)新主題,看看Hadoop的架構、應用場景是什么。由于當時中國有具體的需求,大數(shù)據(jù)環(huán)境非常好,并且有電信行業(yè)典型的用戶需求。這都推動我們馬上把Hadoop變成了一個產(chǎn)品來滿足客戶的需求。”苗凱翔博士回憶說。
英特爾中國行業(yè)合作解決方案服務部企業(yè)技術銷售與數(shù)據(jù)中心咨詢資深經(jīng)理張哲源表示,正是有了Hadoop的加入,英特爾才能實現(xiàn)“軟硬”的有機組合,構成了英特爾針對大數(shù)據(jù)應用提供的端到端支持,推動更多的合作伙伴在其上開發(fā)適合行業(yè)需求的大數(shù)據(jù)解決方案。
端到端支持用友醫(yī)療數(shù)據(jù)大挖掘
作為英特爾醫(yī)療行業(yè)大數(shù)據(jù)的重要合作伙伴,用友展示了其基于英特爾平臺的大數(shù)據(jù)解決方案。用友醫(yī)療衛(wèi)生信息系統(tǒng)有限公司副總裁、用友智慧健康研究院首席專家徐春華介紹, 醫(yī)療行業(yè)和大數(shù)據(jù)相關的主要有三大領域,也即電子健康檔案、城市級的電子病歷數(shù)據(jù)中心和衛(wèi)生醫(yī)療相關的統(tǒng)計數(shù)據(jù)。這三個領域的數(shù)據(jù)有著共性的特征:海量數(shù)據(jù)、結構化半結構化并存、版本隨著時間而改變。有鑒于此,用友將大數(shù)據(jù)技術主要用于三大數(shù)據(jù)庫的建設上。
“這些領域必須采用大數(shù)據(jù)處理手段來處理,關鍵要素涉及到兩個:一是通過引入并行計算框架提高整個解決方案的運行性能,到了PB級數(shù)據(jù)以后,運行時間成為了關鍵參數(shù);二是基于列的數(shù)據(jù)庫架構,它和傳統(tǒng)的關系型數(shù)據(jù)庫有很大的差異。”徐春華說。
在過去一年中,用友醫(yī)療和英特爾上海Hadoop團隊開展了深入的合作,采用基于英特爾x86服務器集群+Hadoop綜合解決方案來嘗試處理大型電子健康檔案和區(qū)域性的醫(yī)療質量分析。目前從運轉情況來看效果非常理想。
在醫(yī)療行業(yè),用友采用的計算架構有三類:x86服務器、小型機、大型主機。談到大數(shù)據(jù)領域用友為什么會選擇x86集群?徐春華表示,傳統(tǒng)做計算架構或者存儲架構的時候,經(jīng)常要考慮3年到5年的存儲量。但這樣往往存在著大量的浪費,因為剛開始往往用不到那么大的量。而英特爾提倡的橫向擴展模式,可以根據(jù)業(yè)務的規(guī)模而隨時增加計算和存儲能力,這是用友和用友的客戶非常樂于接受的一種模式。