<富士通大數據自動分析技術的特性>

基于數據模型的分析模板管理。在該項新技術中,分析流程(分析處理程序)設計為分析模板的形式,結合了包括預處理和分析流程在內的不同分析組件。這些分析模板代表著分析組件組合和分析組件參數。這些分析組件參數以專門的分析技術為基礎,例如,哪類數據可以組合使用,如何進行數據預處理,應該應用何種技術和工具,以及詮釋和利用分析結果的最佳方法。利用該項新技術建立模板時,垂直行業(yè)/工作流程分類、分析目標,以及其它元數據,和需要分析數據的內容和屬性,均予以編碼以匹配標準數據模型,因而分析模板的優(yōu)越特性得以實現。

基于數據剖析的分析模板推薦。開始一項新的分析時,可以使用元數據推薦分析模板,如垂直行業(yè)/工作流程分類和分析目標。然而,這種方法并不適用于涉及多個業(yè)務領域或復雜流程的分析問題,而且也不支持在分析開始階段分析目標尚未完全定義的情況。另一方面,為了處理這些情況(迄今為止分析人員已有成功先例),Fujitsu (富士通)開發(fā)的技術采取了一種全新方式,根據需要分析數據的內容和屬性推薦分析模板。

通過明確要分析的數據和使用數據剖析技術,Fujitsu (富士通)開發(fā)的新技術可以提取并評估數據的內容(數據項的含義)和屬性(例如數據量及其分布等屬性)(圖 3.2)。通過將這些剖析的內容和屬性與數據模型匹配的流程,能夠為正在分析的數據推薦適用的模板(圖 3.3)。

關于附加數據可能使用組合的建議。運用大數據時,常見的做法是,對各種異構數據的組合進行多層面的分析,以發(fā)現和分析從單一的數據集中無法察覺的隱藏的因果關系(影響)。迄今為止,發(fā)現這些數據組合需要專門的分析技術和反復試驗。

利用Fujitsu (富士通)開發(fā)的新技術,在分析模板的推薦流程中,系統(tǒng)不僅會搜索可能使用的分析模板,而且也將搜索適用于超出特定數據集的附加數據的分析模板。通過為這類附加數據提供建議,能夠發(fā)現各種數據組合類型。

<結果>

該項新技術能夠讓用戶再次使用和恢復數據分析的專門技術。只要數據能夠進行分析,基于數據剖析的推薦就可以實現循環(huán)分析流程,從數據集中發(fā)現分析模板并應用于分析模板,然后加入可能的附加數據組合,實現分析模板的再次應用。

反之,這可以實現新的分析應用程序的創(chuàng)立和使用,同時也擴展了分析目標范圍和可用數據范圍。

<未來發(fā)展>

通過使用應用該項新技術的分析系統(tǒng),目前,Fujitsu (富士通)正在開發(fā)分析組件和分析模板,以適用于更大范圍的工作流程,包括物流業(yè)和制造業(yè)的客戶管理、市場營銷、產品推薦、質量保證,和風險管理。 Fujitsu (富士通)已經根據迄今為止開發(fā)的大量專有技術執(zhí)行分析方案,這些專有技術包括市場中的缺陷跡象檢測技術和風險情景分析技術。展望未來,公司將繼續(xù)致力于將技術應用于現實世界的問題,同時擴展垂直行業(yè)及其所支持工作任務的范圍。

富士通株式會社計劃將該項技術作為Interstage Business Analytics Modeling Server(構建分析解決方案的中間件文件包)的一部分投入市場。

分享到

zhaohang

相關推薦