aishu 發(fā)表于:14年06月05日 16:18 [綜述] DOIT.com.cn
企業(yè)文檔深似海
Gartner報告指出,非結構化數(shù)據(jù)每年以60%~80%的速度快速增長。企業(yè)內部80%以上的數(shù)據(jù)都是非結構化的文檔數(shù)據(jù),海量數(shù)據(jù)不斷增長為非結構化數(shù)據(jù)的存儲、查找、分享協(xié)作和管理帶來巨大挑戰(zhàn)。
時下熱門的網(wǎng)盤,無論是企業(yè)網(wǎng)盤還是個人網(wǎng)盤,本質上來說都是桌面文件備份、多設備訪問和個人共享而設計的。面對中大型企事業(yè)單位,百萬級千萬級的文檔數(shù)據(jù),如何高效的存儲管理、共享協(xié)作、查找使用卻是心有余而力不足。
一般的云存儲卻很少有涉及到全文檢索,究其原因,就在于一方面?zhèn)人或者簡單的團隊網(wǎng)盤,全文檢索不是必須的,另一方面,基于分布式云存儲的全文檢索,本身就有其技術復雜度。
企業(yè)級文檔同步共享平臺必備全文檢索
針對海量文檔的存儲、搜索和查找難題,愛數(shù)率先在業(yè)界推出了基于云存儲的全文檢索,AnyShare發(fā)布后,添補了這一領域的空白,成為了業(yè)內第一個支持全文檢索的企業(yè)級云存儲,建立起了企業(yè)級文件同步共享平臺的新臺階。
常見的全文檢索建立索引的方法有兩種:一種是文檔上傳過程中立即或者后臺自動建立索引;另一種是單獨一臺全文檢索服務器,先從文檔服務器上面把所有文件下載下來,然后建立索引。第一種方式是以犧牲文檔訪問的流流暢性來建立索引,第二種方式卻造成了服務器資源的浪費。
愛數(shù)AnyShare針對上述技術存在的缺陷,提供了一種維護方便、提交檢索效率、降低訪問壓力的全文檢索系統(tǒng),通過合理的流程將對象存儲系統(tǒng)和全文檢索系統(tǒng)松耦合地結合起來,對指定格式的文檔建立索引,即降低文檔存儲系統(tǒng)的壓力,又提高全文檢索系統(tǒng)建立索引的效率。
全文檢索服務靈活的分布在AnyShare其中一個節(jié)點上,最重要的是,全文檢索的服務本身是可以根據(jù)集群的負載進行靈活遷移,提升了集群的適應性和靈活性。當用戶通過客戶端或者WEB搜索文檔時,AnyShare基于權限搜索該用戶可訪問的資料,并通過關鍵字檢索出相關的文檔資料。
發(fā)現(xiàn)你需要的文檔
用戶訪問AnyShare中的資料時,根據(jù)用戶、設備和權限的不同,用戶訪問資料的范圍不同。用戶只可訪問和搜索自己訪問權限內的文檔資料。
而且結合AnyShare創(chuàng)新的發(fā)現(xiàn)共享,任何用戶都可以檢索到某個用戶A貢獻出來的發(fā)現(xiàn)共享資料,比如A有某個資料F很棒,覺得可以貢獻出來,通過開啟發(fā)現(xiàn)共享模式,這樣其他用戶在搜索到與F文檔內容相關的關鍵詞,就可以優(yōu)先找到A貢獻出來的資料F。
在用戶體驗方面,網(wǎng)頁訪問時,輸入關鍵字即可檢索到與關鍵字相關的資料。所有關鍵字高亮顯示,并呈現(xiàn)出100字的摘要,便于用戶快速找到自己想要的資料。移動客戶端訪問時,輸入關鍵字即可查找到與關鍵字匹配的文件名。
文檔進入查找時代
企業(yè)、政府、學校都發(fā)現(xiàn)大量的內部文檔數(shù)據(jù)沒有有效的利用、分享和管理起來,而查找,作為使用的最初環(huán)節(jié),就像互聯(lián)網(wǎng)的搜索時代一樣,搜索的到來解放的網(wǎng)站資料的價值,同樣的,全文檢索對于企業(yè)文檔資料的意義非凡。在海量的資料面前,查找是第一入口,所以,企業(yè)文檔資料的查找時代已經(jīng)到來了。
在移動互聯(lián)的大趨勢下,除了我們所喜歡的網(wǎng)盤備份、訪問和共享體驗之外,對于企業(yè)級的文檔共享平臺,全文檢索無疑是必需品,這也提醒了我們企事業(yè)單位在進行內部非結構化數(shù)據(jù)存儲管理共享平臺建設,海量文檔資料面前,查找作為第一入口,必不可少。
作為私有應用云存儲--文檔云--的領導者,愛數(shù)AnyShare在文檔共享使用、開放云存儲和文檔的搜索、使用訪問方面,無疑能夠可以幫助用戶獲得更加領先一步的體驗。