據(jù)市場(chǎng)研究公司IDC統(tǒng)計(jì),未來(lái)10年里預(yù)計(jì)數(shù)字信息總量將在2009年到2020年期間增長(zhǎng)44倍,全球數(shù)據(jù)使用量將達(dá)到大約35.2ZB(1ZB=10億TB)。與此同時(shí),單個(gè)數(shù)據(jù)集的文件尺寸也將增加,導(dǎo)致對(duì)更大處理能力的需求以便分析和理解這些數(shù)據(jù)集。一項(xiàng)由UnisphereResearch對(duì)531名獨(dú)立Oracle用戶進(jìn)行的調(diào)查發(fā)現(xiàn),百分之九十的企業(yè)的數(shù)據(jù)量在迅速上漲,其中16%的企業(yè)每年的增長(zhǎng)率達(dá)到50%或更高。不少企業(yè)已經(jīng)感受到失控?cái)?shù)據(jù)增長(zhǎng)對(duì)績(jī)效造成的沖擊,其中發(fā)現(xiàn)87%的受訪者將企業(yè)的應(yīng)用程序性能問(wèn)題歸咎于不斷增長(zhǎng)的數(shù)據(jù)量。
有專家認(rèn)為,"大數(shù)據(jù)"的推動(dòng)因素主要是來(lái)自一些特大型公司,如谷歌、Youtube等。這些公司需要以非常優(yōu)化的方式分析數(shù)據(jù)和讓計(jì)算與存儲(chǔ)配合工作。另外,一些來(lái)自健康醫(yī)療、地理空間影像和數(shù)字媒體等行業(yè)的各種大數(shù)據(jù),很顯然,這些數(shù)據(jù)到不一定有多大,但是處理這些數(shù)據(jù)集通常要分配到幾個(gè)系統(tǒng)耗費(fèi)超過(guò)24個(gè)小時(shí)的時(shí)間才能完成。