基于JMP軟件的關聯(lián)性分析篩選的界面

Text Mining文本挖掘

它是用來解決大數據“非結構化”問題的。通過先對文字、圖像等新媒體信息源進行降維、去噪、轉換等處理,產生結構化數據,再用成熟的統(tǒng)計分析和數據挖掘方法進行評價和解釋。這樣一來,大數據的應用范圍得到了極大的拓展。

基于JMP軟件的文本分析結果的最終展現(xiàn)界面

Imputation缺失數賦值

它是用來解決大數據“殘缺”問題的。在有missing data的時候,我們并不完全排斥直接刪除的方法,但更多的時候,我們會在條件允許的情況下,用賦值的方法去替代原先的缺失值。具體的技術很多,簡單的如計算平均值、中位數、眾數之類的統(tǒng)計量,復雜的如用回歸、決策樹、貝葉斯定理去預測缺失數的近似值等。這樣一來,大數據的質量大為改觀,為后期的分析與建模奠定了扎實的基礎。

基于JMP軟件的缺失數賦值方法選擇的操作界面

Robust Modeling穩(wěn)健建模

它是用來解決大數據“異常”問題的。在融入了自動識別、重要性加權等處理手段后,分析人員既直接消除了個別強影響點的敏感程度,又綜合考慮了所有數據的影響,增強了模型的抗干擾能力,使得模型體現(xiàn)出良好的預測特性,由此做出的業(yè)務決策自然變得更加科學、精準。

基于JMP軟件的模型穩(wěn)健擬合的報表界面

總之,我們必須要對大數據有一個全面、客觀的認識。只有在不同的業(yè)務和數據背景下采用不同的戰(zhàn)略戰(zhàn)術,才能在大數據時代,真正發(fā)揮大數據的杠桿作用,有效提高企業(yè)的運營效率和市場競爭力。

分享到

zhoujianding

相關推薦