基于JMP軟件的關聯(lián)性分析篩選的界面

Text Mining文本挖掘

它是用來解決大數(shù)據(jù)“非結構化”問題的。通過先對文字、圖像等新媒體信息源進行降維、去噪、轉換等處理,產生結構化數(shù)據(jù),再用成熟的統(tǒng)計分析和數(shù)據(jù)挖掘方法進行評價和解釋。這樣一來,大數(shù)據(jù)的應用范圍得到了極大的拓展。

基于JMP軟件的文本分析結果的最終展現(xiàn)界面

Imputation缺失數(shù)賦值

它是用來解決大數(shù)據(jù)“殘缺”問題的。在有missing data的時候,我們并不完全排斥直接刪除的方法,但更多的時候,我們會在條件允許的情況下,用賦值的方法去替代原先的缺失值。具體的技術很多,簡單的如計算平均值、中位數(shù)、眾數(shù)之類的統(tǒng)計量,復雜的如用回歸、決策樹、貝葉斯定理去預測缺失數(shù)的近似值等。這樣一來,大數(shù)據(jù)的質量大為改觀,為后期的分析與建模奠定了扎實的基礎。

基于JMP軟件的缺失數(shù)賦值方法選擇的操作界面

Robust Modeling穩(wěn)健建模

它是用來解決大數(shù)據(jù)“異常”問題的。在融入了自動識別、重要性加權等處理手段后,分析人員既直接消除了個別強影響點的敏感程度,又綜合考慮了所有數(shù)據(jù)的影響,增強了模型的抗干擾能力,使得模型體現(xiàn)出良好的預測特性,由此做出的業(yè)務決策自然變得更加科學、精準。

基于JMP軟件的模型穩(wěn)健擬合的報表界面

總之,我們必須要對大數(shù)據(jù)有一個全面、客觀的認識。只有在不同的業(yè)務和數(shù)據(jù)背景下采用不同的戰(zhàn)略戰(zhàn)術,才能在大數(shù)據(jù)時代,真正發(fā)揮大數(shù)據(jù)的杠桿作用,有效提高企業(yè)的運營效率和市場競爭力。

分享到

zhoujianding

相關推薦