郭朝暉于1997年加盟寶鋼,長期從事信息,模型,自動控制,大數(shù)據(jù)等領(lǐng)域的技術(shù)研發(fā)工作,在企業(yè)一線積累了寶貴的經(jīng)驗(yàn)。

他表示,工業(yè)大數(shù)據(jù)能否真正落地,取決于能否創(chuàng)造經(jīng)濟(jì)價(jià)值。要體現(xiàn)價(jià)值,必須找到合適的場景。而價(jià)值的持續(xù)創(chuàng)造,必須與日常的生產(chǎn)或管理流程相結(jié)合。為此,必須理解工業(yè)大數(shù)據(jù)的特殊要求,那就是可靠性。

可靠:工業(yè)的基本要求

工業(yè)數(shù)據(jù)分析的項(xiàng)目常常不了了之、虎頭蛇尾。為什么呢?

業(yè)界在談到數(shù)據(jù)應(yīng)用的時(shí)候,往往是在說它好的一面,比如說數(shù)據(jù)中有信息,數(shù)據(jù)中有知識,數(shù)據(jù)是有用的;但是,業(yè)界往往會忽略其另外一面,比如說數(shù)據(jù)有假的,有錯(cuò)的,有偏差很大的,有暫時(shí)性的。

特別地,人們對分析結(jié)果有一個(gè)基本的要求:可靠??煽啃砸蠛褪褂脙r(jià)值往往是硬幣的兩面:如果價(jià)值很大,則往往對分析結(jié)果的可靠性要求很高;反之,對可靠性要求不高的分析,價(jià)值也不會很大。如果正確的分析結(jié)果能夠帶來很大的效益,錯(cuò)誤的分析結(jié)果往往也會帶來巨大的損失。

工業(yè)大數(shù)據(jù)分析結(jié)果的可靠性成為重中之重。然而,當(dāng)前無論是從數(shù)據(jù)質(zhì)量層面,亦或是在分析理論層面,工業(yè)大數(shù)據(jù)均面臨挑戰(zhàn)。

在工業(yè)過程中,數(shù)據(jù)質(zhì)量差是種常態(tài)。在傳統(tǒng)的分析理論,同樣面臨挑戰(zhàn)。

場景一:鋼鐵的成分和工藝怎么提升煉鋼的性能,這個(gè)模型的建立非常重要,這是鋼鐵工業(yè)60多年來的一個(gè)夢想。但是在建模的過程中,分析師會發(fā)現(xiàn)模型的精度總是提不高,不同的人會得出完全不同的模型。

是否存在精確的模型?郭朝暉的結(jié)論是:不可能的。因?yàn)閿?shù)據(jù)的誤差制約了模型的精度。
在實(shí)踐中,郭朝暉發(fā)現(xiàn),如果自變量存在顯著誤差,用誤差最小化的優(yōu)化方法,可能都存在分析結(jié)果與真實(shí)性的偏離的問題。這對傳統(tǒng)建模理論是一個(gè)極大的沖擊。

場景二:相關(guān)性與因果性。比如,A鋼種,很少發(fā)生缺陷,所以不對其進(jìn)行檢驗(yàn),B鋼種容易發(fā)生缺陷,必須經(jīng)常進(jìn)行檢驗(yàn);導(dǎo)致的結(jié)果卻是,A鋼種缺陷率高,B鋼種缺陷率低。

長期以來,在工業(yè)過程中,工程師往往采用前饋、反饋的手段,構(gòu)成一個(gè)復(fù)雜的人造系統(tǒng)。所以常常有這樣的現(xiàn)象(幾乎是必然會發(fā)生的):某一個(gè)變量如果有重大影響,權(quán)重極高,分析師一定會想方設(shè)法降低其影響力。

這說明,從工業(yè)大數(shù)據(jù)中淘金,相關(guān)性分析可能是不夠的。

回歸分析與相關(guān)性分析,都存在某種程度的失效,工業(yè)大數(shù)據(jù)還能怎么玩?

工業(yè)條件往往不高,導(dǎo)致分析師不能提出不現(xiàn)實(shí)的數(shù)據(jù)的要求;分析的誤差也比較大,因?yàn)檫^程中看不見的原因有很多……這都是造成最后的分析結(jié)果似是而非,不了了之。

怎么辦?

提高數(shù)據(jù)質(zhì)量 采用合理的分析方法

可靠性是工業(yè)大數(shù)據(jù)的靈魂,這與商務(wù)大數(shù)據(jù)(包括互聯(lián)網(wǎng)大數(shù)據(jù))具有本質(zhì)的不同。那么,怎么提高工業(yè)大數(shù)據(jù)的可靠性?數(shù)據(jù)質(zhì)量和分析方法(思路),成為兩大關(guān)鍵,而組織好數(shù)據(jù)是基礎(chǔ)。

郭朝暉表示,在思維上,要認(rèn)識到工業(yè)大數(shù)據(jù)要求數(shù)據(jù)的完整性與真實(shí)性,包括存儲數(shù)據(jù)時(shí)的真實(shí)性,組織數(shù)據(jù)時(shí)的結(jié)構(gòu)化,分析數(shù)據(jù)時(shí)的預(yù)處理。

如果在開始時(shí),數(shù)據(jù)沒有進(jìn)行很好的組織,到最后肯定是分析不出結(jié)果的。因此,要想把工業(yè)大數(shù)據(jù)用好,在分析階段,在組織數(shù)據(jù)和收集數(shù)據(jù)時(shí),就該想到數(shù)據(jù)是干什么用的,否則很有可能收集到的數(shù)據(jù)是不能用的。

“首先是為人的分析創(chuàng)造條件,然后才能有自動化的分析?!惫瘯熣f。

2013年3月,IBM公司在發(fā)布的《分析:大數(shù)據(jù)在現(xiàn)實(shí)世界中的作用》白皮書中,對大數(shù)據(jù)的4V理論進(jìn)行了修改,把其中的商業(yè)價(jià)值(Value)修改為Veracity(真實(shí)性)。IBM認(rèn)為,“前3個(gè)V涵蓋了大數(shù)據(jù)本身的關(guān)鍵屬性,但真實(shí)性是當(dāng)前企業(yè)亟需考慮的重要維度,將促使他們利用數(shù)據(jù)融合和先進(jìn)的數(shù)學(xué)方法進(jìn)一步提升數(shù)據(jù)的質(zhì)量,從而創(chuàng)造更高價(jià)值。”

據(jù)介紹,對于真實(shí)性,寶鋼老專家王洪水認(rèn)為,真實(shí)性首先是數(shù)據(jù)的完整性,數(shù)據(jù)之間的聯(lián)系要盡可能完整地記錄下來。而郭朝暉認(rèn)為,我們不僅要知道數(shù)據(jù)是什么,還要知道數(shù)據(jù)是怎么來的。有時(shí)候,這比數(shù)據(jù)本身更重要,是分析問題的關(guān)鍵所在。

一個(gè)完整性,不僅僅包含過程本身、對象本身的完整性,還要包含數(shù)據(jù)本身的邏輯的完整性。這樣,在使用的時(shí)候,才能不被假象所誤導(dǎo)。事實(shí)上,“做數(shù)據(jù)分析的,本身就是不斷地與假象做斗爭。”

有專家認(rèn)為,數(shù)據(jù)分析無非有兩種方法,一種是先對數(shù)據(jù)的分布做出某種假設(shè),結(jié)論的正確性依賴于假設(shè)的正確性;另外一種不作出假設(shè),直接根據(jù)數(shù)據(jù)之間的關(guān)聯(lián)得出結(jié)論。所有的方法,離不開這兩種。如果第一種方法的前提可行,結(jié)論一定是可靠的。但現(xiàn)實(shí)問題卻是:數(shù)據(jù)分布往往不能滿足某些分析方法的要求。

郭朝暉認(rèn)為,為此要把分析的重點(diǎn)轉(zhuǎn)到幕后去,也就是在原始數(shù)據(jù)的基礎(chǔ)上,通過人工分析來選定數(shù)據(jù)和創(chuàng)造條件,從而得到一個(gè)可靠的統(tǒng)計(jì)的辦法。

“絕對可靠是不存在的。我們只能得到相對的可靠。如果從多個(gè)維度去論證其合理性,并且沒有明顯的反例,我們或許就可以認(rèn)可這個(gè)結(jié)論。”

從數(shù)據(jù)到數(shù)據(jù)的方法就像是坐井觀天:因?yàn)槲覀儾恢罃?shù)據(jù)產(chǎn)生背后的原因。同時(shí),工業(yè)界的數(shù)據(jù)往往是多維度的,如果僅僅想從數(shù)據(jù)本身證明某個(gè)結(jié)論,數(shù)據(jù)量往往是不夠的。

“一定要把知識和機(jī)理融合進(jìn)去,當(dāng)這兩者同時(shí)滿足時(shí),才有可能得到一個(gè)可靠的結(jié)果?!?/p>

合適的場景決定了工業(yè)大數(shù)據(jù)的價(jià)值

在現(xiàn)實(shí)中,往往先進(jìn)的東西不實(shí)用,實(shí)用的東西往往不先進(jìn);對于新技術(shù),只有運(yùn)用于經(jīng)濟(jì)活動并取得經(jīng)濟(jì)成功才算是創(chuàng)新;同理,只有創(chuàng)造價(jià)值,工業(yè)大數(shù)據(jù)才有生命力,才能真正在企業(yè)落地。

郭朝暉認(rèn)為,一個(gè)技術(shù)的價(jià)值,取決于用戶怎么看待它。大數(shù)據(jù)能不能落地,關(guān)鍵的問題,是能不能找到合適的場景,而不是技術(shù)本身的先進(jìn)性;不僅如此,還要看投入產(chǎn)出比是否合適。

場景一:GE是用工業(yè)互聯(lián)網(wǎng)獲得大數(shù)據(jù)、降低維修成本,提高可靠度。由于航空發(fā)動機(jī)的維修成本很高,對可靠性的要求也非常高。因此,如果能通過大數(shù)據(jù)分析,找到恰當(dāng)?shù)闹R,就可以復(fù)制到成千上萬個(gè)發(fā)動機(jī)產(chǎn)品上,能降低成本,提高可靠度。

場景二:河南省有一個(gè)小工廠,基本上沒有操作工。他們把每個(gè)環(huán)節(jié)的數(shù)據(jù)及時(shí)存儲起來。出了什么問題,怎么出的問題,哪個(gè)環(huán)節(jié)有問題,都能溯源。

所以:1.GE的想法非常好,可并不見得適用于每個(gè)企業(yè),因?yàn)橥度氘a(chǎn)出比太高。2.高質(zhì)量、無人化的場景之下,數(shù)據(jù)非常重要。

結(jié)論:數(shù)據(jù)是否有用,關(guān)鍵在于用戶是否對高質(zhì)量的產(chǎn)品有很高的追求。如果有,那么數(shù)據(jù)的價(jià)值自然會被帶動;反之,當(dāng)企業(yè)對質(zhì)量不關(guān)注,再好的數(shù)據(jù)也是沒有用的。

場景三:上海寶山某豆腐工廠,員工有1000多人,但是豆腐質(zhì)量不好,工人的操作水平無法得知。最后,豆腐廠老板在工廠里安裝了攝像頭,于是產(chǎn)品質(zhì)量馬上變好了。

所以:雖然工廠領(lǐng)導(dǎo)并沒有看監(jiān)控,但無疑攝像頭起到了威懾的作用。

結(jié)論:中國的經(jīng)濟(jì)起步于農(nóng)業(yè)經(jīng)濟(jì),工業(yè)化還不成熟,人的規(guī)范性、職業(yè)道德各個(gè)方面有待提高,不具備精益求精的精神。所以,用大數(shù)據(jù)提高管理水平是重要的應(yīng)用場景。

郭朝暉建議:能不能通過大數(shù)據(jù),把每一個(gè)生產(chǎn)流程記錄下來,然后讓研發(fā),采購,銷售,設(shè)備維護(hù),都很規(guī)范地運(yùn)行,當(dāng)出現(xiàn)違規(guī)時(shí),就用一個(gè)算法進(jìn)行示警?

“在某些傳統(tǒng)企業(yè),管理漏洞導(dǎo)致的浪費(fèi)可能大于總利潤。大數(shù)據(jù)記錄可以看作一種抽象的‘錄像’,對提高管理水平的價(jià)值是很大的,或許適合很多中國企業(yè)?!彼硎?。

工業(yè)大數(shù)據(jù)是對生產(chǎn)、研發(fā)、服務(wù)過程的痕跡的數(shù)字化記錄,其目的是建立以數(shù)據(jù)說話的基礎(chǔ),它常常是對數(shù)據(jù)資源的二次利用,是通過間接的途徑創(chuàng)造價(jià)值。因此,只有將大數(shù)據(jù)的功能和業(yè)務(wù)流程綁定,才能持續(xù)地創(chuàng)造價(jià)值。

“我認(rèn)為工業(yè)大數(shù)據(jù)的主要價(jià)值,或許不在于發(fā)現(xiàn)規(guī)律性的知識,而在于提煉出有用的信息。用這些信息驅(qū)動軟件化、模型化的知識,可以智能化地解決管理問題?!惫瘯熑缡钦f。

 

 

 

分享到

zhoub

相關(guān)推薦