噜噜噜综合,又色又爽又高潮免费观看,综合无码一区二区三区四区五区,中文字幕无码人妻aaa片,四虎成人精品永久网站

大數(shù)據(jù)時(shí)代的記憶與遺忘

SocioCyber 發(fā)表于:13年06月04日 13:00 [轉(zhuǎn)載] DOIT.com.cn

  • 分享:
[導(dǎo)讀]斯塔西·施耐德(Stacy Snyder)曾經(jīng)的夢(mèng)想是成為一名教師。2006年夏天,她完成了獲取教師資格證書(shū)所需的課程并通過(guò)了所有考試;然而她的夢(mèng)想?yún)s在即將實(shí)現(xiàn)之時(shí)突然破滅她所在學(xué)校的一位負(fù)責(zé)人告訴她,她無(wú)法取得教師資格證書(shū)。

斯塔西·施耐德(Stacy Snyder)曾經(jīng)的夢(mèng)想是成為一名教師。2006年夏天,她完成了獲取教師資格證書(shū)所需的課程并通過(guò)了所有考試;然而她的夢(mèng)想?yún)s在即將實(shí)現(xiàn)之時(shí)突然破滅她所在學(xué)校的一位負(fù)責(zé)人告訴她,她無(wú)法取得教師資格證書(shū)。

學(xué)校負(fù)責(zé)人展示了一張她上傳到自己的MySpace頁(yè)面上的照片,照片上的她戴著一頂海盜帽,正端著一只塑料杯飲酒。這張照片是她向自己朋友展示的,甚至可能只是搞怪,但學(xué)校認(rèn)為這樣的行為與教師的標(biāo)準(zhǔn)不符。斯塔西向?qū)W校承諾將這張圖片從網(wǎng)上刪除,然而為時(shí)已晚照片早已被搜索引擎索引,并被網(wǎng)絡(luò)爬蟲(chóng)所記錄。她希望她的照片被遺忘,然而互聯(lián)網(wǎng)并不允許。

這是牛津大學(xué)互聯(lián)網(wǎng)學(xué)院的教授維克托·邁爾-舍恩伯格(Viktor Mayer-Sch?nberger)在2009年出版的《刪除:數(shù)字時(shí)代遺忘的價(jià)值》(中譯版為《刪除:大數(shù)據(jù)時(shí)代的取舍之道》,以下簡(jiǎn)稱(chēng)《刪除》)一書(shū)中引用的一個(gè)案例。他告訴讀者,遺忘本是人類(lèi)的天性,但隨著信息技術(shù)的發(fā)展,記憶變得越來(lái)越容易,遺忘卻越來(lái)越困難;無(wú)法遺忘不僅會(huì)給個(gè)人帶來(lái)不必要的困擾,也給企業(yè)制造了麻煩他們存儲(chǔ)的數(shù)據(jù)日益增加,但其中很多隨著時(shí)間的推移而失去了價(jià)值。因此,他呼吁引入一種遺忘的機(jī)制,例如為數(shù)據(jù)設(shè)定一個(gè)保存期限,“讓我們記得去遺忘”。

盡管沒(méi)能提出切實(shí)可行的“遺忘”方法,但《刪除》獨(dú)特的視角仍受到了學(xué)術(shù)界和互聯(lián)網(wǎng)業(yè)界的廣泛關(guān)注;這本書(shū)不僅獲得了多項(xiàng)圖書(shū)獎(jiǎng),還被翻譯為德語(yǔ)、意大利 語(yǔ)、韓語(yǔ)等不同語(yǔ)言。

當(dāng)“大數(shù)據(jù)”成為業(yè)界新的熱點(diǎn)之時(shí),在這一領(lǐng)域有著深入研究的維克托于近日出版了其新作《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》(以下簡(jiǎn)稱(chēng)《大數(shù)據(jù)時(shí)代》),通過(guò)一個(gè)個(gè)生動(dòng)的案例向讀者介紹大數(shù)據(jù)的價(jià)值及其將會(huì)帶來(lái)的改變。

12月11日,維克托攜兩本書(shū)的中譯本來(lái)到北京,在不同場(chǎng)合與讀者及業(yè)內(nèi)人士交流大數(shù)據(jù)相關(guān)的話(huà)題。

三大轉(zhuǎn)變定義大數(shù)據(jù)

大數(shù)據(jù)是今年IT界最熱門(mén)的概念之一,然而對(duì)于“大數(shù)據(jù)是什么”,連許多經(jīng)常談?wù)撨@一概念的從業(yè)者也無(wú)法給出準(zhǔn)確的答案。正因?yàn)槿绱,大?shù)據(jù)也被質(zhì)疑為一個(gè)炒作出來(lái)的偽命題。

維克托也并未直接給出大數(shù)據(jù)的定義在《大數(shù)據(jù)時(shí)代》的引言部分,他就明確指出“大數(shù)據(jù)并非一個(gè)確切的概念”。不過(guò),他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性。并詳細(xì)闡釋了這三個(gè)轉(zhuǎn)變:

“首先,在大數(shù)據(jù)時(shí)代,我們可以獲得和某個(gè)現(xiàn)象相關(guān)的所有數(shù)據(jù),而不只是少量的樣本。例如一項(xiàng)針對(duì)相撲比賽中非法操縱比賽結(jié)果的研究對(duì)64000場(chǎng)比賽進(jìn)行了分析,這算不上一個(gè)很大的數(shù)字,但由于這是過(guò)去十年所有的比賽,所以它是大數(shù)據(jù)。大數(shù)據(jù)是相對(duì)的而非絕對(duì)的。”

“第二,由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對(duì)于一個(gè)事物只有50個(gè)數(shù)據(jù)點(diǎn),那么每一個(gè)數(shù)據(jù)點(diǎn)都必須非常精確,因?yàn)槊總(gè)數(shù)據(jù)點(diǎn)都是有用的;但是如果我們有5000萬(wàn)個(gè),去掉10個(gè),甚至去掉1000個(gè)都沒(méi)有太大的問(wèn)題。”

“第三,我們分析大數(shù)據(jù)主要為了預(yù)測(cè)未來(lái)"是什么",而不是"為什么"。我們關(guān)注的是揭示哪些事情將會(huì)發(fā)生的相關(guān)關(guān)系,而非揭示為什么這些事情會(huì)發(fā)生的因果關(guān)系。因?yàn)楹芏鄷r(shí)候我們以為我們找到了事情背后的原因,實(shí)際上卻沒(méi)有找到。更多時(shí)候知道了"是什么"就足夠了。例如知道流感將會(huì)擴(kuò)散到哪里就足夠了,我不需要知道為什么;知道什么時(shí)候在網(wǎng)上購(gòu)買(mǎi)機(jī)票能夠獲得最優(yōu)惠的價(jià)格就足夠了,我不需要知道為什么此時(shí)價(jià)格最低。”

大數(shù)據(jù)不應(yīng)被過(guò)分炒作

表面上看,此次出版的兩本書(shū)相互矛盾:《大數(shù)據(jù)時(shí)代》強(qiáng)調(diào)了數(shù)據(jù)的價(jià)值,而《刪除》卻提出數(shù)據(jù)應(yīng)該能夠被“忘記”。對(duì)此,維克托表示,兩本書(shū)相互補(bǔ)充,而以上的兩個(gè)觀(guān)點(diǎn)可以完美地相互作用。

“大數(shù)據(jù)只有在沒(méi)有噪音、沒(méi)有無(wú)用的數(shù)據(jù)的情況下才能很好地發(fā)揮作用。在《刪除》中,我認(rèn)為我們需要有擺脫那些過(guò)時(shí)的、和我們現(xiàn)在不相關(guān)的數(shù)據(jù)的可能性。如果亞馬遜忘記了和你當(dāng)前的興趣與偏好不相關(guān)的購(gòu)書(shū)記錄,它推薦書(shū)的效果將會(huì)更好。只有好的數(shù)據(jù)才能帶來(lái)好的預(yù)測(cè)。”

對(duì)于大數(shù)據(jù)被過(guò)分炒作,維克托也表示擔(dān)憂(yōu):“它被夸大了,好像一切都突然成為了大數(shù)據(jù),大數(shù)據(jù)能解決所有問(wèn)題,事實(shí)上人們并不了解它究竟是什么;一旦人們發(fā)現(xiàn)它不是萬(wàn)能的,就會(huì)感到泄氣,然后大數(shù)據(jù)就被拋棄了。”在他看來(lái),盡管大數(shù)據(jù)非常強(qiáng)大,但“人們需要明白它不是什么,我們不能將它過(guò)分夸大”。

對(duì)話(huà)維克托:數(shù)據(jù)保留與否應(yīng)由用戶(hù)決定

亞馬遜、Google這些大公司已經(jīng)積累了很多數(shù)據(jù),但小公司、創(chuàng)業(yè)公司卻沒(méi)有多少數(shù)據(jù),在大數(shù)據(jù)時(shí)代他們應(yīng)該怎么做?

的確,這很有趣。很長(zhǎng)時(shí)間以來(lái),這些大公司的強(qiáng)大之處在于他們的服務(wù)器集群等基礎(chǔ)設(shè)施。如今有了云計(jì)算,創(chuàng)業(yè)公司可以根據(jù)需要購(gòu)買(mǎi)計(jì)算和存儲(chǔ)能力,以解決基礎(chǔ)設(shè)施方面的不足,但他們沒(méi)有數(shù)據(jù)。數(shù)據(jù)是一些大公司獨(dú)家擁有的。當(dāng)然如果小公司選擇了正確的領(lǐng)域切入,也能夠獲得數(shù)據(jù)。例如Inrix公司,他們開(kāi)發(fā)導(dǎo)航軟件,還能提供實(shí)時(shí)路況,告訴你哪里堵車(chē)。他們是怎么獲得這些信息的呢?他們的基礎(chǔ)導(dǎo)航服務(wù)是免費(fèi)的,但如果你同意下載這個(gè)應(yīng)用,它就會(huì)就會(huì)將你的行駛速度等信息傳回后端,于是你就成為了這個(gè)平臺(tái)的傳感器。每天有數(shù)百萬(wàn)人使用Inrix,因此Inrix擁有數(shù)百萬(wàn)傳感器,并獲取了大量的數(shù)據(jù)。他們能記錄在特定天氣下人們的駕駛速度,并將這些信息告訴保險(xiǎn)公司,或者告訴政府作為加強(qiáng)道路安全的參考。

通常企業(yè)只能通過(guò)自己搜集的數(shù)據(jù)進(jìn)行預(yù)測(cè),但他們的數(shù)據(jù)是有局限的。比如我在亞馬遜上搜索了一本書(shū),但最終通過(guò)其他渠道購(gòu)買(mǎi)了,亞馬遜并不知道,它仍會(huì)推薦相關(guān)的書(shū),我卻不再需要,如何解決這樣的問(wèn)題?

事實(shí)上目前已經(jīng)有一些公司在分享自己的數(shù)據(jù)了,例如在網(wǎng)絡(luò)廣告領(lǐng)域。不過(guò)問(wèn)題的關(guān)鍵在于你自己是否愿意你的數(shù)據(jù)被企業(yè)共享,如果你愿意讓他們共享數(shù)據(jù),你就能獲得更好的推薦。如今在硅谷有一些創(chuàng)業(yè)公司正試圖打造由個(gè)人、由消費(fèi)者控制的信息共享平臺(tái)。

相對(duì)來(lái)說(shuō)用戶(hù)可能會(huì)對(duì)大公司更加信任,更愿意把信息分享給他們,那么小公司如何讓用戶(hù)分享更多數(shù)據(jù)?

這不一定?梢該Q個(gè)角度來(lái)看,很多人不愿意把數(shù)據(jù)分享給Google或者Facebook,他們認(rèn)為這些公司過(guò)于強(qiáng)大了;他們反倒更愿意把數(shù)據(jù)分享給小公司、創(chuàng)業(yè)公司。有意思的是,大數(shù)據(jù)能幫助大企業(yè),也能幫助小企業(yè),但對(duì)中型企業(yè)幫助不大。比如200-500人規(guī)模的企業(yè),它們不夠小,不像初創(chuàng)企業(yè)那么靈活,也不像Google那么強(qiáng)大,因而被擠壓在中間,沒(méi)有自己的優(yōu)勢(shì)。

未來(lái)企業(yè)針對(duì)大數(shù)據(jù)的分析是更多依靠云計(jì)算還是更多依靠企業(yè)內(nèi)部的計(jì)算能力?

這完全取決于公司的規(guī)模、能力和他們所處的發(fā)展階段,沒(méi)有一個(gè)統(tǒng)一的答案。如今計(jì)算和存儲(chǔ)能力都可以從外部獲得,所以一家公司應(yīng)該看看是使用內(nèi)部的處理能力還是使用云計(jì)算更劃算。

你認(rèn)為在大數(shù)據(jù)時(shí)代,與隱私保護(hù)相關(guān)的法律應(yīng)該有所調(diào)整嗎?

是的。隱私權(quán)可以讓個(gè)人對(duì)互聯(lián)網(wǎng)、電子商務(wù)更信任;如果沒(méi)有隱私權(quán),我會(huì)對(duì)我在網(wǎng)上所做的事情很謹(jǐn)慎,因?yàn)橐坏┪覍⒛臣赂嬖V別人,我就可能把它收回來(lái)了,我無(wú)法控制它。所以我們需要隱私法,但隱私法也需要?jiǎng)?chuàng)新。如今歐洲的隱私法規(guī)定,企業(yè)最多只能將數(shù)據(jù)保存到首要目的完成的時(shí)候?yàn)橹埂_@是在小數(shù)據(jù)時(shí)代制定的法律,在大數(shù)據(jù)時(shí)代已不再適用,因?yàn)閿?shù)據(jù)的價(jià)值往往并非體現(xiàn)在其首要用途上,而是在其次要乃至第三位的用途上,可能是你收集數(shù)據(jù)時(shí)并不知道的用途。所以我們要做的是,讓數(shù)據(jù)不再只能被保存到它的首要用途完成時(shí)為止,而是將決定權(quán)交給和數(shù)據(jù)相關(guān)的個(gè)人,讓他們來(lái)決定是否刪除數(shù)據(jù)。

在《刪除》中你說(shuō)應(yīng)該對(duì)企業(yè)保存數(shù)據(jù)的時(shí)間有所限制,這是否會(huì)影響企業(yè)對(duì)于大數(shù)據(jù)的使用?

我的意思是,數(shù)據(jù)能保存多久應(yīng)該由和數(shù)據(jù)相關(guān)的個(gè)人來(lái)決定。例如我如果希望我的數(shù)據(jù)在亞馬遜上保持很長(zhǎng)時(shí)間,我需要有這個(gè)權(quán)利和意愿;但我必須同時(shí)擁有刪除這些數(shù)據(jù)的權(quán)利。亞馬遜也會(huì)因此獲益,因?yàn)槿绻腋嬖V他們“刪除我8年前的購(gòu)書(shū)記錄,因?yàn)檫@和我如今的興趣無(wú)關(guān)”,這樣能將一些噪音排除,他們的推薦會(huì)更精確,我可能會(huì)買(mǎi)更多的書(shū)。

如果大數(shù)據(jù)能夠準(zhǔn)確預(yù)測(cè)未來(lái),我們就可以在面臨選擇時(shí)做出最合理的選擇,但很多時(shí)候我們的個(gè)性、我們生活中的快樂(lè)正是源自于一些非理性的選擇,大數(shù)據(jù)是否會(huì)讓我們失去這些?

只有當(dāng)我們知道了真相是什么、當(dāng)我們理性的時(shí)候,我們才能非理性。我們可以理性地去面對(duì)不合理的情況,這是我們主動(dòng)選擇不理性的,符合人類(lèi)的習(xí)慣。例如數(shù)據(jù)告訴我抽煙不好,但我依然可以抽煙,這是非理性的,但這個(gè)非理性的決定是基于一個(gè)理性的選擇,因?yàn)槲抑懒苏嫦啵晕以谧鲞x擇時(shí)是理性的。如果沒(méi)有數(shù)據(jù),我就不知道我什么時(shí)候是理性的,什么時(shí)候是非理性的;很多時(shí)候我認(rèn)為我做了一個(gè)正確的決定,實(shí)際上卻是一個(gè)錯(cuò)誤的決定。所以在有了數(shù)據(jù)之后我們的生活依然可以很有趣。

你說(shuō)遺忘是人類(lèi)的天性,但事實(shí)上如今的人類(lèi)也喪失了一些我們祖先所擁有的能力,那么人類(lèi)在數(shù)字時(shí)代喪失遺忘的能力是否可以被看作是一種進(jìn)化?

可以這么說(shuō),但進(jìn)化應(yīng)該是個(gè)緩慢的過(guò)程,尤其是要重組大腦。在很偶然的情況下,進(jìn)化可能會(huì)使人類(lèi)喪失某項(xiàng)能力,但這需要很多年才能完成。

[責(zé)任編輯:王雪楊]
《云服務(wù)商生存法則》第二期節(jié)目我們邀請(qǐng)到了曙光云計(jì)算技術(shù)有限公司首席架構(gòu)師李磊博士,聽(tīng)他給我們講講曙光云計(jì)算在國(guó)內(nèi)市場(chǎng)的生存之道。
官方微信
weixin
精彩專(zhuān)題更多
存儲(chǔ)風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動(dòng);仡2014年,存儲(chǔ)作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動(dòng)信息產(chǎn)業(yè)發(fā)展的核心動(dòng)力,存儲(chǔ)產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢(shì)而為的提出。
華為OceanStor V3系列存儲(chǔ)系統(tǒng)是面向企業(yè)級(jí)應(yīng)用的新一代統(tǒng)一存儲(chǔ)產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿(mǎn)足了大型數(shù)據(jù)庫(kù)OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲(chǔ)需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會(huì)
 

公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶(hù)寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.