北京時(shí)間3月27日消息,科學(xué)家稱,通過少量的地理位置信息就可以非常容易地判定一名手機(jī)用戶的身份。
只要手機(jī)處于開機(jī)狀態(tài),其網(wǎng)絡(luò)連接性都意味著用戶的位置和行動(dòng)可被標(biāo)繪出來(lái)。這種數(shù)據(jù)會(huì)以匿名的方式被提供給第三方,從而讓用戶能獲得更好的服務(wù),同時(shí)也能讓廣告主更加精確地找到目標(biāo)客戶。但在《科學(xué)報(bào)告》(Scientific Reports)上的一份研究報(bào)告發(fā)出警告稱,人類的運(yùn)動(dòng)模式具有很大的可預(yù)見性,以至于僅靠4個(gè)數(shù)據(jù)點(diǎn)就能判定一名用戶的身份信息。
手機(jī)和智能手機(jī)應(yīng)用的日益普及已經(jīng)帶來(lái)了一個(gè)新時(shí)代。在這個(gè)時(shí)代中,海量的用戶數(shù)據(jù)已經(jīng)變得能被那些管理和分發(fā)數(shù)據(jù)的公司所獲得——有些時(shí)候是以“匿名”或是聚合數(shù)據(jù)集的方式而公開的。
對(duì)于廣告主和服務(wù)提供商來(lái)說,這些數(shù)據(jù)非常有價(jià)值,但對(duì)其他人來(lái)說也同樣很有價(jià)值,比如那些正在規(guī)劃購(gòu)物中心和分配應(yīng)急服務(wù)的人,或是新一代的社會(huì)科學(xué)家等。但是,“位置服務(wù)”的蔓延和發(fā)展速度已經(jīng)超出了人們的理解范圍,使其無(wú)法明確把握位置數(shù)據(jù)能如何對(duì)用戶隱私權(quán)和匿名造成影響。舉例來(lái)說,衛(wèi)星導(dǎo)航廠商長(zhǎng)期以來(lái)一直都在使用來(lái)自于手機(jī)和衛(wèi)星導(dǎo)航服務(wù)本身的數(shù)據(jù)來(lái)改進(jìn)路況信息報(bào)告,具體方式是計(jì)算用戶在特定道路上正在以多快的速度前進(jìn)。
在這些計(jì)算中所使用的數(shù)據(jù)都是“匿名的”——也就是說,這些數(shù)據(jù)不會(huì)包含手機(jī)號(hào)碼或個(gè)人細(xì)節(jié)信息。但有一些例子證明,有名無(wú)實(shí)的所謂“匿名”數(shù)據(jù)能通過怎樣的方式與用戶身份聯(lián)系到一起,其中最出名的例子是AOL在2006年發(fā)布的一些數(shù)據(jù),這些數(shù)據(jù)對(duì)2000萬(wàn)次匿名的網(wǎng)絡(luò)搜索進(jìn)行了概括?!都~約時(shí)報(bào)》在對(duì)這些數(shù)據(jù)略做“偵查”后發(fā)現(xiàn),很容易就能判定其中一位代號(hào)為“4417749號(hào)搜索者”的身份信息。
移動(dòng)軌跡
最近以來(lái)的研究工作日益表明,人類的運(yùn)動(dòng)模式無(wú)論看起來(lái)多么具有隨機(jī)性和不可預(yù)見性,但在實(shí)際上這種隨機(jī)性和不可預(yù)見性的范圍都是非常有限的;事實(shí)上,運(yùn)動(dòng)模式能在某種程度上被作為一種“指紋”,讓人能判斷出人們的身份?!犊茖W(xué)報(bào)告》上的最新研究報(bào)告指出,這些位置數(shù)據(jù)雖然只具備“低分辨率”,但也仍舊能被用作識(shí)別人們身份的獨(dú)特標(biāo)記。
麻省理工學(xué)院和比利時(shí)魯汶大學(xué)(Catholic University of Louvain)的研究者對(duì)150萬(wàn)名用戶在15個(gè)月中的匿名手機(jī)記錄進(jìn)行研究后發(fā)現(xiàn),通過所謂的“移動(dòng)軌跡”(mobility trace)——也就是每一部手機(jī)顯而易見的行進(jìn)路線——只需要4個(gè)地點(diǎn)和時(shí)間點(diǎn)就足以識(shí)別出一名特定用戶的身份信息。
“在二十世紀(jì)三十年代,你需要12個(gè)數(shù)據(jù)點(diǎn)才能排他性地鑒別和刻畫一個(gè)指紋。”這份研究報(bào)告的主要作者、麻省理工學(xué)院學(xué)者Yves-Alexandre de Montjoye說道。“我們?cè)谶@次研究中所做的也是同樣的事情,只不過是通過追蹤‘移動(dòng)軌跡’的方式來(lái)進(jìn)行研究的。人類運(yùn)動(dòng)的方式和行為是如此獨(dú)特,以至于只需要4個(gè)數(shù)據(jù)點(diǎn)就足以鑒別出95%的人的身份。”
“我們認(rèn)為,這種數(shù)據(jù)的可獲得性比人們想象中的要高。這些數(shù)據(jù)是指,舉例來(lái)說,如果你在手機(jī)上使用WiFi網(wǎng)絡(luò)或是打開任何應(yīng)用,就會(huì)提供我們所說的那種移動(dòng)數(shù)據(jù)。”de Montjoye說道。“當(dāng)你共享信息時(shí),你會(huì)看看周圍,感覺身邊有許多人在——比如說在購(gòu)物中心或是旅游勝地——然后就會(huì)覺得這并非什么敏感信息。”
隱私權(quán)公式
這個(gè)研究團(tuán)隊(duì)隨后又對(duì)這些數(shù)據(jù)需要具有多“高分辨率”——也就是一個(gè)位置的精度——才能更加全面地確保隱私權(quán)的問題進(jìn)行了研究,并得出了量化數(shù)據(jù)。報(bào)告的聯(lián)合作者之一凱撒·海德爾格(Cesar Hidalgo)稱,移動(dòng)數(shù)據(jù)遵循一種天然的數(shù)學(xué)模式,能被用作分析引導(dǎo)工具,原因是更多的位置服務(wù)和高分辨率數(shù)據(jù)已經(jīng)變得可用。
“我們的想法是,在抓取這種信息的分辨率與匿名性之間存在一種天然的權(quán)衡關(guān)系,這種權(quán)衡所借助的就是分辨率和運(yùn)動(dòng)模式的獨(dú)特性。”海德爾格在接受BBC新聞?lì)l道采訪時(shí)說道。“根據(jù)上最根本的問題就在于,由于現(xiàn)在數(shù)據(jù)已經(jīng)具有較高的分辨率,因此這種權(quán)衡就變成了數(shù)據(jù)的有用性多高與數(shù)據(jù)到底是否能夠匿名之間的關(guān)系。如果你所擁有的數(shù)據(jù)是在一天以內(nèi)的,那么交通流量預(yù)測(cè)服務(wù)就無(wú)法運(yùn)作;你需要一個(gè)小時(shí)以內(nèi)或是幾分鐘以內(nèi)的數(shù)據(jù)。”
海德爾格指出, 想要把“移動(dòng)軌跡”與某個(gè)人的身份信息聯(lián)系到一起,那么就還需要更多的信息;但是,用戶會(huì)通過帶有地理位置信息的Twitter消息以及Foursquare等地理位置“簽到”服務(wù)提供這種信息。
但報(bào)告作者表示,他們的目的是要提供一種數(shù)學(xué)上的聯(lián)系——也就是適用于所有移動(dòng)數(shù)據(jù)的一個(gè)公式——從而量化匿名性與數(shù)據(jù)有用性之間的權(quán)衡關(guān)系,并希望這項(xiàng)研究工作能激發(fā)有關(guān)“大數(shù)據(jù)”與個(gè)人隱私權(quán)的優(yōu)缺點(diǎn)的爭(zhēng)論。
國(guó)際隱私權(quán)保障組織(Privacy International)的山姆·史密斯(Sam Smith)說道:“我們的手機(jī)會(huì)向多個(gè)組織報(bào)告地理位置和上下文數(shù)據(jù),而這些組織擁有不同的隱私權(quán)政策。”他向BBC新聞?lì)l道表示:“我們從這種服務(wù)中所獲得的任何好處都遠(yuǎn)遠(yuǎn)不及這些趨勢(shì)對(duì)隱私權(quán)帶來(lái)的威脅。雖然我們被告知自己在提供多少信息的問題上擁有選擇權(quán),但在實(shí)際上,個(gè)人用戶根本就沒有什么選擇權(quán)。”
“科學(xué)技術(shù)的發(fā)展讓我們更加難以生活在這樣的一個(gè)世界中:在這個(gè)世界里,人們的隱私權(quán)會(huì)得到政府的保護(hù),得到公司的尊重,得到個(gè)人的珍愛——現(xiàn)在的情況是,文化規(guī)范遠(yuǎn)遠(yuǎn)落后于科學(xué)技術(shù)的發(fā)展進(jìn)程。”史密斯說道。
但de Montjoye則強(qiáng)調(diào)指出,雖然移動(dòng)數(shù)據(jù)會(huì)讓人們對(duì)隱私權(quán)問題感到擔(dān)心,但這些數(shù)據(jù)所能帶來(lái)的利益則要大得多。“我們真的不認(rèn)為應(yīng)該停止收集或使用這種數(shù)據(jù)——對(duì)我們所有人來(lái)說,這種數(shù)據(jù)都能帶來(lái)非常大的好處,無(wú)論是公司、科學(xué)家還是用戶。”他說道。“我們已經(jīng)在努力嘗試不要把這種情況描述為‘獨(dú)裁者’那樣的情景,也就是‘我們知道跟你有關(guān)的所有事情’。但有一點(diǎn)是不可否認(rèn)的,那就是即使沒有姓名或電子郵件地址,個(gè)人數(shù)據(jù)仍舊可以被獲取,因此我們需要這種情況得到相應(yīng)的對(duì)待。”