IT時(shí)報(bào) 發(fā)表于:13年08月21日 10:39 [轉(zhuǎn)載] DOIT.com.cn
——嘉賓——
上海圖書館副館長 陳超
著名作家 梁曉聲
中華書局副總編輯 顧青
大數(shù)據(jù)之熱,出版業(yè)不可能沒有感受到.不過,對大數(shù)據(jù)時(shí)代的到來,出版業(yè)人士在2013上海書展的一場高層論壇上表現(xiàn)得誠惶誠恐,他們不知道大數(shù)據(jù)是否真的那么美妙,不清楚大數(shù)據(jù)給未來提供的全新可能性是什么.盡管如此,出版業(yè)面對大數(shù)據(jù)的一場長期戰(zhàn)役已經(jīng)打響.
當(dāng)出版遇上大數(shù)據(jù)
2010年,谷歌推出圖書數(shù)據(jù)庫,庫中包括從1500年到2008年間出版的各類圖書的5000億個(gè)單詞.用戶可以在電腦上輸入最多五個(gè)單詞,查看這些單詞歷年來的使用頻率情況.
例如,輸入"women"(女性)和"men"(男性)會發(fā)現(xiàn),上世紀(jì)70年代之前,"women"在圖書中很少被提及,而當(dāng)女權(quán)主義站穩(wěn)腳跟后,"women"的使用頻率逐年提升,到1986年,"women"和"men"的使用頻率曲線出現(xiàn)了交點(diǎn)."這說明,將高質(zhì)量的數(shù)據(jù)分析應(yīng)用于人文學(xué)科也是可行的."美國哈佛大學(xué)研究員埃雷茲·利伯曼·艾丁將這種研究方法稱作"文化組學(xué)"(culturomics).上海圖書館副館長陳超在論壇上分析說,這誘發(fā)了一個(gè)新的學(xué)科,通過文本的定量分析來揭示人類行為和文化發(fā)展的趨勢.
隨著大數(shù)據(jù)時(shí)代的到來,閱讀方式也發(fā)生了深刻的變化.數(shù)世紀(jì)以來閱讀作為一種單獨(dú)、私密行為的方式,轉(zhuǎn)變?yōu)槟撤N可以測量的半公開的行為.如今,電子閱讀器能夠讓出版商和作家一窺銷售額背后的故事,它們不僅僅能夠顯示某些書吸引了多少購買者,還能揭示他們的閱讀強(qiáng)度.
出版社已經(jīng)開始運(yùn)用這些數(shù)據(jù).出版《哈利·波特》小說的Scholastic出版社通過建立在線游戲追蹤最吸引人的線索和角色,以此為構(gòu)思基礎(chǔ)創(chuàng)作了《39條線索》系列小說,成為又一本全球暢銷書;Coliloquy出版的電子書允許讀者自己設(shè)計(jì)人物角色和情節(jié)線索,經(jīng)數(shù)據(jù)分析,讓作家調(diào)整故事迎合大眾口味.讀者甚至可以選擇女主角與三位追求者中的哪一位發(fā)生關(guān)系.
中國出版業(yè)的實(shí)踐與猜想
Coliloquy的這一模式某種意義上說明了大數(shù)據(jù)在出版業(yè)的可行性.但是,能否真的像英國電視劇《紙牌屋》那樣,靠大數(shù)據(jù)的排列組合,流水線生產(chǎn)一本同類暢銷書呢?陳超很同意豆瓣上一篇關(guān)于此分析的日志:"如果我們能量化用戶的閱讀題材、閱讀場所、閱讀時(shí)長、標(biāo)注章節(jié)和重復(fù)瀏覽內(nèi)容,大數(shù)據(jù)時(shí)代的快銷書指日可待."
著名作家梁曉聲卻并不如此認(rèn)為,"大數(shù)據(jù)不可能影響我們(作家)."他在接受《IT時(shí)報(bào)》記者采訪時(shí)斬釘截鐵地表示.他認(rèn)為:"數(shù)字閱讀的時(shí)代剛剛來臨,是否意味著它將告別讀書這一古老而良好的習(xí)慣呢?有人斷言這是早晚的事,最快50年后變成現(xiàn)實(shí).我認(rèn)為不會,起碼100年后不會.人類對讀書的親情,對于一部分讀書人而言,早已成為基因,成了DNA的一部分."
現(xiàn)實(shí)情況是,出版業(yè)已經(jīng)開始對大數(shù)據(jù)展開各類探索.上海圖書館今年春節(jié)期間做了"讀者閱讀賬單",根據(jù)一年來的外借量,將讀者分為極客、書蟲、文青,并寄一張個(gè)性化的閱讀數(shù)據(jù)表給讀者.陳超介紹,他們發(fā)現(xiàn)去年一年在上海所有圖書館中借書量最大的一個(gè)人共借了3414本書,是一位司機(jī),"沒有數(shù)據(jù),不知道這個(gè)事情,知道以后會去問為什么,和數(shù)據(jù)大小無關(guān)."
作為中國傳統(tǒng)文化的內(nèi)容供應(yīng)商,中華書局也在思考如何在大數(shù)據(jù)時(shí)代為出版提供更多可能.中華書局副總編輯顧青認(rèn)為,用數(shù)字經(jīng)濟(jì)的理念來看待,中華書局不僅要保持古籍整理和出版的核心競爭力,更應(yīng)該保留獲取、存儲、整合、搜索、分析中國傳統(tǒng)古籍文本及其研究文本的能力.
顧青同時(shí)坦承,目前中華書局仍以紙書為主,數(shù)字產(chǎn)品極少,主要是"中華經(jīng)典古籍庫"和"中華基本史籍知識庫"兩個(gè)數(shù)據(jù)庫.圖書館采購也在借力大數(shù)據(jù).如今,圖書館文獻(xiàn)資源建設(shè)經(jīng)費(fèi)緊張,特別是紙本書刊經(jīng)費(fèi)比例逐年減少.同時(shí),圖書采訪員人員有限,三四萬人的綜合類大學(xué)的圖書采訪員也不過三四個(gè),采回的書80%沒有價(jià)值或價(jià)值不高.據(jù)此,北京人天書店董事長鄒進(jìn)提出,在大數(shù)據(jù)時(shí)代,可以從采訪數(shù)據(jù)中提取核心書目,根據(jù)出版社、作者、責(zé)任編輯、版次等綜合評分提供采購指導(dǎo).
要大數(shù)據(jù),得先數(shù)字化
與會者普遍認(rèn)為,在中國,傳統(tǒng)出版業(yè)和圖書館還處在數(shù)字化的轉(zhuǎn)型時(shí)期,因此現(xiàn)在談要在內(nèi)容、閱讀、服務(wù)、管理方面"數(shù)據(jù)化",得先將"數(shù)字化"進(jìn)行徹底.
在管理方面,陳超說,我國數(shù)字出版產(chǎn)業(yè)鏈上"B2L2R"(出版社到圖書館到讀者)的商業(yè)模式和平臺遠(yuǎn)未成熟.在美國,Overdrive公司搭建了這樣一個(gè)平臺:出版社把電子資源交給他們,再由他們負(fù)責(zé)向所有圖書館提供電子書,亞馬遜借書服務(wù)就是他們的客戶.
"國內(nèi)沒有數(shù)字閱讀平臺,不掌握用戶閱讀行為的數(shù)據(jù),怎么來做大數(shù)據(jù)創(chuàng)新呢?"陳超發(fā)問道.
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.