近日,一本名為《暢銷書密碼》(The Bestseller Code)的圖書在英國(guó)出版。該書作者阿徹爾曾供職于企鵝圖書出版社,在那期間她親眼目睹了丹·布朗的《達(dá)·芬奇密碼》賣出8000萬冊(cè)的奇跡。那時(shí)她就一直在想是什么“魔法”讓這本書成為銷售傳奇?單靠市場(chǎng)營(yíng)銷恐怕難以做到這一點(diǎn)。難道是單純的運(yùn)氣嗎?后來她遇到了斯坦福文學(xué)實(shí)驗(yàn)室創(chuàng)始人之一喬克斯,也是該書的另一位作者,在喬克斯看來,“關(guān)于暢銷書,計(jì)算機(jī)能分析出人們無法直接看到的信息?!?/p>
《暢銷書密碼》
四年間,阿徹爾和喬克斯將過去30年出版的5000部虛構(gòu)作品標(biāo)題交給計(jì)算機(jī)消化,并教給計(jì)算機(jī)“閱讀”:知道一句話從哪里開始又從哪里結(jié)束,分辨出對(duì)話的部分,勾畫出情節(jié)。然后他們用一種“機(jī)器分類算法”計(jì)算出暢銷書中最為常見的元素。
這些元素包括:
1.年輕強(qiáng)大又叛逆的女英雄,比如《火車上的女孩》、《消失的愛人》和《龍文身的女孩》。
2.沒有性描寫,只有“親密”而已。
3.經(jīng)常出現(xiàn)“需要”這個(gè)詞。
4.很多縮寫體。
5.驚嘆號(hào)并不是很多。
6.關(guān)于狗的很多,關(guān)于貓的很少。
令人驚訝的是,性描寫雖然也會(huì)讓書大賣,但只是在色情作品市場(chǎng)中,而且情況往往不像大家想象的那樣。以《五十度灰》為例,雖然它的營(yíng)銷衍生品奇奇怪怪,但是小說的主題除了21%的“親密關(guān)系”之外,第二大主題便是親密對(duì)話,但多數(shù)是柏拉圖式的對(duì)話以及很感性的對(duì)話。
除了這些,這本書還列出了暢銷書所具有的其他2793個(gè)元素。據(jù)稱這個(gè)算法預(yù)測(cè)“現(xiàn)象級(jí)暢銷書”的準(zhǔn)確率達(dá)到80%。
當(dāng)然,這只是暢銷書算法的一種。在美國(guó),很多傳統(tǒng)的出版商已經(jīng)開始雇傭數(shù)據(jù)工程師,他們用數(shù)據(jù)分析代替了讀者的直覺和充滿希望的想法。
原本出版業(yè)要依靠銷量來判斷讀者的需求,而現(xiàn)在的電子閱讀改變了這一切。理論上說,出版社可以清楚知道讀者是從頭到尾讀完了一本書,還是只讀了20頁就放棄了;還能知道讀者在何時(shí)何地閱讀;在有些閱讀軟件中,人們綁定了社交網(wǎng)絡(luò),那么還可以獲取更多讀者信息。但問題是掌握這些信息的公司,例如蘋果和亞馬遜是不會(huì)和出版社分享的。
為了解決這個(gè)“不能分享”的問題,一家倫敦的創(chuàng)業(yè)公司提供了一種方案,出版社可以通過他們將電子書在出版前就免費(fèi)發(fā)送給目標(biāo)讀者,然后獲取閱讀頁數(shù)、閱讀時(shí)間和地點(diǎn)等信息。結(jié)果發(fā)現(xiàn),大部分小說還沒讀完一半就被讀者放棄了。
在書業(yè)有20年經(jīng)驗(yàn)、美國(guó)柯提斯·布朗出版集團(tuán)部門負(fù)責(zé)人蓋勒,近日在TED的演講中也講到暢銷書所包含的特質(zhì):它們都有一個(gè)精心設(shè)計(jì)的故事,能夠?qū)⒆x者從熟悉的地方帶進(jìn)一個(gè)新鮮的場(chǎng)域,還要包含一個(gè)高于故事本身的主題。他以《房間》為例(這部作品改編的同名電影獲得了第88屆奧斯卡最佳影片提名),“這部作品的成功并不僅僅在于講述了一對(duì)母子在封閉空間中相處多年的故事,而在于它展現(xiàn)了最純粹的母愛。”
還有一種想法是用大數(shù)據(jù)來決定寫什么書。一家在美國(guó)加州的傳媒公司用大數(shù)據(jù)挖掘那些讀者想要閱讀、但還并不存在的非虛構(gòu)題材,然后再雇人來創(chuàng)作。這家公司的CEO稱他們每個(gè)月會(huì)收集6000萬份讀者數(shù)據(jù)。例如他們會(huì)研究用戶在亞馬遜網(wǎng)站上的搜索記錄,找到那些人們經(jīng)常輸入?yún)s沒有搜索結(jié)果的關(guān)鍵詞。在他們研究的結(jié)果中,有些主題是比較容易想到的:例如《醫(yī)用大麻藥房:大麻的醫(yī)用和食用》,還有些比較難以想到,例如《感統(tǒng)失調(diào)患者每天適用的小游戲》。
而這家公司會(huì)熱心出版一些類似《橋本氏甲狀腺炎患者的四周康復(fù)計(jì)劃》的古怪圖書,目標(biāo)讀者是那些“自身免疫病”患者。他們的作者會(huì)根據(jù)大數(shù)據(jù)分析得出的大綱進(jìn)行寫作,這樣寫作的速度會(huì)變快,而一本書從寫作到上市一般控制在九周時(shí)間內(nèi),因?yàn)槟切┧阉鬟@些信息的用戶“正等著”這本書。每種書保證賣出1500冊(cè),他們就能夠開始盈利。
當(dāng)然,對(duì)于出版業(yè)的大數(shù)據(jù)應(yīng)用一直存在質(zhì)疑的聲音。盡管有各種各樣的暢銷書算法,一位波士頓的出版人認(rèn)為圖書和冰箱這類商品不同之處在于,“有時(shí)你會(huì)拿起一本事先并不了解的書,從中發(fā)現(xiàn)那些原本自己可能根本沒想到會(huì)喜歡的東西。所以大數(shù)據(jù)可能會(huì)限制我們的品味和可能性?!倍哆B線》雜志也稱,這些算法可能會(huì)挽救出版業(yè),但卻毀了小說本身。