這個(gè)夏天,因工作和城市的轉(zhuǎn)換,我有了一個(gè)悠長(zhǎng)假期。我打算走一圈,并提前用手機(jī)百度做了詳盡的酒店攻略,結(jié)果卻有些狼狽——此后我的百度App首頁(yè)資訊冒出了很多酒店“艷事”,而且還被太太看到了。
結(jié)果,我一邊費(fèi)勁地自證清白,一邊輸入一堆體面人物來(lái)沖刷。這場(chǎng)小風(fēng)波,由軟件里一個(gè)叫“個(gè)性化推薦”的功能而起。它通過(guò)算法記錄我的閱讀行為,計(jì)算我的喜好,并認(rèn)為讀懂我心。
“個(gè)性化推薦”是PC互聯(lián)網(wǎng)時(shí)代的產(chǎn)物,卻在移動(dòng)互聯(lián)時(shí)代發(fā)揚(yáng)光大。隨著Google、Facebook等巨頭從2005年開(kāi)始陸續(xù)將其納入技術(shù)戰(zhàn)略,統(tǒng)一、標(biāo)準(zhǔn)化的互聯(lián)網(wǎng)信息傳播形式終結(jié)了。在此后十余年的進(jìn)化中,推薦算法變得越來(lái)越聰明,幫助人腦極大提升信息獲取效率的同時(shí),也帶來(lái)新的問(wèn)題。
如今,個(gè)性化推薦技術(shù)在全球如日中天,包括中國(guó)。不但誕生了今日頭條等資訊巨頭,還席卷搜索、網(wǎng)購(gòu)、娛樂(lè)、社交、理財(cái)?shù)葞缀跛谢ヂ?lián)網(wǎng)細(xì)分行業(yè)。
本文試著撥開(kāi)這些榮光,還原我們被推薦算法“統(tǒng)治”后的信息環(huán)境真相,還將觸及技術(shù)過(guò)濾下“越開(kāi)放越封閉”的矛盾共存。當(dāng)然,這個(gè)問(wèn)題很復(fù)雜。我先從以下三個(gè)問(wèn)題入手——我確信對(duì)大多數(shù)人來(lái)說(shuō),它們存在已久卻從未被深入推敲。
我看到的信息真的越來(lái)越豐富?
誰(shuí)在決定我看什么?
屏幕里的世界是真實(shí)的嗎?
離完全個(gè)人化的傳播不遠(yuǎn)了
雖然我鐘情人文領(lǐng)域,卻不是一個(gè)技術(shù)悲觀主義者。相反,當(dāng)我還在傳統(tǒng)報(bào)紙的時(shí)候,我就熱衷于用RSS訂閱提升工作效率,例如用一款叫“ZAKER”的聚合閱讀軟件。
后來(lái)我成了它的總編輯,隨后開(kāi)始了一段1個(gè)月左右的不適,主要是思維方式上。關(guān)于“個(gè)性化推薦”,當(dāng)時(shí)扎克伯格有一段有趣的答記者問(wèn)。記者問(wèn):“為什么你這么看重News Feed(動(dòng)態(tài)信息流)?”小扎說(shuō):“你對(duì)家門口一只瀕臨死亡的松鼠的關(guān)心,也許更甚于非洲難民?!?/p>
傳統(tǒng)新聞人可不是這么看,頭版編輯會(huì)毫不猶豫地選擇后者。職業(yè)新聞?dòng)?xùn)練讓他們追求最具真實(shí)性和公共影響力的資訊產(chǎn)品,并且過(guò)濾掉一些與大眾道德相悖的雜質(zhì)。
推薦算法動(dòng)搖了這套穩(wěn)定運(yùn)行了一個(gè)世紀(jì)的信息傳播模式。這讓轉(zhuǎn)型初期的我十分苦惱——某些常規(guī)判斷失效了,一條美食攻略或汽車降價(jià)消息會(huì)悄然爬上我的頭條,它們的影響力顯然不夠大,縱使還算符合我的興趣。
這里面可能有守舊的因素,但絕不是孤例。事實(shí)上,F(xiàn)acebook的News Feed的進(jìn)化就是一部大眾反對(duì)史。從最初推出個(gè)人動(dòng)態(tài)分享功能,到資訊按熱門排序,無(wú)不招致抗議——用戶認(rèn)為前者涉及隱私,后者則違背他們“按時(shí)間順序閱讀”的習(xí)慣。
扎克伯格對(duì)此卻非常堅(jiān)決。Facebook上平均每個(gè)用戶一天的新鮮事有1500條,但用戶只能看完其中的300條。如果讓Feed按時(shí)間排序,非常不利于用戶體驗(yàn)。于是,扎克伯格和他的工程師們寫(xiě)出EdgeRank算法[1],用以量化描述用戶的“興趣”并排序,2011年又全面轉(zhuǎn)向機(jī)器學(xué)習(xí)。
他的預(yù)見(jiàn)是正確的。人們漸漸不再反對(duì)了,還相當(dāng)喜歡。如今News Feed也成為了日收4000萬(wàn)美金的明星產(chǎn)品。在其2016年十周年慶典上,扎克伯格這樣自我打分——“改變了整個(gè)互聯(lián)網(wǎng)行業(yè)?!?/p>
“個(gè)性化推薦”首先是倒逼的產(chǎn)物,目的是解決信息過(guò)載。最早可追溯到1995年由卡耐基·梅隆大學(xué)推出的個(gè)性化導(dǎo)航系統(tǒng)“Web Watcher”。此后十年間,麻省理工、AT&T實(shí)驗(yàn)室、IBM等著名機(jī)構(gòu)也加入其中,分別在廣告、銷售、搜索等領(lǐng)域各有建樹(shù)。
2003年,芝加哥大學(xué)法學(xué)教授凱斯·桑斯坦注意到這一趨勢(shì)。他于當(dāng)年出版的《網(wǎng)絡(luò)共和國(guó)》一書(shū)中開(kāi)門見(jiàn)山地告訴人們:未來(lái)某時(shí),科技將能極大地幫助人類過(guò)濾他們的所讀所看所聽(tīng)。我們現(xiàn)在習(xí)慣的報(bào)紙、雜志和廣播電視多已成為過(guò)去式。
“我們離傳播系統(tǒng)完全個(gè)人化的時(shí)代已經(jīng)不遠(yuǎn)了?!鄙K固箤?xiě)道。
誰(shuí)在決定你的屏幕
14年后的今天,桑斯坦的部分預(yù)言正在實(shí)現(xiàn)。推薦算法得到廣泛應(yīng)用,除了資訊服務(wù),還為人們推薦商品、電影、音樂(lè)、美食、社交好友和旅游勝地?!澳銜?huì)有一種錯(cuò)覺(jué),最了解你的不是家人,而是手機(jī)程序。”我的朋友悠悠是重度手機(jī)依賴者,對(duì)此感觸良多,“好像整個(gè)世界都為你而轉(zhuǎn)?!?/p>
再說(shuō)說(shuō)三年前我轉(zhuǎn)型至互聯(lián)網(wǎng)的那個(gè)焦慮的夏天。幸而我的新同事都很熱心,幫我打破藩籬,給我講解推薦算法的原理。在那些精妙的流程圖中,我體會(huì)著大數(shù)據(jù)的藝術(shù),以及與機(jī)器相處的哲學(xué)。
黃仲輝是ZAKER的CTO,給了我最初的技術(shù)思維啟蒙?!八惴ㄊ且环N策略機(jī)制。具體到內(nèi)容推薦,影響因素變得異常復(fù)雜,因?yàn)楦骂l率很高?!彼f(shuō),“通俗來(lái)講,要對(duì)用戶信息、行為特征、關(guān)聯(lián)規(guī)則、社交關(guān)系等有既精準(zhǔn)又全局的理解和把握?!?/p>
這段話至少涉及兩類基礎(chǔ)算法:“基于內(nèi)容的推薦算法”和“協(xié)同過(guò)濾算法”。它們應(yīng)用最廣,也最典型。
前者在資訊閱讀領(lǐng)域有著基石般的存在。形象地說(shuō)就是“你多看什么就給你推薦什么”。Feed流(信息流)是目前資訊和社交軟件最常用的展示方式,因直觀、簡(jiǎn)單、高效等優(yōu)勢(shì)深受歡迎。若究其字面意思卻既形象又令人難堪——“飼料”,比喻像喂動(dòng)物一樣填滿那些貪婪又懶惰的腦袋。
早期Feed流都是以Timeline(時(shí)間線)排序,最經(jīng)典的案例就是朋友圈。這種排序法易于理解且充滿極簡(jiǎn)主義哲學(xué)。然而它的缺點(diǎn)也很明顯——呈現(xiàn)效率極為低下,如果更新量很大且不是強(qiáng)熟人關(guān)系,使用體驗(yàn)將相當(dāng)災(zāi)難。
于是,“重力排序算法”得以衍生,它是兼顧熱度和更新時(shí)間的綜合策略。它給內(nèi)容施加兩種力:“重力”和“拉力”。前者是時(shí)間,新內(nèi)容會(huì)把老內(nèi)容刷下去。后者則代表點(diǎn)擊數(shù)、評(píng)論、贊等“熱度”,又會(huì)把熱點(diǎn)內(nèi)容推上去。如此往復(fù),用戶將看到一種“既新又熱”的動(dòng)態(tài)平衡。
?基于內(nèi)容的推薦算法原理圖(來(lái)自“人人都是產(chǎn)品經(jīng)理”社區(qū))
“協(xié)同過(guò)濾算法”主要是基于人際關(guān)系和興趣關(guān)聯(lián)的推薦方案。例如“我很多朋友愛(ài)看NBA,我也極有可能喜歡籃球”,“讀王小波的人很有可能也喜歡喬治·奧威爾(對(duì)王影響最大的作家之一)”。
有趣的是,協(xié)同過(guò)濾最終不是在資訊而是在電商領(lǐng)域發(fā)揮了最大價(jià)值?!跋啾荣Y訊,用戶購(gòu)物偏好和商品種類都相對(duì)有限,推薦結(jié)果也就能相對(duì)精準(zhǔn)?!秉S仲輝說(shuō)。
那個(gè)被引用無(wú)數(shù)的“尿布—啤酒”的銷售案例就是協(xié)同過(guò)濾的經(jīng)典應(yīng)用。沃爾瑪分析消費(fèi)者購(gòu)物行為時(shí)發(fā)現(xiàn),男性在買嬰兒尿片時(shí)都會(huì)順手犒勞自己幾瓶啤酒。于是,兩種看似風(fēng)馬牛的東西,通過(guò)大數(shù)據(jù)和算法,捆綁銷售實(shí)現(xiàn)效益最大化。
“絕大多數(shù)情況下,推薦算法不會(huì)單一應(yīng)用,而是多種算法的組合和優(yōu)化?!秉S仲輝說(shuō)。推薦算法在實(shí)戰(zhàn)中升級(jí),進(jìn)化得更為復(fù)雜。“智能排序”成為新的寵兒。它具有更高級(jí)的機(jī)器學(xué)習(xí)能力,能更準(zhǔn)確地預(yù)測(cè)“內(nèi)容價(jià)值”,從而實(shí)現(xiàn)一些更高級(jí)細(xì)分的功能,如 Facebook 屏蔽標(biāo)題黨,知乎處罰抱團(tuán)點(diǎn)贊等。
他們消失了
從傳播學(xué)角度看,推薦算法不僅迎合人們的行為,還符合人們的心理。“它為什么被接受且流行?”美國(guó)密歇根州立大學(xué)傳播學(xué)碩士江曉雅說(shuō),“這或許符合了人們的一種信息選擇機(jī)制——選擇性接觸?!?/p>
“選擇性接觸”指的是,人們傾向于接觸和他們的觀念相近的信息,回避和他們的觀念相左的信息。
技術(shù)和心理的合力讓真實(shí)的天平失衡,所有人的屏幕只是過(guò)濾后的結(jié)果。這種改變相當(dāng)隱形,個(gè)體對(duì)其甚難覺(jué)察。
美國(guó)學(xué)術(shù)期刊《輿論季刊》刊發(fā)的一個(gè)調(diào)查表明,愛(ài)泡社交網(wǎng)絡(luò)和搜索引擎的人,意見(jiàn)更極化;另一份學(xué)術(shù)期刊《信息、傳播與社會(huì)》發(fā)現(xiàn),兩檔脫口秀的Facebook粉絲,很少有共同的信息來(lái)源。
美國(guó)人伊萊·帕里澤想驗(yàn)證一下這些隱蔽的鴻溝。他請(qǐng)幾個(gè)朋友在Google同時(shí)輸入“埃及”,結(jié)果大相徑庭。
“丹尼爾(Daniel)的搜索結(jié)果首頁(yè)沒(méi)有任何埃及抗議活動(dòng)的新聞,而斯科特(Scott)的則滿是這些。這可是當(dāng)天的大新聞?!痹?011年的TED分享中,他為全球觀眾展示了這個(gè)小秘密。
Facebook也好不到哪去。帕里澤是美國(guó)左翼活動(dòng)人士,號(hào)召更開(kāi)放、多元、透明的互聯(lián)網(wǎng)環(huán)境,因而也關(guān)注了一些保守派人士的賬號(hào),想聽(tīng)聽(tīng)不同的聲音?!暗幸惶?,我注意到, 我Facebook里保守派朋友的動(dòng)態(tài)消息全都消失了,這讓我很吃驚。而且沒(méi)有任何人告知我?!?/p>
這些觀察被他寫(xiě)進(jìn)著作《過(guò)濾氣泡》,爾后這個(gè)書(shū)名成了流行詞。帕雷瑟用各種方式告誡人們,將信息判斷權(quán)交與算法后,看似省事兒,實(shí)則被包進(jìn)了“信息繭房”,而它們正是封閉、分化、偏見(jiàn)的溫床。
“你的‘過(guò)濾氣泡’是你獨(dú)一無(wú)二的信息世界?!迸晾咨f(shuō),“氣泡中有什么,取決于你是誰(shuí),你做了什么。但你不能決定什么信息被通過(guò),也看不到哪些信息被刪除?!?/p>
“算法帶來(lái)權(quán)力的轉(zhuǎn)移。更確切地說(shuō),是對(duì)信息的支配權(quán)從專業(yè)人士轉(zhuǎn)移到機(jī)器?!泵绹?guó)賓夕法尼亞大學(xué)傳播學(xué)博士候選人方可成說(shuō),“算法成了新的權(quán)威?!?/p>
我們好像又回到了1915年
現(xiàn)在的Facebook和13年前那個(gè)起步于哈佛大學(xué)宿舍的社交工具相去甚遠(yuǎn),那些發(fā)發(fā)校園照片的小清新日子永遠(yuǎn)回不來(lái)了。日活12億的體量讓其成為全球最具影響力的社交媒體,也成為最具破壞力的假新聞陣地——每一秒,News Feed的推薦機(jī)制都在海納百川,把真相,也把謊言分門別類、互不干擾地投給嗷嗷待哺的用戶。
然而,由于篤信自己算法的優(yōu)勢(shì),F(xiàn)acebook在美國(guó)大選前開(kāi)除了所有的熱點(diǎn)話題編輯。此后兩個(gè)月,它幾乎被假新聞掩埋。紐約時(shí)報(bào)稱,整個(gè)大選期間共125萬(wàn)條假新聞飛揚(yáng),“推波助瀾者正是Facebook和Twitter之流。”
前總統(tǒng)奧巴馬也哀嘆:“它們被包裝得天衣無(wú)縫,以至當(dāng)你在 Facebook 上看到它們時(shí),會(huì)認(rèn)為它們跟電視新聞一樣權(quán)威。”
由推薦算法制造的片面甚至虛幻的世界,帶來(lái)全面、客觀、中立、平衡等健康信息傳播形態(tài)的喪失。正如英國(guó)留歐支持者知道公投結(jié)果后深感絕望,希拉里的粉絲也在特朗普獲勝后毫無(wú)防備——他們?cè)贔acebook里完全不知道那群做相反選擇的人的存在。
“造成的最終結(jié)果之一,就是極大地影響了公眾對(duì)真正事實(shí)的探究,甚至集體做出錯(cuò)誤的決定。”《紐約時(shí)報(bào)》評(píng)價(jià)。
《華盛頓郵報(bào)》則對(duì)Facebook用戶做了抽樣調(diào)查,發(fā)現(xiàn)幾乎所有用戶的熱門話題是一則關(guān)于世界首例“男性生殖器移植”的新聞。由此可見(jiàn)?!矮C奇+性”的超級(jí)組合,在Facebook的算法里也獲得極高的通行權(quán)限。
這是全球資訊低俗化浪潮的縮影。在中國(guó),流量和用戶時(shí)間的爭(zhēng)奪異常慘烈,推薦算法在某種意義上已成為垃圾信息的引擎,大把謀殺數(shù)以億計(jì)人的時(shí)間。
Facebook無(wú)意承擔(dān)更多作為超級(jí)媒介的責(zé)任,它甚至不希望成為媒體。去年,工程師們調(diào)整了算法,降低專業(yè)新聞的權(quán)重。這意味著,用戶將獲得更多的碎碎念,而非經(jīng)嚴(yán)格流程生產(chǎn)的事實(shí)真相?!靶侣勈?shì)了。”Buzzfeed[2]科技記者查理·瓦澤爾這樣認(rèn)為。
這套新算法卻不盡如人意。2016年9月,挪威作家湯姆·艾格蘭發(fā)布了歷史照片《凝固汽油彈的女孩》。那個(gè)正遭受烈火之痛的越南小女孩赤身奔逃的畫(huà)面,是上世紀(jì)越戰(zhàn)最著名的瞬間,它還獲得普利策新聞獎(jiǎng)。
但Facebook的算法把它刪除了,還順帶封了作家的號(hào),挪威首相索爾貝格也轉(zhuǎn)發(fā)了此貼,結(jié)果也被干掉了——算法可能將此圖視為“兒童色情”。
Facebook CEO桑德伯格隨后寫(xiě)信給挪威首相道歉。首相說(shuō),社交媒體不應(yīng)該將責(zé)任轉(zhuǎn)交給機(jī)器。
這和《過(guò)濾氣泡》作者伊萊·帕里澤在TED演講中的呼吁如出一轍?!拔覀儗⑦x擇權(quán)傳遞給了計(jì)算機(jī)算法,但問(wèn)題是,它們并沒(méi)有人類所具備的道德精神。”(文/葉偉民)
◎關(guān)于作者
葉偉民,媒體人。畢業(yè)于蘭州大學(xué)核物理專業(yè)。曾任ZAKER總編輯,南方周末特稿編輯、記者。現(xiàn)從事互聯(lián)網(wǎng),同時(shí)是多家平臺(tái)的簽約作者和寫(xiě)作導(dǎo)師。
◎注釋
[1] EdgeRank算法:Facebook對(duì)新鮮事排序的算法。依據(jù)用戶對(duì)好友的動(dòng)作計(jì)算分值,按總分決定事件的排序。該算法更多考慮人與人的關(guān)系因素,對(duì)內(nèi)容質(zhì)量較少干涉。
[2] Buzzfeed:美國(guó)的新聞聚合網(wǎng)站,2006年創(chuàng)建于美國(guó)紐約。
◎譯名對(duì)照表
凱斯·桑斯坦 Cass Sunstein
喬治·奧威爾 George Orwell
《輿論季刊》 Public Opinion Quarterly
《信息、傳播與社會(huì)》 Information, Communication & Society
伊萊·帕里澤 Eli Pariser
查理·瓦澤爾 Charlie Warzel
湯姆·艾格蘭 Tom Egeland
埃爾娜·索爾貝格 Erna Solberg
雪莉·桑德伯格 Sheryl Sandberg
亞伯拉罕·弗萊克斯納 Abraham Flexner
制版編輯: 許逸|
本頁(yè)刊發(fā)內(nèi)容未經(jīng)書(shū)面許可禁止轉(zhuǎn)載及使用
公眾號(hào)、報(bào)刊等轉(zhuǎn)載請(qǐng)聯(lián)系授權(quán)
copyright@zhishifenzi.com
知識(shí)分子為更好的智趣生活 ID:The-Intellectual