【編者按】北京時間3月27日晚,ACM(計算機協(xié)會)宣布把2018年度圖靈獎頒給了深度學(xué)習(xí)“三巨頭”——Yoshua Bengio、Geoffrey Hinton和Yann LeCun,以表彰他們在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)上的工作。圖靈獎被認為是計算機領(lǐng)域的“諾貝爾獎”。
本文節(jié)選自特倫斯·謝諾夫斯基(Terrence Sejnowski)的最新作品《深度學(xué)習(xí):智能時代的核心驅(qū)動力量》,特倫斯·謝諾夫斯基與本屆圖靈獎得主之一Geoffrey Hinton共同發(fā)明了玻爾茲曼機。
特倫斯·謝諾夫斯基
什么是深度學(xué)習(xí)?
如果你在連接了互聯(lián)網(wǎng)的安卓手機或谷歌翻譯平臺上使用語音識別功能,你其實是在與經(jīng)過深度學(xué)習(xí)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)進行交流。深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,它根植于數(shù)學(xué)、計算機科學(xué)和神經(jīng)科學(xué)。深度網(wǎng)絡(luò)從數(shù)據(jù)中學(xué)習(xí),就像嬰兒了解周圍世界那樣,從睜開眼睛開始,慢慢獲得駕馭新環(huán)境所需的技能。深度學(xué)習(xí)的起源可以追溯到20世紀(jì)50年代人工智能的誕生。
深度學(xué)習(xí)與每個人有什么關(guān)系?
AI醫(yī)療
隨著機器學(xué)習(xí)的成熟并被應(yīng)用于可獲取大數(shù)據(jù)的許多其他問題,服務(wù)行業(yè)和其相關(guān)職業(yè)也將發(fā)生轉(zhuǎn)變。
基于數(shù)百萬患者病情記錄的醫(yī)學(xué)診斷將變得更加準(zhǔn)確。最近的一項研究將深度學(xué)習(xí)運用到了囊括超過2000種不同疾病的13萬張皮膚病學(xué)圖像中,這個醫(yī)學(xué)數(shù)據(jù)庫是以前的10倍大。
計算機對新患者醫(yī)學(xué)影像的診斷與21位頂級皮膚科專家的結(jié)論基本一致,甚至在某些情況下還要更準(zhǔn)確。
在不久的將來,任何一個擁有智能手機的人都可以拍下疑似皮膚病變的照片,并立即進行診斷——而現(xiàn)在要完成同樣的過程,我們需要先去看醫(yī)生,耐心等待病變被專家篩查出來,然后再支付一大筆賬單。
這一進步將大大擴大皮膚病護理的范圍,提升護理質(zhì)量。如果個體可以很快得到專家診斷,他們會在皮膚病的早期階段,也就是更容易治療的時候就開始就醫(yī)。借助深度學(xué)習(xí),所有的醫(yī)生都將更準(zhǔn)確地診斷罕見的皮膚病。
不單是皮膚病,借助深度學(xué)習(xí)的診斷,醫(yī)生可以將癌癥診斷的準(zhǔn)確度從0.966提高到0.995。誤判的情況將大大減少,更多生命將被挽救。每個人都將是AI醫(yī)療的受益者。
自動駕駛
不久之前,人們還常說,計算機視覺的辨別能力尚不如一歲大的孩子。如今看來,這句話要改寫了。計算機不僅能和大多數(shù)成年人一樣識別圖片中的物體,在馬路上駕駛汽車的安全性還高過16歲的青少年。更神奇的是,如今的計算機不再是被動按照指令識別和駕駛,而是像自然界的生命由數(shù)百萬年前開始進化那樣,自主地從經(jīng)驗中學(xué)習(xí)。
自動駕駛汽車不久將擾亂數(shù)百萬卡車司機和出租車司機的生計。最終,如果一輛自動駕駛汽車能夠在一分鐘內(nèi)出現(xiàn),將你安全帶到目的地且無須停車,在城市擁有汽車就顯得不那么必要了。
今天,汽車行駛時間平均僅占4%,這意味著它其余96%的時間都需要停放在某個地方。由于自動駕駛汽車可以在城市外圍維修和停放,城市中被大量停車場占用的空間得以被重新高效利用。城市規(guī)劃者已經(jīng)開始考慮讓停車場變成公園了。街邊的停車道可以成為真正的自行車道。
其他汽車相關(guān)行業(yè)也將受到影響,包括汽車保險業(yè)和修理廠。超速和停車罰單將不復(fù)存在。由醉駕和疲勞駕駛導(dǎo)致的交通事故死亡人數(shù)也會相應(yīng)減少。通勤浪費的時間也將被節(jié)省下來做其他事情。
可以預(yù)見的是,卡車會在10年內(nèi)實現(xiàn)自動駕駛,出租車要花上15年,15~25年后,客運無人車將全面走入我們的生活。
智能翻譯+語音識別
語言翻譯是人工智能的一只圣杯,因為它依賴于理解句子的能力。
谷歌最近推出了基于深度學(xué)習(xí)的最新版谷歌翻譯(Google Translate),代表了自然語言翻譯質(zhì)量的重大飛躍。幾乎一夜之間,語言翻譯就從零散雜亂的拼湊短語,升級到了語意完整的句子。之前的計算機方法搜索的是可以被一并翻譯的詞匯組合,但深度學(xué)習(xí)會在整個句子中尋找詞匯之間的依賴關(guān)系。
也許有一天,機器能夠通過整合莎士比亞的所有詩歌來翻譯他的作品。
人工智能的另一只圣杯是語音識別。
這一突破性成果將在之后的幾年逐漸影響我們的社會,計算機鍵盤會被自然語言接口取代。隨著數(shù)字助手,如亞馬遜的Alexa、蘋果的Siri以及微軟的Cortana先后進入千家萬戶,這種取代已經(jīng)在發(fā)生了。就如隨著個人電腦的普及,打字機退出了歷史舞臺,有一天電腦鍵盤也將成為博物館的展品。
語音識別和語言翻譯結(jié)合到一起時,實時的跨文化交流將有可能實現(xiàn)?!缎请H迷航》中那種萬能翻譯機將觸手可及。
社交機器人+情緒識別
電影經(jīng)常將人工智能描述為像人類一樣走路和說話的機器人,目前人工智能的進展主要集中在感官和認知方面,運動和行為智能的進展相對緩慢。
加州大學(xué)圣迭戈分校神經(jīng)計算研究所機器感知實驗室的教員和聯(lián)合主任哈維爾.莫維蘭發(fā)明了一個著名的社交機器人Rubi。Rubi的頭可以旋轉(zhuǎn),眼睛是相機,嘴和眉毛都十分富有表現(xiàn)力。Rubi頭頂上濃密的光纖會隨著它的心情而改變顏色。18個月大的幼兒通過Rubi腹部的平板電腦與Rubi進行互動。
你的面部表情是你腦內(nèi)情緒狀態(tài)的窗口,深度學(xué)習(xí)現(xiàn)在已經(jīng)可以探進這個窗口了。
艾克曼是世界著名的面部表情專家,是美劇《別對我撒謊》(Lie to Me)系列中卡爾·萊特曼(Cal Lightman)博士在真實世界中的原型。艾克曼開發(fā)了面部動作編碼系統(tǒng)來監(jiān)控面部44塊肌肉的狀態(tài)。
面部表情是動態(tài)的,可以延續(xù)若干秒,但是艾克曼發(fā)現(xiàn),有些表情只持續(xù)了幾幀。這些“微表情”是受到抑制的大腦狀態(tài)的情感泄漏,常常很能說明情感狀態(tài),有時會揭示無意識的情緒反應(yīng)。例如,在婚姻咨詢環(huán)節(jié)中出現(xiàn)的細微的厭惡表情,就是一個預(yù)示婚姻會失敗的可靠
跡象。
在不久的將來,你的智能手機可能不僅會問你為什么不高興,還可能幫助你冷靜下來。
深度學(xué)習(xí)的其他深度影響
法律
深度學(xué)習(xí)剛剛開始影響法律界。技術(shù)輔助審核或調(diào)查將被人工智能接管,它可以瀏覽數(shù)千份文件以獲取合法證據(jù),且絲毫不會感到厭倦。自動化深度學(xué)習(xí)系統(tǒng)將為現(xiàn)在無法負擔(dān)律師費用的普通人提供法律建議。法律工作不僅收費會更便宜,也會更高效,這一點通常比費用更重要。
投資
機器學(xué)習(xí)正在推動算法交易,它比傳統(tǒng)的長期投資策略更快速,比股票市場中的高頻交易更加慎重。許多不同類型的機器學(xué)習(xí)算法被組合運用以獲得最佳回報。
競技
一個名為“DeepStack”的深度學(xué)習(xí)網(wǎng)絡(luò)和33名德州撲克職業(yè)選手進行了44852場比賽。令撲克專家震驚的是,在這種詐唬、欺騙的技巧和拿到的牌一樣重要的游戲里,它以相當(dāng)大的優(yōu)勢擊敗了最出色的撲克玩家。
如果這一成就能復(fù)制到其他基于不完全信息、需要人來做判斷的重要領(lǐng)域,比如政治學(xué)和國際關(guān)系,其影響可能是極其深遠的。