正文

超級“驗證碼”

反枯燥:游戲化思維開創(chuàng)商業(yè)及管理的“新藍(lán)?!?/a> 作者:亞當(dāng)·L.潘恩伯格


如今,這位開著保時捷的卡內(nèi)基梅隆大學(xué)計算機科學(xué)終身教授,馮·安,不僅是一位計算機科學(xué)家,還是一位教育學(xué)家、企業(yè)家、游戲設(shè)計者、市場營銷人員、媒介組織者及創(chuàng)業(yè)者。他不僅把游戲看作娛樂,更讓其服務(wù)于我們生活的方方面面。而馮·安現(xiàn)在所研究的,可能是他最宏偉的項目,這個項目源于他向研究生學(xué)生們問的一個問題:如何讓1 億人免費幫我們在線翻譯?

這個問題,讓他想到了自己在大學(xué)時有一個叫 “CAPTCHA”的發(fā)明,CAPTCHA 是“全自動區(qū)分計算機和人類的圖靈測試”的簡稱(Completely Automated Public Turing test to tell Computers and Humans Apart)。(阿蘭·圖靈,計算機科學(xué)家,1980 年發(fā)明了一種實驗,用于分析機器是否可以超過人)。

當(dāng)年,雅虎來到卡內(nèi)基梅隆大學(xué)尋求馮·安的建議,問他是否有什么方法可以阻止網(wǎng)絡(luò)欺詐。詐騙者通常部署海量的垃圾郵件機器人程序,自動注冊規(guī)模龐大的電子郵件,公司應(yīng)該做點什么來對付他們。馮·安的辦法非常簡單又巧妙。他想出了一套系統(tǒng),這種系統(tǒng)可以創(chuàng)建一個數(shù)字和字母的組合,組合很模糊,機器無法識別,但人類卻可以。盡管人們使用的時候,也會因為模糊不清而咒罵。但無論如何,CAPTCHA 在數(shù)以百萬的網(wǎng)站上都得以運用。沒錯,它就是今天的“驗證碼”。

一天,馮·安發(fā)現(xiàn)這樣一個事實,現(xiàn)在網(wǎng)絡(luò)上驗證碼每天的輸入量大概在2 億次。如果每人輸入一個驗證碼的平均時間是10 秒,那人類每天浪費在驗證碼上的總時間就是50 萬小時。于是這個事實讓他決定創(chuàng)造一個進(jìn)化版的驗證碼,取名reCAPTCHA。原理跟之前相同,只不過輸入的來源是一些舊書。利用這種方法,我們可以從數(shù)量龐大的非生產(chǎn)力行為中,剝離出有意義的價值。

掃描一本舊書再將其內(nèi)容電子化是一項艱苦的過程,這相當(dāng)于要把書的每一頁進(jìn)行拍照,之后利用計算機的光學(xué)字符識別(OCR)技術(shù),對每個字一一解碼。而這種技術(shù)的錯誤率本身就比較高,對于舊書更是如此。這些書籍的出版年份都超過50 年,頁面發(fā)黃、墨水褪色,錯誤率高達(dá)30%。

對此,馮·安的做法是,他首先選出了計算機無法識別的詞語,之后讓人們通過reCAPTCHA 幫他完成識別過程。他給人們提供兩個詞,一個是來自舊書的計算機無法識別的詞語,另一個是計算機已經(jīng)知道答案的詞語。系統(tǒng)并不告訴用戶哪個是那個。如果用戶正確地輸入了計算機知道答案的那個詞,那么計算機判定用戶為人類,于是,而且對用戶輸入的另一個計算機無法辨認(rèn)的詞也應(yīng)該是正確的。如果10 個用戶所輸入的詞都一致,那么計算機便可成功完成詞語的編輯。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號