回到更短符號(hào)把戲。和本書中描述的許多本該是技術(shù)性的思想一樣,人類也一直在運(yùn)用更短符號(hào)把戲,用時(shí)甚至想都沒(méi)想過(guò)。更短符號(hào)把戲的基本思想是,如果你使用某樣?xùn)|西足夠多次,給它起個(gè)簡(jiǎn)短縮寫是很值得的。所有人都知道“USA”是“United States of America”(美利堅(jiān)合眾國(guó))的縮寫——我們所有人每次在輸入或說(shuō)出這個(gè)由3個(gè)字母組成的代碼“USA”,而非其代表的由24個(gè)字母組成的完整短語(yǔ)時(shí)都節(jié)省了很多力氣。你知道“The sky is blue in color”(天空很藍(lán))的縮寫嗎?這個(gè)短句恰好也由24個(gè)字母組成。當(dāng)然不知道!但為什么呢?“United States of America”和“The sky is blue in color”之間有什么區(qū)別?關(guān)鍵區(qū)別在于,其中一個(gè)短語(yǔ)的使用頻率要比另一個(gè)大得多,而通過(guò)縮寫一個(gè)經(jīng)常使用的短語(yǔ)而非一個(gè)極少使用的短語(yǔ),我們可以節(jié)省大量力氣。
讓我們嘗試將這個(gè)想法應(yīng)用到上一頁(yè)的代碼系統(tǒng)中去。我們已經(jīng)知道,通過(guò)使用經(jīng)常用到的東西的縮寫,我們節(jié)省的力氣能達(dá)到最大。字母“e”和“t”在英語(yǔ)中使用得最頻繁,讓我們嘗試用更短的代碼來(lái)代替這兩個(gè)字母。現(xiàn)在,“e”是31,“i”是46——每個(gè)字母都需要兩個(gè)數(shù)字代表。將兩個(gè)數(shù)字減成一個(gè)數(shù)字呢?假設(shè)現(xiàn)在“e”由8代表,“t”由9代表。這個(gè)主意太好了!記得我們之前是如何編碼短句“Meet your .ancé there”(去那見(jiàn)你的未婚夫)的吧,當(dāng)時(shí)一共用了46個(gè)數(shù)字?,F(xiàn)在我們可以只使用40個(gè)數(shù)字:
M e e t y o u r f i a n c é t h e r e .
138 8 9 005141474400323527402982009 348 448 66
不幸的是,這一計(jì)劃有個(gè)致命缺陷。計(jì)算機(jī)并不存儲(chǔ)單個(gè)字母間的空格。因此編碼不會(huì)像“13 8 8 9 00 51 . . . 44 8 66”,而是和“138890051. . . 44866”一樣。你發(fā)現(xiàn)問(wèn)題了沒(méi)有?集中看前5個(gè)數(shù)字,也就是13889。注意代碼13代表“M”,8代表“e”,9代表“t”,因此數(shù)字13889的解碼方式之一是將其拆成13-8-8-9,得到單詞“Meet”。但88代表重讀符號(hào)“ú”,因此數(shù)字13889也可能拆分為13-88-9,即“Mút”。事實(shí)上,情況還可以更糟,因?yàn)?9代表另一個(gè)略為不同的重讀符號(hào)“ù”,因此13889的另一種可能拆分是13-8-89,代表“Meù”。根本沒(méi)辦法分辨這三種可能的翻譯中哪種正確。