正文

數(shù)據(jù)壓縮——有益無害(8)

改變未來的九大算法 作者:(美)約翰·麥考密克


步驟二:

計算機會檢查傳輸后的文件,選出經(jīng)常出現(xiàn)的符號。比如,如果原文件以英語為書寫語言,那么計算機就很有可能會發(fā)現(xiàn)“e”和“t”是最常出現(xiàn)的兩個符號。隨后,計算機會創(chuàng)建一張如下頁的表格,用短數(shù)字碼代表經(jīng)常用到的符號,用更長的數(shù)字碼代表極少用到的符號。

步驟三:

計算機會通過直接將文件翻譯為步驟二中的數(shù)字碼來再次傳輸文件。

步驟二中計算出的數(shù)字碼表也會存儲在ZIP文件中,否則在后面不可能解碼(并解壓)ZIP文件。注意,不同的未壓縮文件會得到不同的數(shù)字碼表。事實上,在真正的ZIP文件中,原文件被分成了小塊,每個塊都有不同的數(shù)字碼表。計算機能自動高效地完成所有這些步驟,實現(xiàn)多種文件的優(yōu)質(zhì)壓縮。

有損壓縮:不是免費午餐,但也是一筆好買賣

到目前為止,我們一直都在討論無損壓縮,因為你能將壓縮過的文件重新組建成一開始使用的原文件,連一個字母或一個標點符號都沒有改變。相反,有時候使用有損壓縮要有用得多。有損壓縮能讓你將一個壓縮過的文件重新組建成一個和原文件非常類似,但并不完全和原文件相同的文件。比如,有損壓縮經(jīng)常用于包含圖片或音頻數(shù)據(jù)的文件:只要照片在人眼中看起來一樣,在計算機上存儲照片的文件是否和在相機中存儲照片的文件相同其實并不重要。同樣的道理也適用于音頻數(shù)據(jù):只要歌曲在人耳中聽起來一樣,在數(shù)字音樂播放器上存儲歌曲的文件是否和在CD中存儲歌曲的文件相同也并不重要。

事實上,有時候有損壓縮會以更為極端的方式使用。我們都看過互聯(lián)網(wǎng)上的低質(zhì)量視頻和圖片,里面的畫質(zhì)模糊,音質(zhì)糟糕。這是過度使用有損壓縮的結(jié)果,目的是讓視頻或圖像文件體積變得非常小。我并不是要說視頻看起來要和原視頻一樣,但至少也要可以看清。通過調(diào)整壓縮的“損失率”,網(wǎng)站操作人員可以在看起來和聽起來幾近完美的高質(zhì)量大文件,以及有著明顯缺陷但傳輸帶寬要求很少的低質(zhì)量文件之間進行選擇。你也可能在數(shù)碼相機上做過同樣的事,通常你能選擇圖像和視頻質(zhì)量的不同設(shè)置。如果你選擇高質(zhì)量設(shè)置,你能在相機上存儲的照片或視頻數(shù),就會比選擇低質(zhì)量設(shè)置時少很多。這是因為高質(zhì)量媒體文件要比低質(zhì)量媒體文件占據(jù)更多空間。而這一切都只需通過調(diào)整壓縮“損失率”來完成。接下來,我們將探究幾種進行這一調(diào)整的把戲。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號