資料表示基礎：聲音壓縮

試卷 2 - ⇑ 資料表示基礎 ⇑
← 取樣聲音	聲音壓縮	奈奎斯特定理 →

如您所見，我們對聲音檔案的大小存在一些嚴重的問題。看看一個以 44 kHz 取樣率和 16 位取樣解析度錄製的三分鐘流行歌曲的大小。

44,000 * 16 * 180 = 126 720 000 bits (15.84 MB)

您可能已經知道，相同長度的 mp3 大約只有 3Mb，只有原始檔案大小的五分之一。那麼是什麼原因呢？很容易看出，聲音的原始檔案大小太大，難以儲存和傳輸，需要一種方法來壓縮它們。

無失真壓縮

無失真壓縮 - 壓縮不會丟失任何精度，並且可以解壓縮成與原始音訊資料完全相同的副本

WAV 檔案根本不涉及任何壓縮，大小與您已經計算過的檔案大小相同。存在一些無失真壓縮的檔案格式，例如 FLAC，它將 WAV 檔案壓縮成通常為原始大小 50% 的資料。為此，它使用 遊程長度編碼，它尋找聲音檔案中重複的模式，並且不是分別記錄每個模式，而是儲存關於模式在行中出現次數的資訊。讓我們以一組假設的取樣點為例

0000000000000000000001234543210000000000000000000123456787656789876

如您所見，靜音區域佔據了檔案的大部分，而不是分別記錄這些區域，我們可以設定資料來宣告靜音取樣在行中出現的次數，從而大幅減少檔案大小

(21-0)123454321(17-0)123456787656789876

FLAC 檔案使用的另一種技術是線性預測.

有失真壓縮

FLAC 檔案仍然非常大，需要一種格式，使您可以建立更小的檔案大小，以便輕鬆地儲存在您的計算機和行動式音樂裝置上，並輕鬆地透過網際網路傳輸。

有失真壓縮 - 壓縮會丟失檔案精度，通常比無失真壓縮更小

正如我們已經看到的，為了製作更小的音訊檔案，我們可以降低取樣率和取樣解析度，但我們也看到了這會對最終聲音產生的可怕影響。存在其他巧妙的方法來壓縮聲音，這些方法無法讓我們完全獲得我們開始時的音訊，但會非常接近。這就是有失真壓縮。

存在許多有失真壓縮的音訊格式，包括：MP3、AAC 和 OGG（這是開源的）。壓縮透過降低被認為超出大多數人聽覺解析度能力的聲音的某些部分的精度來實現。這種方法通常稱為 感知編碼。它使用心理聲學模型來丟棄或降低對人類聽覺來說不太明顯的成分的精度，然後以有效的方式記錄剩餘的資訊。由於某些頻率的精度會丟失，因此您通常可以分辨出原始版本和有損版本之間的區別，能夠聽到高音和低音的丟失。

練習：聲音壓縮

為什麼有必要壓縮聲音檔案？

回答

這樣它們佔用的空間更小，可以快速透過網際網路傳送或儲存在行動式音樂播放器上

列出兩種可用的壓縮類別，並分別給出一種檔案格式

回答

有失真壓縮 (mp3/AAC/ogg) 和無失真壓縮 (FLAC)

對以下聲音檔案執行遊程長度編碼

012344444444444432222222222222211111111111111000000000000

回答

0123(11-4)3(13-2)(14-1)(11-0)

描述一種用於壓縮 mp3 檔案的技術

回答

感知編碼降低了儲存在聲音檔案中的超出大多數人聽覺解析度能力的頻率的質量

何時最好使用 FLAC 而不是 ogg，反之亦然？

回答

當您非常在意聲音質量，並且不介意檔案大小的時候
當您試圖使聲音檔案儘可能小的時候