數字音樂作曲/聲音理解
| 此頁面包含指向音訊檔案的內聯連結。如果您在播放檔案時遇到問題,請參見媒體幫助. |
聲音是一種壓力波——一種傳播的壓力變化。它透過介質(任何物質物體)傳播,傳播速度取決於介質的特性——基本上,材料越硬或越難壓縮,聲音透過該材料的速度就越快。它可以透過任何物質狀態傳播,無論是固體、液體還是氣體。它唯一無法傳播的地方是沒有任何物質的地方——在真空中,比如外太空。它可以在兩個材料接觸的地方從一個材料傳遞到另一個材料。因此,我們的耳朵由固體 (聽小骨) 和液體 (耳蝸) 部分組成,通常從氣態空氣中接收聲音,但它們也可以在水下工作。
這些壓力波如何轉化為神經訊號,並由我們的大腦處理,被稱為心理聲學,這是一個非常複雜的過程,其微妙之處仍在不斷研究中。需要說的是,一些你認為你能聽到的東西,實際上你聽不到,而一些你認為你聽不到的東西,實際上你能聽到。
聲音基本上可以用標量量來表示,代表測量點上的壓力,隨時間變化——單個聲音通道。由於我們有兩個耳朵,我們可以有效地使用兩個這樣的量,同時代表每個耳朵的壓力——兩個獨立的聲音通道,也稱為立體聲聲音。事實上,現在我們通常有不止兩個通道,以產生環繞聲.
但在我們深入研究這些複雜問題之前,讓我們首先考慮單個聲音通道的特徵。
一些聲音在我們聽起來更悅耳、更音樂,而另一些聲音聽起來刺耳、不和諧。如果我們將壓力波隨時間變化繪製成曲線,我們會注意到,更音樂的聲音往往具有隨著時間非常規律地重複的形狀,而不太音樂的聲音往往看起來更不規則。
形狀重複的速率稱為頻率,這直接轉換為音樂音符的音高。事實上,樂器發出的聲音通常包含一系列頻率。
所以,觀察聲音的另一種方式是,與其將壓力幅度對時間繪製(聲音的時域表示),不如將聲音分解成它的頻率成分,並將它們的強度對頻率繪製(頻域表示)。該圖也被稱為聲譜圖。存在一種數學變換,可以讓我們輕鬆地在這兩個域之間來回移動,稱為傅立葉變換。您不需要理解它的數學細節,只需知道時域和頻域表示之間存在一對一的對映——傅立葉變換是可逆的。

如果聲音訊號在時間間隔之後完全重複,則它被稱為週期性,時間間隔被稱為週期。在時域中是週期性的波形的另一個重要特徵是其頻域表示是離散的——它集中在某些特定頻率上:基頻(它指定了每單位時間得到的完整波形重複次數),以及此頻率的整數倍:,等等。這些頻率被稱為泛音,而基頻(也稱為第一泛音)告訴我們音符的音高,較高的泛音則為聲音添加了“顏色”或音色,這使我們能夠區分小提琴演奏的音符與單簧管演奏的相同音符。
如果波形週期的持續時間以秒為單位測量,則頻率的單位為 1/秒,測量“每秒週期”或赫茲(縮寫為“Hz”)。
圖示中,上面的圖表顯示了頻率為 1 Hz 的鋸齒波的 3 個週期(太低,人耳聽不見,但便於理解數字),下面的圖表顯示了傅立葉變換後前幾個頻率成分的振幅。在這種情況下,最強的成分是基頻 (同時要注意 0 Hz 處的零成分),高次諧波逐漸減弱,但永遠不會完全消失。其他週期波形可能具有完全不同的諧波分佈。
人耳能聽到的頻率範圍通常被認為在 20 Hz 到 20,000 Hz 之間(也可以寫成 20 kHz)。在音樂中,我們有音符的音高概念,音高隨著頻率的增加而增加,但不是成比例的。相反,音符的音高與頻率的 對數 成正比。具體來說,如果一個音符的音高比另一個音符高一個八度,那麼前者的頻率正好是後者的兩倍。因此,人耳的聽覺範圍略小於 個八度。
考慮目前西方音樂中最常見的音調,稱為 標準音高。在這個音調中,中央 C 以上的 A(最接近它)被分配為 440 Hz 的頻率。因此,低一個八度的 A 是 220 Hz,高一個八度的 A 是 880 Hz,依此類推。其他音符的頻率取決於您使用的 音律:如果您使用 平均律(常見情況),那麼每個半音的音程對應於 的頻率比。因此,例如,參考 A 低一個半音的 A♭(或 G♯)的音高是 Hz,而參考 A 高一個半音的 A♯(或 B♭)的音高是 Hz。而中央 C 的音高比參考 A 低 9 個半音,因此它的頻率是 Hz。
聲學 是聲音科學。它研究了我們演奏和聆聽聲音的 空間(室內或室外)。為什麼某些音樂廳的聲音比其他音樂廳更好?我們甚至如何判斷一種聲音是在一個大廳裡錄製還是在一個小房間裡錄製?
例如,考慮這個用 ZynAddSubFX 生成的簡單管風琴片段
聽起來並不令人興奮。
現在讓我們在聲音中應用“回聲”效果
這增加了一些趣味(讓人想起聲音從長房間或大峽谷的另一端反彈回來),但聽起來還是有點不自然。
現在比較一下這個版本
效果非常微妙,但聲音對你來說是否顯得更“鮮活”?就像是在一個真實的房間裡演奏一樣?這是因為一種叫做 混響(通常縮寫為混響)的效果。它是來自房間不同位置的許多微弱重疊回聲的混合體,一些回聲更靠近聲源,一些回聲更遠,一些回聲主要反射低頻,一些回聲反射高頻。這以一種新增趣味和真實感的方式將聲音分散在時間上,因為它代表了我們通常在現實世界中聽到聲音的方式。
這是一個應用於更大房間的混響效果
最後,這裡是在一個 非常 大的房間(即大教堂)中聽起來的效果
在任何音樂錄製中,通常都需要一些混響,只要您不要過度使用它。
一個 模擬 訊號是任何物理量。例如,麥克風可以拾取聲壓變化,並將其轉換為電電壓變化。在過去模擬音訊處理的年代,這種電壓可能會(經過適當的處理、混音等)轉換為相應的變化磁場,記錄在磁帶上,或轉換為黑膠唱片上的擺動凹槽。然後在播放過程中,磁場或凹槽擺動會轉換為變化的電壓,最終控制功率放大器驅動揚聲器,以重新建立(接近)原始聲壓變化。
換句話說,在模擬處理中,一個變化的物理量被轉換為另一個變化的物理量。名義上,這些量是 連續的,並且可以在特定範圍內取任何值。但在實踐中,模擬裝置存在各種各樣的不準確性,這會導致處理過程中的每個階段都會出現保真度的損失。
在 數字 處理中,物理量在規則的時間間隔( 取樣率)處被測量,並使用 模數轉換器 轉換為數字流。此數字只能測量到一定的精度。但一旦測量完畢,它就可以被精確地記錄和複製。然後播放裝置只需要將這些數字透過一個 數模轉換器 將其轉換回物理量,以產生我們實際可以聽到的聲音。因此,模擬損失僅限於轉換過程的兩端,並從中間階段移除。
此類數字的計算機處理會導致 舍入誤差,但在實踐中,這會導致的損失比相應的模擬處理少,並且它使新的操作型別成為可能,而這些操作型別在模擬裝置上是不可行的。

取樣將(名義上的)連續模擬量轉換為 離散的 數字表示。此表示在時間上具有有限的精度,受取樣率的限制,並且每個樣本都具有有限的測量精度,由 樣本大小 表示,以 位元 為單位測量。但是,憑藉當今的技術,這些引數可以達到足夠高,以忠實地表示人耳能聽到的任何聲音。
許多音樂家和音訊工程師都喜歡模擬處理的“不完美”。他們談論模擬失真給音訊帶來的“溫暖”或“特色”,並描述數字音訊通常是“冷淡”和“無情”的。
這種觀點沒有錯。關鍵在於,**數字音訊給你一個選擇**:你仍然可以在處理鏈中引入模擬失真,但只有**在你想要的地方和時間引入**——你不會被迫在處理的每一個階段都將模擬“特色”印在你的創作上。
