跳轉到內容

感覺系統/視覺系統/影像處理

來自華夏公益教科書

影像處理

[編輯 | 編輯原始碼]

一個主要的理解技術工具是計算機處理影像的方式。我們必須瞭解如何編輯影像以及有哪些技術可以重新排列影像。

影像表示

[編輯 | 編輯原始碼]

對於計算機來說,影像只不過是大量的小方塊。這些方塊被稱為“畫素”。在灰度影像中,每個畫素都包含一個數字 n,通常是 。這個數字 n 代表了影像中該方塊的確切顏色。這意味著,在一個灰度影像中,我們可以使用 256 種不同的灰度,其中 255 代表白色斑點,而 0 代表方塊是黑色的。說實話,我們甚至可以使用超過 256 種不同的灰度級別。用這種方法,每個畫素使用正好 1 位元組(或 8 位)的記憶體來儲存。(由於計算機的二進位制系統,它包含:28=256)如果你認為你的影像需要更多不同的灰度級別,這不是問題。你只需要使用更多記憶體來儲存圖片即可。但請記住,對於大型影像來說,這可能是一項艱鉅的任務。此外,你經常會遇到這樣的問題:你的感測裝置(例如你的顯示器)可能無法顯示超過 256 種不同的灰色。

表示彩色影像比灰度影像只稍微複雜一點。你需要知道的只是計算機使用三種主要顏色紅色、綠色藍色的加色混合。這些是所謂的 RGB 顏色。

這些影像也是由畫素儲存的。但是現在每個畫素必須知道 3 個介於 0 到 256 之間的值,每種顏色 1 個值。因此,現在我們可以表示 2563= 16,777,216 種不同的顏色。類似於灰度影像,這裡也成立,沒有顏色意味著黑色,所有顏色都意味著白色。這意味著,顏色 (0,0,0) 是黑色,而 (0,0,255) 意味著藍色,(255,255,255) 是白色。

影像濾波

[編輯 | 編輯原始碼]

一維濾波器

[編輯 | 編輯原始碼]

在許多技術應用中,我們發現了一些可以輕鬆描述特徵的原始基礎。在一維情況下,濾波器並不複雜,因此我們可以使用這些濾波器來更改影像。所謂的“Savitzky- Golay 濾波器”允許平滑傳入的訊號。該濾波器由 Abraham Savitzky 和 Marcel J. E. Golay 於 1964 年提出。它是一種脈衝響應濾波器(IR)。

為了更好地理解,讓我們看一個例子。在 1d 中,我們通常處理向量。一個這樣的給定向量,我們稱之為 x,它包含:。我們的目的是平滑這個向量 x。為此,我們只需要另一個向量 ,我們稱這個向量為權重向量。

有了 ,我們現在得到了一個平滑的向量 y。這個向量比之前的向量更平滑,因為我們只儲存了向量中幾個元素的平均值。這意味著新找到的向量元素取決於要平滑的元素左右兩邊的幾個元素。這種方法的一個主要缺點是,新找到的向量 y 只有 n-m 個元素,而不是像原始向量 x 那樣有 n 個元素。

繪製這個新的向量會產生與之前相同的函式,只是振幅更小。因此沒有丟失資料,但波動更小。

二維濾波器

[編輯 | 編輯原始碼]

從一維情況到二維情況的轉換,只需將向量變成矩陣。正如前面提到的,灰度影像對於計算機或像MATLAB這樣的軟體工具來說,僅僅是一個充滿自然數的大矩陣,通常介於0到255之間。

權重向量現在變成了權重矩陣。但是我們仍然透過將不同的矩陣元素乘積加起來來使用濾波器。

膨脹和腐蝕

[編輯 | 編輯原始碼]

對於之前看到的線性濾波器,它們是交換的。引用維基百科:“如果

"

換句話說,使用多少個線性濾波器以及它們的順序並不重要。例如,如果將Savitzky-Golay濾波器應用於一些資料,然後應用第二個Savitzky-Golay濾波器計算一階導數,則無論濾波器的順序如何,結果都是相同的。甚至可以證明,有一個單一濾波器可以實現與兩個應用濾波器相同的效果。

相反,形態學操作是影像上的非線性操作,最終結果取決於操作的順序。如果我們考慮任何影像,它都是由畫素值xij定義的。此外,假設影像為黑白影像,因此我們有

為了定義形態學操作,我們需要設定一個結構元素SE。例如,一個3x3矩陣作為影像的一部分。

腐蝕E的定義如下

.

也就是說,如果任何結構元素M中的畫素值為0,腐蝕操作會將M(M中的特定畫素)的值設定為零。否則E(M)=1

對於膨脹D,如果SE中任何值為1,則M的膨脹D(M)被設定為1。

.


膨脹和腐蝕的組合:影像的開運算和閉運算

[編輯 | 編輯原始碼]

膨脹和腐蝕有兩種組合。一種稱為開運算,另一種稱為閉運算。它們分別為

華夏公益教科書