跳轉到內容

機器人/元件/影片

來自華夏公益教科書,開放世界開放書籍

影片元件分為兩類。一方面,您有一個攝像機,某種形式的傳輸(有線或無線)和一個顯示器。另一方面,您有計算機視覺。

攝像頭、傳輸、顯示

[編輯 | 編輯原始碼]

有非常小的攝像頭,有些甚至內建無線連線,它們價格便宜,幾乎不需要任何外部元件。這些攝像頭可以安裝在機器人上,讓使用者透過機器人的“眼睛”觀察。

如果機器人有一個機載計算機(單板計算機或筆記型電腦),則可以使用網路攝像頭。這允許機器人透過網路甚至網際網路進行控制。

計算機視覺

[編輯 | 編輯原始碼]

計算機視覺是一個相對較新的領域。它試圖為計算機提供眼睛,並使其能夠“理解”它所看到的東西。第一步很容易。網路攝像頭已經存在相當長的時間。然而,第二步,理解影像,才是困難的。

影像處理在機器人學中發揮著重要作用,計算機視覺被應用於機器人學。影像處理包含許多方面,包括:馬賽克去除、影像配準、差分、識別和分割。

馬賽克去除

[編輯 | 編輯原始碼]

馬賽克去除可能是影像處理中的第一步,因為它與計算機視覺有關,因為這個過程發生在影像最初捕獲之後。通常,馬賽克去除是一種演算法,它在影像被彩色濾波陣列(CFA)處理後(例如拜耳濾波器)獲取影像,並重建一個全綵色影像。左側顯示的影像是 CFA 的輸出,右側顯示的影像是使用馬賽克去除演算法重建的影像。結果是整體細節和銳度下降,導致解析度下降。

影像配準

[編輯 | 編輯原始碼]

影像配準是將多個影像組合到單個座標系中的過程。將影像組合到單個座標系中,可以更輕鬆地處理在不同時間或從不同角度拍攝的影像中包含的資料。根據將影像組合到單個座標系中的方式,影像配準主要有兩種型別。第一種是基於強度的,它使用相關性度量來比較影像中的強度模式以將它們組合在一起。另一種方法是基於特徵的,它使用影像中的點、線和輪廓來組合影像。影像配準也已用於數碼攝影領域,其中使用了照片拼接過程。

影像差分

[編輯 | 編輯原始碼]

影像差分用於獲取兩幅影像之間的變化,透過逐畫素比較影像來實現。影像差分的典型應用是在交通攝像頭中,需要確定影像中汽車的位置。透過拍攝一張影像並找到它與前一幀之間的差異,結果是一張類似於顯示影像的影像,其中車輛的輪廓清晰地顯示出來。這種方法的問題是,在汽車所在位置的影像之間存在間隙。為了解決這個問題,將當前影像與在沒有汽車的情況下拍攝的庫存影像之間的差異取值,可以得到一個更清晰的影像,描繪出汽車的位置。

影像識別

[編輯 | 編輯原始碼]

在計算機視覺領域,影像識別過程很難實現。沒有什麼能夠接近人類能夠完成的,但機器人可以完成更簡單的任務。在計算機視覺中可以完成的一些更簡單的任務包括識別簡單的幾何形狀、人臉和指紋。與影像識別相關的問題的不同方面包括:物件識別、識別和檢測。影像識別的實現被稱為幾何雜湊。幾何雜湊演算法使用特定物件的模型影像(例如計算機滑鼠)來檢視它是否位於給定影像中。

影像分割

[編輯 | 編輯原始碼]

影像分割過程用於簡化影像處理的其他方面。這包括將影像分解成更小的片段,從而使物件檢測和邊緣檢測更容易。可以使用 K 均值演算法將影像分割成 K 個簇。基本演算法如下所示。

// 基本 K 均值演算法

1. 選擇 K 個簇中心,可以是隨機的,也可以基於某種啟發式方法

2. 將影像中的每個畫素分配給最小化畫素與簇中心之間方差的簇

3. 透過對簇中的所有畫素求平均值來重新計算簇中心

4. 重複步驟 2 和 3,直到達到收斂(例如,沒有畫素改變簇)

華夏公益教科書