人工智慧/AI智慧體及其環境
特定的**人工智慧程式**或**AI**可以被認為是與特定環境互動的智慧“**智慧體**”。一般來說,所有型別的智慧體(包括老鼠、人以及AI程式)都透過兩種主要方式與其環境互動:**感知**和**行動**。
為了人工智慧的目的,**感知**是指將環境中的東西轉化為內部表徵(記憶、信念等)的過程。**行動**則是智慧體透過做某事來改變環境。
例如,如果一個機器人使用它的攝像頭來判斷前面有一堵牆,那麼它就在使用感知。在這個例子中,攝像頭是一個“**感測器**”。一般來說,感測器是智慧體用來從環境中獲取資訊進行感知的工具。人類的感測器包括眼睛、耳朵和鼻子。AI可以擁有各種型別的感測器,包括類似於人類感知的感測器,也包括人類沒有的感測器,例如聲納、紅外線、GPS訊號等。
如果那個機器人使用它的身體推倒牆,那麼它就是在進行行動。在這種情況下,身體是一個“**執行器**”。如果機器人使用輪子後退,這也是行動的例子。由於機器人現在位於不同的位置,環境發生了變化。典型的機器人執行器包括手臂、輪子、燈光或揚聲器。
那麼沒有身體的AI呢?舉個例子,音樂推薦系統。在這種情況下,智慧體的環境可能是使用者點選和輸入的網頁,或者可能是使用者偏好資料庫。在這種情況下,感測器是智慧體程式中的抽象函式,而不是硬體,就像機器人上的感測器一樣。檢測使用者點選的函式,或者從資料庫中獲取資訊的函式,可以被認為是該智慧體的感測器。執行器是什麼?當智慧體向用戶顯示推薦的音樂時,它正在使用執行器在螢幕上顯示內容 - 或者提供網頁。另一個例子是音樂推薦系統使用的資料庫 - 它應該被認為是智慧體互動的環境的一部分,還是智慧體記憶的一部分?正如您從這個例子中看到的那樣,什麼被認為是執行器,什麼被認為是環境的一部分,取決於您認為智慧體的邊界在哪裡。並不總是存在正確或錯誤的邊界。它取決於討論的背景。
環境分類系統
儘管在某些情況下很難準確地知道環境在哪裡結束,智慧體在哪裡開始,但能夠對AI環境進行分類仍然很有用,因為它可以預測AI任務的難度。Russell和Norvig(2009)引入了七種對AI環境進行分類的方法,可以用助記符“D-SOAKED”來記住它們。
- **確定性**(確定性或隨機性或非確定性):如果已知先前狀態和智慧體的行動,那麼如果下一個狀態是完全可預測的,則環境是確定性的。
- **靜態性**(靜態或動態):靜態環境在智慧體思考時不會發生變化。
- **可觀察性**(完全可觀察或部分可觀察):完全可觀察的環境是指智慧體可以訪問其任務相關的所有環境資訊的環境。
- **代理性**(單代理或多代理):如果環境中至少存在另一個智慧體,那麼它就是一個多代理環境。其他智慧體可能漠不關心、合作或競爭。
- **知識**(已知或未知):如果智慧體瞭解支配環境行為的規律,則認為環境是“已知的”。例如,在國際象棋中,智慧體將知道棋子被“吃掉”時就會從遊戲中移除。在街上,智慧體可能知道下雨時,街道會變得溼滑。
- **情節性**(情節性或順序性):順序環境需要記住過去的行動來確定下一個最佳行動。情節性環境是一系列一次性行動,只有當前(或最近的)感知是相關的。一個檢視放射影像以確定是否存在疾病的AI就是一個情節性環境的例子。一張影像與下一張影像無關。
- **離散性**(離散或連續):離散環境具有固定的位置或時間間隔。連續環境可以以任何精度進行定量測量。
在每種情況下,AI(以及為AI程式設計的程式設計師)的工作更容易,如果兩個選項中的第一個是每個類別的最佳描述符。也就是說,如果AI在一個隨機、動態、部分可觀察、多代理、未知、順序和連續的環境中工作,那麼它的工作要困難得多。
AI智慧體的高階描述
AI是以各種方式製作的。在討論新的AI時,也許是在學術論文中,也許是在商務會議中,有一些問題可以問幾乎任何AI。這些問題可以用助記符PEAS來記住。
- **效能指標**:AI如何知道它正在做它應該做的事情?
- **環境**:智慧體與什麼環境互動?
- **執行器**:AI如何影響其環境?
- **感測器**:AI如何從其環境中獲取資訊?
重要詞彙
- 感知
- 行動
- 感測器
- 執行器
- 環境
- 效能指標
- 確定性
- 隨機性
- 完全可觀察
- 部分可觀察
- 動態環境
- 靜態環境
- 多代理環境
- 已知和未知環境
- 情節性環境
- 順序性環境
- 離散與連續環境
討論問題
- 使用上面描述的分類方案(PEAS、D-SOAKED),描述以下AI智慧體:自動駕駛汽車、機場的人臉識別系統、貨運公司的排程系統、R2D2。
參考文獻
Russell, S. & Norvig, S. (2009). 人工智慧:一種現代方法. 第三版. Prentice Hall.