跳轉到內容

認知科學:導論/創造力、計劃和想象力

來自 Wikibooks,開放世界中的開放書籍

個人創造力

[編輯 | 編輯原始碼]

文化演化的創造力

[編輯 | 編輯原始碼]

文化隨著時間的推移而演變。這種演變獨立於人類隨著時間推移同時發生的基因演變。這種文化演變導致了對問題的令人驚訝的創造性解決方案。

正如我們在上一節中看到的,個人能夠完成令人印象深刻的創造性行為。但事實證明,如果這些創新沒有與社會群體分享,隨著時間的推移,創新就會停滯不前。更多的人能發現更多錯誤,以更多的方式重新組合事物,甚至從幸運的事故中獲益。如果由於戰爭或其他災難導致一代到下一代的學習中斷,文化往往會失去它可能享受幾個世紀的創新,例如如何製造皮划艇。 [1]

但獨立於其中的個人談論一種文化具有創造力有什麼意義呢?許多對生存至關重要的文化習俗涉及複雜的行為模式(例如,參見關於人類如何變得如此聰明部分中的關於如何準備木薯的部分),而文化中的人們通常不知道每個步驟的作用。沒有人想出這種行為模式,甚至沒有人理解它。因此,當我們有一個像食物準備這樣複雜而有效的創新時,我們把功勞歸於什麼創造過程呢?隨著時間的推移,文化本身發展了這種創新。這就是為什麼我們可以將文化視為一個可以具有創造力的實體。

基因演化的創造力

[編輯 | 編輯原始碼]

正如文化演變可以產生創造性的結果一樣,物種面臨的問題的解決方案可以透過演變中產生的解決方案來解決,而這些解決方案在許多人眼中是創造性的。反廕庇就是一個例子。

創造力和人工智慧

[編輯 | 編輯原始碼]

回溯足夠遠,人工智慧的歷史就等同於計算機的歷史。當艾倫·圖靈發明了 Bombe(一種能夠破譯二戰期間德國軍隊使用的 Enigma 密碼的機器)時,關於計算機展示智慧行為的潛力的疑問就出現了。他的流行的“圖靈測試”至今仍被用作衡量人工智慧程式智慧的基準。 [2].

第一個 AI 計算機程式被普遍認為是 ELIZA,該程式是在 1964 年至 1966 年之間在麻省理工學院開發的。該程式是一種自然語言處理工具,能夠模擬與人類的對話。 [2].

然而,在千年結束之前,人們很少採取步驟在人工智慧程式中開發機器學習,而機器學習是衡量當代人工智慧中任何型別創造能力的基礎。

什麼是創造力?

[編輯 | 編輯原始碼]

《劍橋詞典》將“創造力”定義為“產生新穎和非凡想法的能力,或創造新事物或想象事物的能力”[3]。Boden 聲稱創造力通常是人類智慧的決定性品質[4]。Avdeeff 將創造力的標誌描述為個人風格的發展及其操控[5]

創造力的神經科學

[編輯 | 編輯原始碼]

根據 Dietrich 的說法,創造力代表著認知靈活性,並體現了打破模式同時保持理智的能力[6]。用於處理資訊以執行非創造性任務的神經迴路與執行創造性任務的神經迴路相同。前額葉皮層負責以新的方式組合資訊,並評估組合是否有意義,還是僅僅是新穎。洞察力是創造過程的第一步,大腦會付出有意識的努力將洞察力轉化為有用的想法。創造性思維基於兩種神經處理模式:刻意和自發。自發模式超出了理性,是人們普遍認為的創造性思維方式。一個例子就是化學家 Kekule 在夢中看到一條蛇呈環狀,從而發現了苯的結構。在這種模式下,洞察力是直接有用的,並適合任務。

有意識的工作記憶不會根據邏輯結構、信念和價值觀選擇資訊的組合,並忽略哪些“從”無意識處理模式中“溜出來”的產品。在刻意的處理模式中,創造性是嚴謹的有意識努力的結果。對資訊的組合給予關注,因此洞察力符合外部和內部結構、信念、價值觀和期望。常見的例子包括巴赫的交響曲、愛因斯坦的相對論和 DNA 的發現,所有這些都涉及將洞察力小心地轉化為有用的產品[6]

如 Dietrich 所述,隨機組合過程是一種發人深省的心理協議,它突出了人類創造性思維和人工創造性思維之間的區別。當思維不受諸如規範和邏輯結構之類的注意力限制的指導時,在意識中顯現的組合想法和思維序列鬆散地由任何連貫的結構連線在一起,並混亂地組合在一起。這些通常被有意識的工作記憶過程忽略,並在注意力不那麼活躍時“溜過”。這表明創造力在神經層面上包含高度不可預測性。這可能是真正的人工創造力難以實現的原因,也是為什麼創造力的引數難以量化和演算法化。

有四種基本的創造性洞察力型別[6]

1. 故意模式 - 認知結構

這些結構由前額葉皮層啟動,幾乎總是與任務相關。這個過程的特點是前額葉腦區和後葉腦區之間的結構化反應。

2. 故意模式 - 情感結構

這些結構由前額葉注意網路啟動,符合個人的價值觀和信念,但不一定特定於某個領域。在這個過程中,大多數時候,情感記憶是從情感結構而不是認知結構中提取的。

3. 自發模式 - 認知結構

這類洞察力源於聯想無意識思維。它們是由大腦後葉而不是前額葉皮層啟動的。洞察力在沒有意識努力的情況下出現在工作記憶中,並自行獲得注意力,或者作為對工作記憶中已有資訊的增強。

4. 自發模式 - 情感結構

在這個過程中,主要控制情感反應的生物結構會產生一個“響亮”的訊號,要求意識工作記憶的注意力。如果沒有這個訊號,就無法獲得洞察力。以這種方式產生的洞察力主要包括藝術表達,併產生深刻的情感影響。

讓人工智慧具有創造力

[編輯 | 編輯原始碼]

根據 Boden 的說法,人工智慧可以使用三種技術來創造新想法:產生熟悉想法的新組合;探索概念空間的潛力;以及以一種能夠生成以前不可能的想法的方式轉換資料。第一種技術與詩歌意象和類比形式密切相關,而計算機在這些方面正變得越來越靈活。第二種技術在人工智慧模型中被廣泛研究。這種技術首先需要定義概念空間的引數,即使對於某個領域的專業人士來說也很難。然後,必須將對概念空間的充分了解轉錄成可計算的知識庫或語義網路,才能對其進行探索。然而,現代研究越來越重視第三種技術。大多數人會用這種方式來定義跨職業和學科的創造力。Boden 還聲稱,例如,當創造力在爵士音樂家或科學家身上得到認可時,通常是對個人能夠轉換資料以開拓新穎且以前不可能的想法的能力的認可 [4]

關於人工智慧的主流觀點相信哲學家拉普拉斯關於智力的決定論論點的版本。拉普拉斯認為,一個真正智慧的個體將能夠推匯出宇宙的公式,該公式可以根據宇宙中每個粒子的軌跡預測其未來並記錄其過去。該個體將完美地瞭解宇宙各個方面的所有資訊,並且能夠從一開始就講述宇宙的“故事”,一直延續到無窮無盡 [7]

人工智慧計算創造力研究的一個重要部分是認識到人類創造領域中存在著系統模式,而這些模式在歷史上被認為是不可預測和無序的 [3]。這些系統模式成為人工智慧程式產生與計算機資料庫中存在的專案不完全相同的新穎性的基礎。

此外,在考慮組合創造力時,人工智慧還可以產生語義網路中專案之間的新聯絡。這是從 2000 年代後期開始的人工智慧創造力研究的特徵目標。在此之前,人工智慧創造力的創新是使用相同的預程式設計連線在資料庫中生成新專案,例如 ELIZA [2]

在人工智慧創造力研究取得成功的大多數情況下,人工智慧程式和人類程式設計師互相幫助,而不是其中一方單獨開發專案或製品。這種互補工作方式主要有兩種方式:人類程式設計師編輯和調整人工智慧軟體生成的成果,稱為內容創作;人工智慧軟體增強和提升人類生成的已完成製品,稱為內容增強。

對於一般的人工智慧來說,Ong & Gupta 概述了五個研究支柱:合理性、彈性、可重複性、現實性和責任性。總的來說,這些支柱旨在支援人工智慧研究在不同領域和應用中的發展。許多支柱旨在解決機器學習方法的透明性問題,並鼓勵在實施方法之前構建明確的目標和策略 [8]

近期創新

[編輯 | 編輯原始碼]

敘述和指令碼

[編輯 | 編輯原始碼]

“春日”(Sunspring)是一部電影,其劇本幾乎完全由一個名為 Benjamin 的人工智慧程式編寫。這部電影於 2016 年推出,是真人電影,其後期製作流程使用基於人工智慧的決策和監控進行執行。2016 年,IBM 的沃森平臺建立了首部由人工智慧製作的電影預告片。該預告片是為 20 世紀福克斯的恐怖電影《摩根》(Morgan)設計的,該專案由 IBM 研究院多媒體和視覺部門經理約翰·史密斯領導 [9]

在電子遊戲敘事中,創造性人工智慧的進展速度明顯快於大多數行業。AI Dungeon 是一款基於網路的遊戲,它即時生成故事情節並與玩家輸入進行互動。該演算法經過 10,000 多個標籤貢獻的訓練,以確保流暢的使用者互動。程式生成隨機化內容,為每個遊戲新增可變性和獨特性 [3]

視覺藝術

[編輯 | 編輯原始碼]

在視覺藝術的創造性人工智慧研究內容創作領域,已經進行了一些嘗試。

“下一幅倫勃朗”(The Next Rembrandt)是一幅 3D 列印的畫作,於 2016 年製作,由人工智慧軟體完全基於從著名荷蘭畫家倫勃朗的作品集中獲取資料,並使用深度學習演算法和麵部識別技術進行訓練。第一幅完全由人工智慧創作的畫作於 2018 年拍賣 [3]

現代人工智慧研究中的音樂創造力基於一個名為“長短期記憶” (Long Short-Term Memory) 的模型,該模型將轉錄的音樂想法作為輸入,並使用轉換創造力以有意義的方式對其進行操作。在過去十年中,已經出現了幾個重要的創新,這些創新證明了真正的由人工智慧生成的音樂的可行性和質量 [3]

Amper 是世界上第一個人工智慧音樂作曲家,它於 2014 年釋出了其測試版軟體。它具有更人性化的情緒和風格,包括最佳化,這些最佳化會施加微小的變化,而不是嚴格的“機器人式”地遵守時間。這種技術使它更接近於擁有“人的精神”。Amper 之類的軟體主要用於加速免版稅背景音樂的製作,對於播客和 YouTube 影片等內容創作很有用。為此目的,人工智慧創作的音樂不需要具有情感上的吸引力,甚至不需要具有音樂上的趣味性,它只需營造一種能夠增強某個內容的中心內容的氣氛 [5]。人工智慧創作並由人類內容創作者使用的音樂可以被視為人工智慧機器進行的一種內容創作,但其主要功能是內容增強。由於此功能影響了對創造性人工智慧的引數和期望,因此將其標記為內容增強而不是內容創作是合適的。

索尼 CSL 研究實驗室開發了一款類似的軟體,稱為 Flow Machines。這些被稱為“增強創造力”,它們本身無法生成有意義的曲目,但可以幫助人類創作者增強自己的音樂並獲得靈感 [5]。Flow Machines 與 Amper 的不同之處在於,它們在音樂製作和創新過程中發揮著積極作用。2018 年,Flow Machines 釋出了他們的第一張專輯“你好世界”(Hello World),在作曲方面得到了被稱為“SKYGGE”的貝努瓦·卡雷的幫助 [3]

音訊恐怖谷
[編輯 | 編輯原始碼]

隨著人工智慧生成的音樂越來越接近人類創作的音樂,它進入了軟體工程師所稱的“音訊恐怖谷”。這種音樂的特點是令人不安,聽起來“不對勁”,因為它不符合人類創作的標準音樂作品。大腦似乎拒絕將技術上類似的人工智慧生成的曲目視為真實的。Avdeeff 聲稱,造成這種情況的原因在於弗洛伊德的觀點,即人們如果觀察到某個事物背後存在一種更大的或不熟悉 的創造力量的痕跡,就會感到不安 [5]

人類可以立即判斷出音樂是否缺少人類的創作。在 SKYGGE 首張專輯《Hello World》於 2018 年舉辦的首場音樂會中,它的吸引力主要集中在製作的設計和機械特性上,而不是它可能具有的任何美學價值。人們對音樂本身的質量褒貶不一,一些人說它“根本不對勁”或“聽起來不對勁” [5]

影像和動畫

[edit | edit source]

人工智慧在增強或改變影像和影片方面的創造力大部分可以被認為是內容增強,因為系統並非在做出創造性決定,而只是根據大量輸入和特定的目標導向操作來執行協議。

三星 AI 會從現有肖像中提取影像,使它看起來像臉在說話。Adobe 已經建立了 Character Animator 軟體,該軟體透過從網路攝像頭和麥克風獲取輸入,可以即時實現唇形同步、眼睛追蹤和手勢控制。該軟體已被好萊塢和一些線上創作者採用。Facebook 的 Oculus Insight 使用“SLAM”(意指“同步定位與建圖”)即時生成地圖和使用者的定位追蹤 [3]

2018 年,彼得·傑克遜的電影《他們不會變老》使用了人工智慧軟體對 90 分鐘的第一次世界大戰檔案片段進行著色。該軟體以第一次世界大戰裝備和制服的輸入研究資料庫為參考,將片段轉換為逼真的彩色電影。其他架構,如 NesNet 和 DenseNet,在從灰度影像轉換為具有自然色彩的影像方面非常有效 [3]

虛構表現

[edit | edit source]

幾個世紀以來,人工智慧一直是虛構敘述的一部分。從瑪麗·雪萊的《科學怪人》開始,人工生產的有知覺或“智慧”自動機一直是科幻文化的一部分,並且最近開始出現在其他型別中。艾薩克·阿西莫夫的短篇故事《環舞》是科幻作品的奠基之作,它啟發了世界上一些領先的人工智慧研究人員,故事中兩位工程師根據機器人三大定律開發了一種智慧機器人。最近的例子是斯派克·瓊斯執導的 2013 年電影《她》。這部電影是一部浪漫喜劇,講述的是一種具有創造能力的超級智慧人工智慧軟體,主角愛上了它 [2]

流行小說中對人工智慧的大多數描述都描繪了具有創造力的 AI。摩根和科學怪人的怪物等角色表現出符合博登的一種或多種創造力型別的特徵。它們不僅僅是以複雜的方式進行觀察,還可以評估其觀察結果,以便根據認知邊界 的靈活性產生非平凡的行為。造成這種情況的原因可能是,創造性的 AI 比僅僅充當虛擬助手而沒有任何新穎 和生產力 的 AI 更具娛樂價值 [10]。來自漫威影業的《鋼鐵俠》和《復仇者聯盟》系列電影中的託尼·斯塔克的賈維斯展示了產生新資料組合的創造能力 ,例如在斯塔克的戰衣在飛行中出現故障時找到最佳著陸點,並提供適應變化引數的相關創造性資訊,例如剖析莫比烏斯帶模型來幫助斯塔克發明時間旅行。

未來展望

[edit | edit source]

挑戰

[edit | edit source]

目前,AI 在內容增強 方面最有效,因為人類的效率 很低,後期製作任務需要越來越多的勞動力。創意 AI 可以幫助增強 和恢復從獲取中獲得的資料,還可以接受訓練,從相對較低的輸入中擴充套件 資料。

最先進的機器學習技術旨在利用遞迴編碼 - 解碼 ,從而實現迭代式內容增強 ,但同樣的技術很少能夠轉化到創意 AI 研究的內容創作領域。

道德

[edit | edit source]

目前,AI 具有智慧 ,但不具備對更廣泛 背景的認識 。人工智慧尚未被程式設計 以平衡執行任務 所涉及的道德因素。深度偽造技術 質量越來越高,可以被用於惡意目的,AI 在視覺藝術和音樂中的應用 可能會讓藝術家和設計師 面臨剝削和欺詐 的風險。Anantrasirichai & Bull 認為,在開發創意 AI 技術 方面,未來的考慮因素 應包括將更廣泛 的背景含義的道德考慮因素 作為引數 [3]

Dignum 對將道德與 AI 聯絡起來的三個類別 進行了分類:設計中的道德 ,指的是將道德納入程式設計方法 的做法;設計中的道德 ,指的是評估 AI 系統在架構 中 的道德含義的方法;設計中的道德 ,指的是考慮並確保保護藝術家和開發人員權利 的協議 [11]

參考文獻

[edit | edit source]
  1. Henrich, J. (2017). The Secret of Our Success: How Culture is Driving Human Evolution, Domesticating our Species, and Making Us Smarter. Princeton, NJ: Princeton University Press. Page 212.
  2. a b c d Haenlein, M., & Kaplan, A. (2019). A brief history of artificial intelligence: On the past, present, and future of artificial intelligence. California management review, 61(4), 5-14.
  3. a b c d e f g h i Anantrasirichai, N., & Bull, D. (2021). Artificial intelligence in the creative industries: a review. Artificial Intelligence Review, 1-68.
  4. a b Boden, M. A. (1998). Creativity and artificial intelligence. Artificial intelligence, 103(1-2), 347-356.
  5. a b c d e Avdeeff, M. (2019, December). Artificial intelligence & popular music: SKYGGE, flow machines, and the audio uncanny valley. In Arts (Vol. 8, No. 4, p. 130). Multidisciplinary Digital Publishing Institute.
  6. a b c Dietrich, A. (2004). The cognitive neuroscience of creativity. Psychonomic bulletin & review, 11(6), 1011-1026.
  7. De Miranda, L. (2020). Artificial intelligence and philosophical creativity: From analytics to crealectics. Human Affairs, 30(4), 597-607.
  8. Ong, Y. S. 和 Gupta, A. (2019)。人工智慧研究的五個支柱。IEEE 計算智慧新興主題彙刊, 3(5), 411-415。
  9. IBM。 (2016 年 9 月 11 日)。人工智慧創造力的追求。IBM 認知 - 人工智慧的未來。檢索於 2022 年 2 月 4 日,來自 https://www.ibm.com/watson/advantage-reports/future-of-artificial-intelligence/ai-creativity.html
  10. Hermann, I. (2021)。科幻中的 AI:敘事與隱喻之間。AI & 社會, 1-11。
  11. Dignum, V. (2018)。人工智慧中的倫理學:特刊介紹。倫理學與資訊科技, 20(1), 1-3。
華夏公益教科書