跳轉到內容

跨學科問題 2020-21/智力測試中的證據

來自華夏公益教科書

智力定義和測試的方式對現代社會中個人生計具有重大影響,因此該主題一直是爭議的源泉[1][2][3]

智力是一個從可變方面形成的抽象概念,不同的學科對衡量智力的證據有不同的看法。有些人甚至認為應該停止智力測試。然而,它可以成為研究心理發展和評估認知能力的寶貴理論和實踐工具[4]。透過整合解決跨學科衝突可以發展出更全面的智力測試方法,這些方法可以用來造福個人和社會[5][6]。測試需要在機器、動物、人類之間通用,因此學科之間需要通用,並且結果要與人類標準化。[7] 對智力證據達成共同理解意味著我們將確信機器何時達到了智力水平。

這本華夏公益教科書將探討心理學、計算機科學和人類學/社會學視角中智力測試中的證據,目的是突出衝突。

心理學中的智力測試證據

[編輯 | 編輯原始碼]
平均值為 100,標準差為 15 的正常智商分佈

心理測量學 中,智力的最常用衡量標準是智商 (IQ)。有多種現代智商測試,英語世界中最常見的是韋氏智力量表,針對成人和兒童有不同的版本。大衛·韋克斯勒認為智力是由相互關聯的認知能力元素組成的,這些元素可以被隔離和測量。[8] 該測試的當前版本 WAIS-IV 由以下指標組成:言語理解、知覺推理、工作記憶和處理速度。[9]

智商分數是根據 標準差 計算得出的,將個人表現與平均值進行比較。這些分數是 正態分佈 的,其中平均分數最常見(平均值為 100,標準差為 15 個智商點)。[10] 因此,智商分數是智力的估計值,而不是直接測量值。智商測試已被證明具有很高的 統計可靠性,置信區間約為 10 個點,標準誤 為 3 個點。[11] 儘管由於動機和焦慮等外部因素,個人在智商測試中的表現可能會有所不同,這讓人對有效性產生懷疑,但智商分數與工作和學校的表現相關。[12][13] 一些心理學家認為,這足以證明智商測試在教育和工作中的實際應用是可行的。[14]

其他心理學家對智商測試持批評態度,韋恩·韋滕指出“智商測試是對在學術工作中取得好成績所需的智力的有效衡量標準。但如果目的是評估更廣泛意義上的智力,智商測試的有效性就值得懷疑。”智商測試可以衡量智力形式,但無法衡量更廣泛的方面,包括創造力和情商。[15] 為了應對這些批評,出現了衡量能力的其他測試。例如,梅耶-薩洛維-卡魯索情商測試。[16]

人類學和社會學視角

[編輯 | 編輯原始碼]

人類學和社會學理解側重於個人與其更廣泛的文化和社會之間的互動。由於智力是一個有爭議的概念,其定義在文化之間和文化內部都有所不同[17][18],因此人類學中的人認為,衡量智力的測試必須是民族中心的——即,來自被測試者的文化內部[19]。由於文化之間存在質的差異,有些人認為跨文化進行的量化比較將毫無幫助 [20]。從人類學角度來看,斯特恩伯格和考夫曼認為,文化“將它們認為適應那些文化生活要求的認知、社會和行為屬性指定為“智力”[21]。同樣,一些社會學家認為,智力是一種社會建構,其證據是特定社會歷史背景的產物,該背景關注與社會分層和不平等相關的議題[22]

關於衡量智力,持人類學和社會學觀點的人強調了智力的可塑性[23],以及影響特定測試方法中表現的其他外部因素。貝里和歐文強調需要認識到影響智力表現的不同層面的背景,包括生態背景和實驗背景[24]。他們的研究表明,認知風格是如何根據環境需求發展起來的[25]。然後,要求實驗背景(測試智力的背景)與個人的學習和日常背景相一致。一個例子來自巴西街頭兒童,他們雖然依賴於自己的數學技能經營自己的生意以求生存,但在學校測試時,在解決相同數學問題時表現不佳,因為所呈現的抽象問題脫離了他們的現實世界背景[26]。因此,傳統的智商和心理測量測試被認為存在問題,因為它們以智力與認知表現的非情境性假設為基礎,尤其是在用於比較來自不同文化和經濟背景的個人時。

計算機科學中的智力測試證據

[編輯 | 編輯原始碼]

語言作為證據

模仿遊戲源於笛卡爾關於語言在新的和具有挑戰性的情況下表現出的多功能性是智力首要測試的觀點。[27] 一個詢問者,與一臺機器和一個人類隔離開來,提出問題。透過回答,機器試圖欺騙詢問者,讓它認為自己是人類,而人類則試圖幫助詢問者猜出答案。如果機器成功了,它就根據圖靈的理論提供了它有智力的證據。[28] 機器必須模仿人類,假裝自己無法進行復雜的運算,並偽造看起來很自然的拼寫錯誤。這裡智力的證據是適應能力,而不是處理複雜性的智力因素觀點。

HAL 專案將對話能力衡量為智力的證據,併為機器分配了人類成熟度的估計值。機器的語言會被檢查以尋找證據,包括詞彙量、反應型別和 平均語長[29]

控制論

以目標為中心的系統(包括動物和機械系統),系統與環境之間的交流或對話是活動的先決條件。[30] 系統在與不斷變化的環境互動時所做出的反應/活動被視為智力的證據。[31] 智力的證據集中在活動和有目的的行為上,而不是推理。

通用智力測試

一臺機器透過與環境互動獲得獎勵,它必須學習環境結構以及哪些行為會獲得獎勵,以便最大限度地獲得獎勵。對於應用奧卡姆剃刀法則,會給予額外的獎勵,這是一種直觀但智慧的方法。[32]

智商

當一臺機器完成傳統的智商測試時,它很少被認為是智力的證據,這可能從 1963 年開始,當時一個人工智慧程式通過了 WAIS 中的幾何類比任務。

通常,結果與人類相當,但就像在數字完成的情況下一樣,機器解決問題的方式可能不同,這意味著結果具有不同的誤差分佈。

與此相關的是心理測量 AI,即構建能夠解決一系列問題(使用單一測試來評估機器毫無用處,因為它可以專門設計來解決它)的機器的領域。[33]

結論

[edit | edit source]

關於在智力測試中什麼被認為是證據,仍然存在很多爭議。在機器中,測試的重點是尋找即時靈活性和適應性、創造力的證據;特別是在語言和對話方面。就像人類學和社會學方法一樣,計算機科學往往側重於與外部環境的互動。這與智商測試的普遍、靜態方法背道而馳,智商測試側重於衡量孤立的智力內在特徵的證據,往往忽略了情境。這些學科之間的互動,以及尚未開發的學科,可以幫助我們擺脫這種狹隘的智力理解,走向更實用的理解。

參考文獻

[edit | edit source]
  1. Phelps R. 測量智力:事實和謬誤。JDBP。2006;27(4): 356
  2. Beeghley L, Butler EW. 智力測試在公立學校中的影響:種族隔離前後的情況。SP。1974;21(5): 740-754。
  3. Bartholemew D. 測量智力:事實和謬誤。美國:劍橋大學出版社;2004。
  4. 第二章:智力測試的應用。RER。1932;5(3):199。
  5. Benson ES. 智慧的智力測試。MoP。2003;34(2): 48。
  6. Sternberg RJ, Grigorenko EL. 智力和文化:文化如何塑造智力的含義,以及對幸福科學的意義。PT: BS。2004;359(1449)。
  7. Hernandez-Orallo J, Martinez-Plumed F, Schmid U, Siebers M, Dowe DL. 計算機模型解決智力測試問題:進展和意義。AI。2016;230: 74-107。
  8. Kaplan RM, Saccuzzo DP. 心理測試:原理、應用和問題。第 8 版。美國加利福尼亞州貝爾蒙特:沃茲沃斯,Cengage 學習;2010。
  9. Pearson Clinical. 韋氏成人智力量表® - 第四版英國版 [網際網路]。2020 年。[訪問日期:2020 年 12 月 2 日];可從以下網站獲取:https://www.pearsonclinical.co.uk/Sitedownloads/Productpdfs/wais-4ukclinical8ppfinalweb.pdf
  10. Gottfredson LS. 第 1 章:用於駁斥關於智力測試的證據的邏輯謬誤。在:Phelps RF,編輯。糾正關於教育和心理測試的謬誤。華盛頓特區:美國心理學會;2009 年。
  11. Pearson Clinical. WISC-V Laurie Jones(2015 年 6 月 1 日)的解釋性考慮 [網際網路]。2020 年。[訪問日期:2020 年 12 月 2 日];可從以下網站獲取:https://images.pearsonclinical.com/images/assets/wisc-v/WISC-VInterpretiveReportSample-1.pdf
  12. Carlton SG, Gutierrez L. 心理變數和韋氏成人智力量表-IV 的表現。AN:成人。2017;24(4): 357-363。
  13. Weiten W. 心理學:主題和變異。第 10 版。美國加利福尼亞州貝爾蒙特:沃茲沃斯 Cengage 學習;2016。
  14. Kaufman AS. 智商測試 101。紐約:施普林格出版公司;2009 年。
  15. Weiten W. 心理學:主題和變異。第 10 版。美國加利福尼亞州貝爾蒙特:沃茲沃斯 Cengage 學習;2016。
  16. Mayer, JD, Salovey P, Caruso DR, Sitarenios G. 使用 MSCEIT V2.0 測量情商。E. 2003;3: 97-105。
  17. Sternberg RJ. 文化與智力。AP。2004;59(5): 325–338。
  18. Sternberg RJ, Grigorenko EL. 智力和文化:文化如何塑造智力的含義,以及對幸福科學的意義。PT: BS。2004;359(1449)。
  19. Sternberg RJ. 心理的隱喻:關於智力本質的觀念。劍橋:劍橋大學出版社;1990 年。
  20. Sternberg RJ. 心理的隱喻:關於智力本質的觀念。劍橋:劍橋大學出版社;1990 年。
  21. Sternberg RJ, Kaufman JC. 人類能力。ARP。1998;49: 497。
  22. Squibb PG. 智力的概念 - 從社會學視角。TSR。1973;21(1): 57-75。
  23. Sternberg RJ, Kaufman JC. 人類能力。ARP。1998;49: 497。
  24. Sternberg RJ. 心理的隱喻:關於智力本質的觀念。劍橋:劍橋大學出版社;1990 年。
  25. Berry JW, Irvine SH. 文化背景中的人類能力。劍橋大學出版社;1988 年。
  26. Ceci SJ, Hembrooke HA. 智力發展的生物生態模型。APA。1995:303-345
  27. 笛卡爾 R. 正確地指導理性並尋求科學真理的方法論。萊頓:勒內·笛卡爾;1637 年。
  28. 圖靈,A.,1950 年,“計算機器與智力”,《心智》,59(236):433–60。
  29. Legg S, Hutter M. 機器智慧測試。人工智慧 50 年:獻給人工智慧 50 週年的論文集。柏林,海德堡:施普林格出版社柏林海德堡;2007 年。第 232-242 頁。
  30. Pangaro P. 控制論 - 定義 [網際網路]。2013 年。[訪問日期:2020 年 12 月 3 日];可從以下網站獲取:https://pangaro.com/definition-cybernetics.html
  31. 與開放大學合作研究:OpenLearn。機器、思維和計算機:3.2 控制論和符號 AI [網際網路]。2017 年 12 月 6 日。[訪問日期:2020 年 12 月 3 日];可從以下網站獲取:https://www.open.edu/openlearn/science-maths-technology/computing-and-ict/computing/machines-minds-and-computers/content-section-3.2
  32. Legg S, Hutter M. 機器智慧測試。人工智慧 50 年:獻給人工智慧 50 週年的論文集。柏林,海德堡:施普林格出版社柏林海德堡;2007 年。第 232-242 頁。
  33. Hernandez-Orallo J, Martinez-Plumed F, Schmid U, Siebers M, Dowe DL. 計算機模型解決智力測試問題:進展和意義。AI。2016;230: 74-107。
華夏公益教科書