跳轉到內容

跨學科問題 2020-21/智力測試中的證據

來自華夏公益教科書,開放的書籍,開放的世界

智力定義和測試的方式對現代社會中個人的生計有重大影響,因此這個主題一直是爭議的來源[1][2][3]

智力是一個從可變方面形成的抽象概念,不同的學科對衡量智力的證據持不同觀點。有些人甚至認為智力測試應該停止。然而,它可以成為研究心理發展和評估認知能力的有價值的理論和實踐工具[4]。透過整合解決跨學科衝突可以開發出更全面的智力測試方法,這些方法可以用來造福個人和社會[5][6]。測試需要在機器、動物、人類之間通用,因此需要跨學科進行,並且結果需要針對人類進行標準化。[7] 達成對智力證據的共同理解意味著我們將會確定機器何時達到智力水平。

本華夏公益教科書將探討心理學、計算機科學和人類學/社會學視角中智力測試的證據,目標是突出衝突。

心理學中的智力測試證據

[編輯 | 編輯原始碼]
平均值為 100、標準差為 15 的正常 IQ 分佈

心理測量學 中,智力的最常用衡量指標是智商 (IQ)。有多種現代智商測試,英語世界中最常見的是韋氏智力量表,針對成人和兒童有不同的版本。大衛·韋克斯勒認為智力是由可以孤立和測量的相互關聯的認知能力元素組成的。[8] 該測試的當前版本 WAIS-IV 由以下指標組成:言語理解、知覺推理、工作記憶和處理速度。[9]

智商分數是根據 標準差 計算的,將個人的表現與平均水平進行比較。這些分數是 正態分佈 的,其中平均分數是最常見的(平均值為 100,標準差為 15 個智商點)。[10] 因此,智商分數是對智力的估計,而不是直接衡量。智商測試已被證明具有很高的 統計可靠性,其 置信區間 約為 10 個點,其 標準誤差 為 3 個點。[11] 儘管由於外部因素(如動機和焦慮)導致個體智商測試表現可能有所不同,從而對有效性產生質疑,但智商分數與工作和學校的表現相關。[12][13] 一些心理學家認為這是智商測試在教育和工作中實際應用中可行的充分證據。[14]

其他心理學家對智商測試持批評態度,韋恩·韋頓指出:“智商測試是對在學術工作中取得良好成績所需的智力型別的有效衡量。但如果目的是評估更廣泛意義上的智力,智商測試的有效性就值得懷疑。” 智商測試可以衡量智力的形式,但更廣泛的方面,包括創造力和情商,卻沒有考慮到。[15] 針對這些批評,有一些替代測試可以用來衡量能力。例如,梅耶-薩洛維-卡魯索情商測試。[16]

人類學和社會學視角

[編輯 | 編輯原始碼]

人類學和社會學理解側重於個人與更廣泛文化和社會之間的互動。由於智力是一個有爭議的概念,其定義在不同文化之間和內部都存在差異[17][18],人類學中的人認為,測量智力的測試必須是內在的,即來自被測試者文化內部[19]。由於不同文化之間存在質的差異,有些人認為跨文化進行的量化比較將毫無幫助 [20]。從人類學角度來看,斯滕伯格和考夫曼認為,文化“將他們認為適應那些文化生活要求的認知、社會和行為屬性指定為“智力”[21]。同樣,一些社會學家認為智力是一種社會建構,其證據是特定社會歷史背景的產物,該背景關注社會分層和不平等周圍的問題[22]

關於測量智力,那些持人類學和社會學觀點的人強調了智力的可塑性[23],以及其他影響特定測試方法表現的外部因素。貝里和歐文強調需要認識到影響智力表現的不同層面的背景,包括生態背景和實驗背景[24]。他們的工作表明,認知風格是根據環境需求發展起來的[25]。因此,要求實驗背景(測試智力的背景)與個人自己的學習和日常背景保持一致。一個例子來自巴西街頭兒童,儘管他們依靠自己的數學技能來經營自己的生意以求生存,但在學校接受測試時,他們在解決相同的數學問題方面表現不佳,因為所呈現的抽象問題脫離了他們的現實世界背景[26]。因此,傳統的智商和心理測量測試被認為是有問題的,因為它們基於對智力和認知表現的非情境性的假設,尤其是在用於比較來自不同文化和經濟背景的個體時。

計算機科學中的智力測試證據

[編輯 | 編輯原始碼]

語言作為證據

模仿遊戲源於笛卡爾的思想,即語言在新的和具有挑戰性的情況下具有多功能性是智力的首要測試。[27] 審訊員與機器和人類隔開,提出問題。透過回答,機器試圖欺騙審訊員,讓它以為是人類,而人類試圖幫助審訊員猜測。如果機器成功了,它將根據圖靈的觀點提供證據表明它具有智力。[28] 機器必須模仿人類,假裝無法執行復雜的方程式,並偽造看起來很自然的拼寫錯誤。這裡的智力證據是適應性,而不是處理複雜性的 g 因素觀點。

HAL 專案將對話能力作為智力的證據進行衡量,併為機器分配一個人類成熟度的估計。透過檢視詞彙量、反應型別和 平均語長 來檢查機器的語音以尋找證據。[29]

控制論

以目標為導向的系統(動物和機械系統),系統與環境之間的溝通或對話是其活動的先決條件。[30] 系統在與不斷變化的環境互動過程中產生的反應/活動被視為智慧的證據。[31] 智慧的證據集中在活動和目標行為上,而不是推理上。

通用智慧測試

機器透過與環境互動獲得獎勵,它必須學習環境結構以及哪些動作可以獲得獎勵,以最大化獲得的獎勵數量。對應用奧卡姆剃刀進行額外獎勵,奧卡姆剃刀是一種直觀且智慧的方法。[32]

智商

機器完成傳統的智商測試很少被認為是智慧的證據,這可能從 1963 年人工智慧程式透過 WAIS 的幾何類比任務開始。

通常結果與人類相當,但與數字補全一樣,機器解決問題的方式可能有所不同,這意味著結果具有不同的誤差分佈。

與之相關的是心理計量 AI,這個領域專注於構建能夠解決一系列問題的機器(使用單一測試來評估機器是無用的,因為它可以專門用來解決問題)。[33]

關於什麼被認為是智力測試中的證據,仍然存在很多爭論。在機器方面,測試重點是即時靈活性和適應性、創造力的證據;尤其是在語言和對話方面。與人類學和社會學方法一樣,計算機科學傾向於關注與外部環境的互動。這與智商測試的通用、靜態方法背道而馳,智商測試強調在孤立狀態下衡量的智慧內在特徵的證據,而往往忽視了情境。這些學科之間的互動,以及尚未探索的學科,將有助於我們擺脫這種狹隘的智慧理解,朝著更實用的理解邁進。

參考文獻

[編輯 | 編輯原始碼]
  1. Phelps R. 測量智力:事實與謬誤。JDBP。2006;27(4): 356
  2. Beeghley L, Butler EW。公共學校在種族隔離之前和之後智力測試帶來的後果。SP。1974;21(5): 740-754。
  3. Bartholemew D。測量智力:事實與謬誤。美國:劍橋大學出版社;2004。
  4. 第二章:智力測試的應用。RER。1932;5(3):199。
  5. Benson ES。智慧智力測試。MoP。2003;34(2): 48。
  6. Sternberg RJ, Grigorenko EL。智力和文化:文化如何塑造了智慧的含義及其對幸福科學的意義。PT: BS。2004;359(1449)。
  7. Hernandez-Orallo J, Martinez-Plumed F, Schmid U, Siebers M, Dowe DL。解決智力測試問題的計算機模型:進展與意義。AI。2016;230: 74-107。
  8. Kaplan RM, Saccuzzo DP。心理測試:原理、應用與問題。第 8 版。加州貝爾蒙特:Wadsworth,Cengage 學習;2010。
  9. Pearson Clinical。韋氏成人智力量表® – 第四版英國版 [網際網路]。2020 年。[訪問日期:2020 年 12 月 2 日];可從:https://www.pearsonclinical.co.uk/Sitedownloads/Productpdfs/wais-4ukclinical8ppfinalweb.pdf
  10. Gottfredson LS。第 1 章:用於駁斥智力測試證據的邏輯謬誤。在:Phelps RF,編輯。糾正關於教育和心理測試的謬誤。華盛頓特區:美國心理學會;2009 年。
  11. Pearson Clinical。WISC-V 對 Laurie Jones(2015 年 6 月 1 日)的解釋性考慮 [網際網路]。2020 年。[訪問日期:2020 年 12 月 2 日];可從:https://images.pearsonclinical.com/images/assets/wisc-v/WISC-VInterpretiveReportSample-1.pdf
  12. Carlton SG, Gutierrez L。心理變數與韋氏成人智力量表-IV 的表現。AN: 成年人。2017;24(4): 357-363。
  13. Weiten W。心理學:主題與變奏。第 10 版。加州貝爾蒙特:Wadsworth Cengage 學習;2016。
  14. Kaufman AS。智商測試 101。紐約:Springer 出版社;2009。
  15. Weiten W。心理學:主題與變奏。第 10 版。加州貝爾蒙特:Wadsworth Cengage 學習;2016。
  16. Mayer, JD, Salovey P, Caruso DR, Sitarenios G。使用 MSCEIT V2.0 測量情商。E。2003;3: 97-105。
  17. Sternberg RJ。文化與智慧。AP。2004;59(5): 325–338。
  18. Sternberg RJ, Grigorenko EL。智力和文化:文化如何塑造了智慧的含義及其對幸福科學的意義。PT: BS。2004;359(1449)。
  19. Sternberg RJ。心靈的隱喻:對智慧本質的理解。劍橋:劍橋大學出版社;1990。
  20. Sternberg RJ。心靈的隱喻:對智慧本質的理解。劍橋:劍橋大學出版社;1990。
  21. Sternberg RJ, Kaufman JC。人類能力。ARP。1998;49: 497。
  22. Squibb PG。智慧的概念 – 社會學視角。TSR。1973;21(1): 57-75。
  23. Sternberg RJ, Kaufman JC。人類能力。ARP。1998;49: 497。
  24. Sternberg RJ。心靈的隱喻:對智慧本質的理解。劍橋:劍橋大學出版社;1990。
  25. Berry JW, Irvine SH。人類能力在文化背景中的表現。劍橋大學出版社;1988。
  26. Ceci SJ, Hembrooke HA。智力發展的生物生態模型。APA。1995:303-345
  27. 笛卡爾 R。論正確地運用理性和在科學中尋求真理的方法。萊頓:勒內·笛卡爾;1637。
  28. 圖靈 A,1950,“計算機器與智慧”,Mind,59(236):433–60。
  29. Legg S, Hutter M。機器智慧的測試。50 年的人工智慧:獻給人工智慧 50 週年的論文集。柏林,海德堡:施普林格出版社柏林海德堡;2007 年。第 232-242 頁。
  30. Pangaro P。控制論 – 定義 [網際網路]。2013 年。[訪問日期:2020 年 12 月 3 日];可從:https://pangaro.com/definition-cybernetics.html
  31. 與開放大學合作學習:OpenLearn。機器、心靈與計算機:3.2 控制論與符號 AI [網際網路]。2017 年 12 月 6 日。[訪問日期:2020 年 12 月 3 日];可從:https://www.open.edu/openlearn/science-maths-technology/computing-and-ict/computing/machines-minds-and-computers/content-section-3.2
  32. Legg S, Hutter M。機器智慧的測試。50 年的人工智慧:獻給人工智慧 50 週年的論文集。柏林,海德堡:施普林格出版社柏林海德堡;2007 年。第 232-242 頁。
  33. Hernandez-Orallo J, Martinez-Plumed F, Schmid U, Siebers M, Dowe DL。解決智力測試問題的計算機模型:進展與意義。AI。2016;230: 74-107。
華夏公益教科書