跳轉至內容

心理測試

0% developed
來自Wikibooks,開放世界中的開放書籍

智力測試

[編輯 | 編輯原始碼]

[目的和方法]

儘管,正如我們所見,理論家和研究人員仍在努力定義智力,但心理學家、教育工作者以及其他需要以某種方式測量智力的人繼續研究現有的測試,並探索改進其提供有用資訊能力的方法。我們為什麼要測量智力?智力測試有三個主要目的:預測學業成績、預測工作表現以及評估整體適應性和健康狀況

最早的智力測試旨在實現這些目標中的第一個,而且大多數現有的智力測試,如比奈量表和韋氏量表,比預測其他任何方面更能預測學校的表現。預測一個人在工作中的成功程度是智力測試的第二個目標,根據戈特弗裡德森(1997 年)的說法,此類測量指標是整體工作績效最強大的預測指標。智力測試的第三個用途是評估人們的整體適應性和健康狀況。我們在本節中討論的比奈和韋氏測試可以檢測兒童和成人神經系統問題、智力障礙和情緒困擾的跡象,貝利量表和其他嬰兒測試有助於評估嬰兒的發展程序以及神經系統疾病或智力障礙。

不幸的是,傳統測試對我們社會中某些群體的預測準確性不如其他群體。例如,許多批評者指出,這些測試通常需要知識,而處於劣勢的兒童不太可能擁有這些知識,因此,傳統測試可能會錯誤地將某些人歸類為比實際情況更不聰明。多年來,研究人員一直在嘗試開發所謂的文化公平測試,即試圖排除或最大限度地減少可能影響測試者反應的文化偏見內容的測試。瑞文標準推理測驗要求人們識別、區分和匹配不同複雜程度的模式,以及我們稍後討論的考夫曼測試都是此類測試。

我們從簡要討論貝利量表開始本節,然後檢查兩種最廣泛使用的傳統測試集——斯坦福-比奈測試和韋氏量表。這兩種測試都不是文化公平的,並且這兩種測試都測量智力的產物,即實際資訊。接下來,我們檢查相對較新的考夫曼評估量表,該量表試圖既要做到文化公平,又要測量人們獲取資訊和解決問題的方式,然後我們轉向測試構建的方法,包括心理學家如何制定測試評分標準以及他們考慮智力的相對穩定性以及哪些因素可能影響智力隨時間的變化等程式。

測量嬰兒智力

[編輯 | 編輯原始碼]

貝利嬰兒發展量表(貝利,1969 年,1993 年)可能是所有嬰兒發展測試中最著名和使用最廣泛的。由於這些測試設計用於非常年幼的兒童,因此選擇其非語言測試專案是因為它們能夠測量特定的發展里程碑。貝利量表用於 1 至 3 歲的嬰兒和兒童,通常用於評估疑似有異常發育風險的兒童。例如,貝利智力量表包括尋找隱藏的物體和命名圖片等內容,而運動量表則包括抓握能力和跳躍技能等專案,在測試的第三部分,檢查員觀察孩子的行為,並記錄諸如社交性和恐懼表現等內容

越來越重視智力過程,導致一些研究人員探索了評估幼兒處理技能的方法,並設計了文化公平的衡量標準。框 11-1 討論了其中一項較新的測試,即費根嬰兒智力測試,它不僅能夠評估過程,還能從不同文化的嬰兒那裡獲得類似的表現。該測試還與大齡兒童的智力測量結果高度相關。這種預測價值不僅可以告訴我們一些關於智力相對穩定性的資訊(我們在本節後面討論),還可以起到診斷作用,表明需要為有認知發展不足風險的兒童提供特殊幫助(費根,1992 年)。


斯坦福-比奈測試

[編輯 | 編輯原始碼]

斯坦福-比奈測試被心理學家廣泛用於學校和醫療保健機構,它是 20 世紀初比奈和西蒙應巴黎學校系統要求而設計的測試的現代版本。當時,由於新的義務教育法的實施,該市的學校人滿為患,學校管理人員希望找出無法在傳統課堂環境中學習的學生,他們擔心老師可能會不公平地評價這些學生,學校官員建議為他們提供特殊教育的機會。比奈和西蒙認為智力是可塑的,並且可以透過特殊專案來提高兒童的學業成績,他們對測試的構建採取了創新方法(比奈,1909/1973;西格勒,1992)。他們批評了早期嘗試透過測量簡單的感官或運動反應來評估智力的心理學家,比奈和西蒙斷言,要區分個人,就必須對更高的精神功能進行取樣,例如

兒童心理學實踐

[編輯 | 編輯原始碼]

費根嬰兒智力測試

所有的父母都知道他們的孩子註定要獲得諾貝爾獎或成為偉大的領導者,但真的有可能測試非常年幼的孩子們的智力嗎?費根嬰兒智力測試建立在這樣一個概念之上,即嬰兒在其熟練使用編碼物體屬性、觀察物體之間的異同、形成心理表徵以及檢索這些表徵等過程的能力中展現出他們的智力(費根,1992 年)。當然,我們無法看到嬰兒對新奇事物的選擇性注意(費根測試的主要依據),但我們可以從嬰兒的行為中推斷出來。例如,假設我們向一個 5 個月的嬰兒展示一個紅色的菱形;接下來,我們向嬰兒展示一個綠色的菱形和一個綠色的正方形。通常,嬰兒會對正方形表現出偏好,這表明她已經處理了原始顏色形式化合物中的元素,現在對新的形式感興趣。(請記住我們在第 5 章中討論的習慣化和嬰兒傾向於關注其環境中的新事物)

費根測試透過測量嬰兒觀察新物體花費的時間與觀察熟悉物體花費的時間相比來估計嬰兒的智力(費根等人,1991 年)使用一組 20 張人臉照片,按對排列,檢查員首先向嬰兒展示第一對照片中的一張,持續 20 秒。然後檢查員將該照片與它的配對照片配對,向嬰兒同時展示這兩張照片 5 秒鐘,然後再次展示 5 秒鐘,這次將兩張照片左右顛倒(以避免嬰兒傾向於選擇一側)。嬰兒獲得的分數由他在整個 10 對照片的展示過程中觀察新照片的總時間組成。

為了確定來自不同文化的嬰兒是否都能勝任這項任務,費根和他的同事在美國對歐洲裔美國人和非裔美國嬰兒群體、巴林(與沙烏地阿拉伯接壤)的一組嬰兒以及烏干達坎帕拉的一組嬰兒進行了測試。在每個文化群體中,都測試了四個年齡段的嬰兒——6 個月、8 個月、18 個月和 24 個月。研究人員發現,這些群體中近 200 名嬰兒的平均得分之間幾乎沒有差異

根據 Fagan(1992)的研究,歐洲裔美國嬰兒的平均得分是 58.8,非洲裔美國嬰兒是 59.1,巴林人是 59.6,烏干達人是 58.4。他認為,解釋這些發現最簡潔的解釋是,黑人和白人在智商上的差異源於文化接觸資訊的差異,這些資訊影響了文化知識領域的分數(第 85 頁)。

有趣的是,在這些嬰兒中,54% 的歐洲裔美國人、49% 的非洲裔美國人和 26% 的巴林人被認為存在身體風險——也就是說,他們在新生兒重症監護病房待了 5 天或更長時間。此外,在烏干達嬰兒中,有 62% 的母親是 HIV 陽性。這些潛在的負面影響的存在可能增加了作者以下論斷的重要性:這四個群體之間似乎沒有智力差異。

Fagan 及其同事(Fagan,1984)已經證明了 Fagan 測試預測未來年齡智商分數的能力,這一特性極大地增強了該測試的潛在實用性(另見關於嬰兒測試預測值的文字討論)。事實上,該測試的主要目標是區分正常嬰兒和認知缺陷嬰兒。根據 Fagan(1992)的說法,該測試已被證明對日後出現智力遲緩的證據非常敏感,識別出約 85% 的後來獲得低智商分數的兒童。

比內提出了心理年齡的概念,它是衡量兒童實際表現水平與其實際年齡對比的一個指標。因此,如果一個 6 歲的孩子答對的題目數量與平均 7 歲的孩子一樣多,那麼這個 6 歲的孩子的智力年齡就是 7;她的表現與一個 7 歲的孩子一樣好。後來,心理年齡的概念被智商取代,德國心理學家威廉·斯特恩設計了以下公式:

其中智商等於心理年齡 (MA) 除以生理年齡 (CA),再乘以 100。因此,如果一個孩子的智力年齡等於她的生理年齡,那麼她的表現就如同其真實年齡的平均孩子一樣,她的智商將為 100。如果她的表現優於同齡的其他孩子,她的智商將高於 100;如果她的表現較差,她的智商將低於 100。如今的斯坦福-比內測試是對比內-西蒙量表的修訂,旨在包含一些考察語言和數學技能以外的專案,例如拼圖和用積木設計圖案,但學術經驗在多大程度上影響後一種型別的任務尚不完全清楚。正如我們將在下一節中看到的,韋克斯勒量表更加重視評估所謂的操作技能的測試。

韋克斯勒量表

韋克斯勒智力量表由大衛·韋克斯勒(1952 年、1958 年)開發,包括韋克斯勒成人智力量表 (WAIS)、韋克斯勒兒童智力量表 (WISC) 和韋克斯勒學前兒童和小學兒童智力量表 (WPPSI)。雖然這些測試體現了比內測試的影響,但韋克斯勒專門設計它們以產生獨立的言語智商和操作智商分數,以及一個組合的總智商分數。表 11 中顯示的 WISC 分測驗描述突出了操作專案在某種程度上不太可能受正規教育或文化因素的影響。因此,一個存在特定學習問題(例如語言障礙)的孩子即使在言語分測驗中表現不佳,也可能在這些專案中表現得很好。來自缺乏其他孩子享有的一些優勢的家庭的孩子也可能在這些操作測試中取得更大的成功。

韋克斯勒沒有使用心理年齡作為估計智力的依據,而是創造了離差智商,它是一個數字,反映了測試者分數相對於同齡平均孩子分數的高、低或相似位置。這與心理年齡的概念有何不同?離差智商評分系統(與比內智商一樣,以 100 為平均分)是基於對美國許多地區不同年齡段人群的大量測試,以及對每個年齡組的平均分數的統計計算。在計算這些平均分數時,心理學家使用一個稱為標準差的統計量來表示平均分數偏離常態的程度。因此,個人的分數可能處於平均水平,也可能高於或低於平均水平一個或多個標準差。

考夫曼兒童評估電池

[編輯 | 編輯原始碼]

考夫曼兒童評估電池 (K-ABC) 是第一個專門關注加工技能的測試,它直接基於認知發展研究(考夫曼和考夫曼,1983)。該測試測量了幾種型別的加工技能,分為兩類:順序加工(逐步解決問題)和同時加工(在解決問題時檢查和整合各種材料)。該測試還評估了學術科目(如詞彙和算術)的成就,但其測試專案(許多是非語言的)旨在做到文化公平。事實上,該測試的設計者在為該測試建立常模時,使用了廣泛且具有代表性的許多美國文化和社會經濟群體樣本。

一個有趣的創新是,如果孩子在分測驗的早期專案中失敗,K-ABC 評估人員會在他們進行分測驗的其餘部分之前教孩子如何完成這些專案。根據該測試的設計者,這確保了任何能夠學習不熟悉任務的孩子都不會在該任務中獲得不及格的分數。考夫曼測試因僅提供有限範圍的考察資訊加工功能的專案(如短期記憶)而受到批評(康諾利,1990 年;斯騰伯格,1985 年)。批評者認為,該測試應該更多地關注解決問題的策略,這是資訊加工方法處理智力的核心組成部分。然而,考夫曼測試是一種創造性的智力測量方法,它將資訊加工方法的重要見解應用於智力和智力測試的研究。==

華夏公益教科書