跳轉到內容

當代教育心理學/第 10 章:教師製作的評估策略/表現評估

來自華夏公益教科書,開放的書籍,開放的世界

表現評估

[編輯 | 編輯原始碼]

表現評估中,學生完成特定任務,而教師觀察過程或程式(例如,實驗中的資料收集)以及產品(例如,完成的報告)(Popham,2005;Stiggens,2005)。[1][2]學生在表現評估中完成的任務並不簡單(與選擇題相比),可能包括以下內容

  • 演奏樂器
  • 運動技能
  • 藝術創作
  • 用外語交談
  • 參與關於政治問題的辯論
  • 進行科學實驗
  • 修理機器
  • 撰寫學期論文
  • 使用互動技能一起玩耍

這些例子都涉及複雜的技能,但表明“表現評估”一詞以多種方式使用。例如,教師可能不會觀察所有過程(例如,她看到草稿論文,但最終產品是在課外時間寫的);因此,作文測試通常被認為是表現評估的例子(Airasian,2000)。[3]此外,在一些表現評估中,可能沒有明確的產品(例如,表現可能是小組互動技能)。

兩個相關的術語,“替代評估”和“真實評估”,有時被用來代替表現評估,但它們有不同的含義。[4]替代評估是指不是紙筆測試的任務,雖然許多表現評估不是紙筆測試,但有些是(例如,撰寫學期論文、作文測試)。真實評估用於描述學生完成的與“現實世界”中類似的任務。課堂任務的真實程度各不相同。例如,對於在芝加哥高中教授的日語課程,在東京用日語交談非常真實——但只有在出國留學專案或去日本旅行時才有可能。在芝加哥與以日語為母語的人用日語交談也是非常真實的,在課堂上與老師用日語交談也相當真實。匹配英語和日語單詞的測試的真實程度要低得多。在語言藝術課程中,寫信(給編輯)或給校長寫備忘錄非常真實,因為信件和備忘錄是常見的辦公用品。然而,寫一篇五段式論文並不那麼真實,因為這種論文在工作中並不使用。然而,一篇五段式論文是一項複雜的任務,通常被歸類為表現評估。

優點和缺點

[編輯 | 編輯原始碼]

表現評估有幾個優點。

  1. 重點在於複雜的學習成果,這些成果通常無法用其他方法衡量。
  2. 表現評估通常評估過程或程式以及產品。例如,教師可以觀察學生是否使用適當的工具和程式修理機器,以及機器在修理後是否能正常工作。
  3. 設計良好的表現評估可以清晰地向學生傳達教學目標和有意義的學習。例如,如果五年級美術課的主題是透視,表現評估可以是繪製一個展現透視的城市場景。[5]這種評估是有意義的,並且清楚地傳達了學習目標。這種表現評估是一個很好的教學活動,並且具有良好的內容效度——這是設計良好的表現評估的常見特點。

表現評估的一個主要缺點是,它通常非常耗費學生和教師的時間。這意味著收集到的評估數量會更少,因此如果評估沒有精心設計,評估的學習目標就會更少——這可能會降低內容效度。州課程指南可以幫助確定表現評估中應該包含什麼。例如,埃裡克是田納西州一所高中的舞蹈老師,他了解到州標準指出,最高階的舞蹈學生應該能夠透過以下方式展示表演技術技能的一致性和清晰度:[6]

  1. 以各種節拍和風格為背景音樂表演複雜的動作組合。
  2. 在廣泛的動態範圍內表演組合和變化。
  3. 透過自我評估展示表演動作組合的進步。
  4. 根據給定的標準評價現場或錄製的舞蹈作品。

埃裡克為他的 11 年級現代舞課程設計了以下表演任務。學生將以 4-6 人一組的形式表演至少 5 分鐘長的舞蹈。選擇的舞蹈應該多方面,以便所有舞者都能展示技術技能、複雜動作和動態範圍(專案 1-2)。學生將錄製排練影片,並記錄他們透過自我評估進行的改進(專案 3)。每組將在課堂上觀看並評論另一組的最終表演(專案 4)。埃裡克需要為這項表現評估中的大部分步驟提供支架。這些小組可能需要在以下方面獲得指導:選擇允許所有舞者展示適當技能的舞蹈;建設性地評價自己的表演;有效地協作,以及應用標準評價舞蹈。

表現評估的另一個缺點是,它們難以可靠地評估,這會導致評估不準確和不公平。與任何建構式反應評估一樣,評分標準非常重要。設計用於評估完成產品的整體評分標準和分析評分標準的示例見表 10-5表 10-6。設計用於評估小組互動過程的評分標準見表 10-7。該評分標準是為初中科學課程設計的,但也可以在其他學科評估小組過程時使用。在一些表現評估中,應該使用多個評分標準。在上面的舞蹈表演示例中,埃裡克應該為表演技能、基於自我評估的改進、團隊合作以及對其他小組的評價制定評分標準。由於設計良好的表現評估顯然很複雜,因此以下方法可能會有所幫助

  • 建立要求學生使用複雜認知技能的表現評估。有時教師會設計一些有趣且學生喜歡的評估,但這些評估不要求學生使用導致重大學習的高階認知技能。專注於高階技能和學習成果尤為重要,因為表現評估通常非常耗費時間。
  • 確保任務對學生來說清晰易懂。表現評估通常需要多個步驟,因此學生需要具備必要的先決技能和知識,以及清晰的說明。仔細的支架對於成功的表現評估至關重要。
  • 透過在教學過程中向學生提供評分標準,明確說明對錶現的期望。這不僅有助於學生理解預期,而且還能確保教師對自己的期望明確。在計劃表現評估時,仔細思考這一點可能對教師來說很困難,但這是至關重要的,因為它通常會導致實際評估和提供給學生的說明的修改。
  • 減少完成任務中非必要技能的重要性。哪些技能是必不可少的取決於任務的目的。例如,對於一篇科學報告,使用出版軟體是必不可少的嗎?如果評估的目的是讓學生展示科學方法的過程,包括撰寫報告,那麼報告的格式可能並不重要。然而,如果目的包括整合兩個學科,科學和技術,那麼使用出版軟體就很重要。由於效能評估需要時間,因此很容易在沒有仔細考慮所有技能是否對學習目標至關重要的情況下包含多種技能。

作品集

[編輯 | 編輯原始碼]

“作品集是學生作品的有意義的集合,它講述了學生成就或成長故事”(Arter、Spandel 和 Culham,1995 年,第 2 頁)。[7] 作品集是有目的的學生作品的集合,而不僅僅是學生所有作品的資料夾。作品集用於各種目的,開發作品集系統可能會令人困惑和壓力重重,除非教師明確其目的。

當主要目的是為了學習的評估時,重點在於學生的自我反思和學習責任。學生不僅選擇他們想要包含的樣本,而且還反思和解釋自己的工作。包含這些資訊的檔案可用於幫助溝通,因為學生可以向他們的老師和家長展示和解釋他們的工作。側重於學習評估的檔案包含學生的作業樣本,這些樣本證明了課堂成績、畢業、州立要求等方面的成就。通常,學生在這些檔案中包含的工作選擇較少,因為這種評估需要一些一致性。例如,肯塔基州要求四年級和七年級學生提交的寫作檔案必須包含一份自我反思陳述和三個寫作示例(反思性、個人經歷或文學和互動性)。學生確實可以選擇他們每種型別的寫作作品中哪些作品包含在檔案中。[8]

檔案可以設計為側重於學生進步或當前成就。例如,可以收集英語學習者一年來的口語錄音來展示學習的進步。學生進步檔案還可以包含單個作品的多個版本。例如,一個寫作專案可能包含關於最初想法、大綱、初稿、同伴或老師對初稿的評論、第二稿和最終完成品的筆記。如果重點是當前成就,則只包含最近完成的工作樣本。

檔案可以專注於記錄學生活動或突出重要成就。記錄檔案是包容性的,包含所有工作樣本,而不是專注於一個特殊優勢、最佳作品或進步。相比之下,展示檔案專注於最佳作品。最佳作品通常由學生確定,因為這種檔案的一個目標是讓學生學會如何識別能證明他們所知和所做的產品的。學生不必孤立地識別出他們最好的作品,還應該利用來自老師和同伴的反饋。

最後可以區分完成的檔案 - 例如用於求職 - 與工作檔案,工作檔案通常包含日常工作樣本。工作檔案會隨著時間推移而發展,並且不打算用於學習評估。工作檔案的重點是發展想法和技能,因此應該允許學生犯錯誤,自由地評論自己的工作並響應老師的反饋。完成的檔案專為特定受眾使用而設計,所選產品可以來自工作檔案。例如,在一個師範教育課程中,工作檔案可能包含從所有課程中獲得的工作樣本。學生可以開發一個完成的檔案來證明自己已經掌握了師範教育課程所需的勝任力,以及另一個用於求職的完成的檔案。

優點和缺點

[編輯 | 編輯原始碼]

在課堂上很好地使用作品集有很多優勢。它們提供了一種記錄和評估成長的方式,比選擇題測試更細緻入微。此外,作品集可以輕鬆地融入教學中,即用於學習評估。作品集還鼓勵學生進行自我評估和反思,以及對學習的擁有權。使用課堂評估來提高學生的學習動機是學習評估的一個重要組成部分,這將在下一節中進行考慮。

但使用作品集也有一些主要缺點。好的作品集評估需要大量的教師時間和組織。需要時間來幫助學生理解檔案的目的和結構,決定要收集哪些工作樣本,以及自我反思。其中一些時間需要在一對一的會議中進行。課外時間審查和評估檔案也極其耗時。教師必須權衡花費的時間是否值得使用檔案帶來的好處。

  1. 評估作品集的可靠性並消除偏差可能比在建構式反應評估中更難,因為產品變化更大。佛蒙特州在全州範圍內使用作品集進行四年級和八年級寫作和數學評估的經驗令人警醒。教師在評估檔案時使用了相同的分析評分量規。在前兩年實施中,從學校收集樣本並由外部教師小組進行評分。在第一年,評審員之間的一致性(即評審者之間的一致性)對於數學和閱讀來說很差;在第二年,評審員之間的一致性對於數學有所提高,但對於閱讀沒有提高。然而,即使數學成績有所提高,可靠性仍然過低,無法將檔案用於個人學生的問責制(Koretz、Stecher、Klein 和 McCaffrey,1994 年)。當可靠性低時,效度也會受到損害,因為不穩定的結果無法有意義地解釋。

如果教師在課堂上使用檔案,表 10- 8概述了實施所需的步驟。如果學校或地區有現有的檔案系統,這些步驟可能需要進行修改。

(返回第 10 章...)

參考文獻

[編輯 | 編輯原始碼]
  1. Popham, W. J. (2005). Classroom Assessment: What teachers need to know. Boston, MA: Pearson.
  2. Stiggins, R. J. (2002). Assessment crisis: The absence of assessment FOR learning. Phi Delta Kappan, 83(10), 758-765.
  3. Airasian, P. W. (2000). Classroom Assessment: A concise approach 2nd ed. Boston: McGraw Hill.
  4. Airasian, P. W. (2004). Classroom Assessment: Concepts and Applications 3rd ed. Boston: McGraw Hill.
  5. http://www.sanford-artedventures.com
  6. http://www.tennessee.gov/education/ci/standards/music/dance912.shtml
  7. Arter, J., Spandel, V., & Culham, R. Portfolios for assessment and instruction. ERIC Digest #388890"
  8. http://www.kde.state.ky.us/KDE/Instructional+Resources/Curriculum+Documents+and+Resources/Student+Performance+Standards/
華夏公益教科書