跳轉至內容

教育基礎與教學評估/標準化測試/For

來自華夏公益教科書

Lcraw005 (討論) 2009年4月10日(UTC)23:23

教育改革:標準化測試的案例
作者:勞倫·凱瑟琳·克勞福德

準備、手心出汗、對結果的焦慮,這些都可能是熱戀的症狀,也可能是令人恐懼的“T”字詞——測試,特別是標準化測試,它讓教育系統中從美國總統到學校董事會、校長、教師和學生的每個人都感到焦慮。

在下面的文章中,我們將討論標準化測試,它的批評,它存在的必要性,以及如何使用結果作為一名教師幫助縮小成績差距。

來自肯塔基州東部阿巴拉契亞地區一所學校的校長

“離這十八英里外有一所學校,80%

的學生享受免費和減價午餐... 他們的

絕對排名更高,”他對他的教職工說,“不要再跟我提

我們的孩子處於不利地位。‘那條狗不會

狩獵!’”

學習目標

1. 學生能夠識別標準化測試的基本科目領域,並瞭解其評分方式。

2. 學生能夠識別反對標準化測試的論據。

3. 學生能夠識別標準化測試的益處。

4. 學生能夠認識到一些方法,這些方法可以幫助他們作為一名教師幫助縮小課堂中的成績差距。

標準化測試

[編輯 | 編輯原始碼]

自20世紀70年代以來,標準化考試在美國一直受到許多批評,但其基本目的是作為一種衡量標準或規則,用於衡量低年級學生的準備程度和高年級學生對核心學科的掌握程度(Rock, Stenner, 2005)。

入學考試,如皮博迪圖片詞彙測試-修訂版和斯坦福-比奈智力測試,旨在確定進入學校的幼兒園兒童的準備程度(Rock, Stenner, 2005)。這些測試測量孩子的詞彙量和認知能力(Rock, Stenner, 2005)。類似的測試在全年進行,以小組或個人的形式進行,其中許多測試是自適應的,並測量進步情況,它們不是靜態的衡量指標,不會導致及格或不及格的等級(Rock, Stenner, 2005)。相反,自適應測試使用的是所謂的“地板/天花板規則”(Rock, Stenner, 2005)。這條規則意味著(在詞彙測試的情況下),一組單詞對學生來說很容易,低於地板,而另一組單詞對學生來說更難,高於天花板(Rock, Stenner, 2005)。全年的進展將決定天花板和地板將移動到哪個水平(Rock, Stenner, 2005)。

其他測試,如弗吉尼亞州使用的SOL,用於確定全年教授的核心學科的掌握程度(Bagin, 1994)。通常,這些測試測量對數學、科學、閱讀和寫作的理解(Bagin, 1994)。一些測試,比如SOL,是在預定的時間進行的,評分是基於多項選擇、簡答題或開放式問題(Bagin,Stenner 1994)。另一種測試型別,在肯塔基州等州使用,採用的是檔案系統,學生全年不斷新增內容,並在一年中的另一個時間進行預定時間的測試(Wolf, Borko, Elliot, 2000)。

所有這些測試都是根據百分位數系統進行評分的(Rock, Stenner, 2005)。也就是說,學生在考試中取得的成績與其他在相同年級水平參加考試的學生相比如何(Rock, Stenner, 2005)。例如,一名學生在考試中取得90百分位的成績,意味著他的成績比參加考試的90%的其他學生都要好(How Standardized Testing, 2009)。一名學生在考試中取得10百分位的成績,意味著他的成績只比10%的同齡人好(How Standardized Testing, 2009)。

這些考試的成績被用於多種用途。從全國範圍來看,這些成績告訴我們的總統我們的學生整體上以及在州一級取得了怎樣的成績(Bagin, 1994)。各州根據考試成績分配資金,各學校則確定哪些專案需要改進(King, Houston, Middleton, 2000)。教師利用這些成績來評估自己的教學方法,當然,這些成績也偶爾用於確定學生是否具備繼續升學的準備條件(Rock, Stenner, 2005)。

標準化測試的批評

[編輯 | 編輯原始碼]

反對當前標準化測試方法的人出於多種原因不喜歡皮博迪和SOL等測試,但主要的兩個論據是反對其可靠性以及他們認為測試本身存在種族偏見。

為了使一項測試被認為有用,它首先必須是可靠的(Rock, Stenner, 2005)。也就是說,結果應該是一致的(Rock, Stenner, 2005)。衡量測試一致性的一種方法是對具有代表性的學生樣本小組進行樣本執行(Rock, Stenner, 2005)。測試的樣本執行以兩種不同的方式進行:

1. 對兩個版本的測試進行執行,這兩個版本包含類似的問題。如果測試是可靠的,這兩個測試組的測試者應該得出類似的結果(Rock, Stenner, 2005)。

2. 將一個測試隨機且均勻地分成兩部分(Rock, Stenner, 2005)。對這個測試進行執行,並透過這些結果的相似性來確定可靠性(Rock, Stenner, 2005)。

這些樣本執行的結果的測量方式與標準化測試結果的測量方式基本相同。90%的評分意味著一項測試在90%的時間裡會產生類似的結果,而10%的評分意味著一項測試在10%的時間裡才會產生類似的結果。

由於人們普遍認為,無法準確預測成績範圍,因此,80%或更高的可靠性評分被認為是符合國家標準的,而批評者則持不同意見(Thernstrom, 1992)。

批評者認為,如果一項測試在20%的時間裡都產生不同的結果,那麼這項測試不可能測量它本應該測量的東西(Thernstrom, 1992)。

其他批評測試的人認為這些測試存在種族偏見,原因有多種(King et al., 2000)。這種觀點的一個依據是,歐洲裔學生的成績差距通常遠高於少數族裔學生的成績差距(Thernstrom, 1992)。一項學業準備測試顯示,當將歐洲裔學生和非洲裔學生的考試結果進行比較時,前者的成績在76%的時間裡都更高,而後者只在24%的時間裡成績更高(Rock, Stenner, 2005)。

另一方面,一些問題被認為存在種族偏見,因為它們被認為與文化無關(Thernstrom, 1992)。例如,一個問題是“小牛的名字是什麼?”,對於那些在農村地區長大的人來說比那些住在城市地區的人來說更相關(Thernstrom, 1992)。一些批評者甚至認為語言測試存在種族偏見,因為他們認為一種口語形式是正確的,而另一種口語形式是錯誤的(Thernstrom, 1992)。

變革的必要性:標準化測試的案例

[編輯 | 編輯原始碼]

雖然標準化測試的批評者和支持者可以整天爭論不休,但評估學生以確定他們和他們的教師以及學校的進步情況是不可否認的。

標準化測試在學生教育的早期評估他們的準備程度,包括學業準備程度和行為準備程度(Rock, Stenner, 2005)。學生及其家長能夠至少大體上衡量他們的進步情況以及需要改進的方面(Wolf et al., 2000)。

在高年級,標準化測試衡量學生與同齡人相比的成績,從而衡量學生及其教師的教學效果(Bagin, 1994)。雖然這些測試確實根據學生在這些測試中的成績對學生進行排名,但一些學校已經利用這些成績來改革他們的系統,並進而大幅度地改進他們的方法(Wolf et al., 2000)。

在經濟蕭條地區,例如肯塔基州東部,學校在校長們的強有力領導和老師們的奉獻下,取得了更高的評價(Wolf 等人,2000)。一所這類學校的校長說:“距離這裡18英里的一所學校,有80%的學生享受免費或減價午餐……但他們取得了進步,排名也更靠前。”這位校長對他的老師們說:“別跟我說我們的孩子處於劣勢。那是不可能的。”他使用的是當地的一句俗語,意思是藉口無助於學校的進步(Wolf 等人,2000)。

與其找藉口,不如效仿那些面對糟糕的標準化考試成績並利用它們來改進學校的學校,就像一位校長說的,把這些成績當作“股票市場行情”。他們將某個領域表現不佳視為改進該部門的訊號(Wolf 等人,2000)。他們讓老師們學習新的教學方法,並共同努力幫助孩子們進步(Wolf 等人,2000)。

儘管目前仍無定論,即是否存在更好的方法來評估學生的個人進步,但為了帶來改變,學生間相互比較的共同標準的必要性比以往任何時候都更加迫切。

如何利用標準化考試成績彌合成績差距

[編輯 | 編輯原始碼]

因此,問題是,如果這些考試並不完全可靠,而且對某些學生來說無關緊要,我們該如何改變現狀?

答案:成為具有創新精神的前瞻性教師!

一位校長表示,最優秀的老師,實際上本身也是學習者(Wolf 等人,2000)。他們積極尋求新的方法來補充和修改他們的教學(Wolf 等人,2000)。這些老師與家長、學生和輔導員一起工作,以瞭解每個學生的個人需求(Wolf 等人)。最後,他們無視他人的悲觀情緒,提高對學生的要求,並使課程內容與可能不適合學生的學習內容相關聯(Wolf 等人,2000)。

目前,一些公司在各個州之間巡迴舉辦研討會和教學示範(Wolf 等人,2000)。這些研討會涵蓋從寫作和數學等核心領域到如何在課堂中融入技術的各種內容(Wolf 等人,2000)。如今的理念是“更聰明地工作,而不是更努力地工作”(Wolf 等人,2000)。參加繼續教育的老師普遍反饋積極(Wolf 等人,2000)。一位老師在參加了關於寫作的教學示範後說,示範中讓學生在敘事作業中加入反思,她說:“我認為我在這次示範中學到的,並不是與我之前完全不同的東西,而是對現有教學的補充。我對此真的感到興奮!”其他課程教老師如何在日常活動中融入技術,使計劃更容易,並使課程更具連貫性(Wolf 等人,2000)。

此外,學校似乎在存在社群意識的情況下表現更好(Wolf 等人,2000)。在一所取得重大進步的學校,一位老師談到,學生是學校的責任,而不僅僅是他們那一學年碰巧遇到的某個老師的責任(Wolf 等人,2000)。敬業的老師有時每天會與其他老師和學生輔導員開會,以便更好地瞭解學生的背景和特殊情況(Wolf 等人,2000)。

最後,儘管對標準化考試存在批評,但當今優秀的教師並不認為他們的學生能力有限,或者無法學習任何給定的概念。相反,這些老師每天都在努力使學習內容與學生相關,並制定適合每個學生的教學計劃。

縮小成績差距的建議

1. 鼓勵家長與孩子交談,向他們解釋教育的重要性;教育是美國職業成功的必要步驟。(在一項研究中,高成就者普遍有表達這種觀點的父母。)(Lee,1994)

2. 經常評估學生,跟蹤他們的進步,並在整個學年給予鼓勵。

3. 理解評估成績不佳可能是語言障礙或家庭環境壓力造成的,

並制定計劃解決這些問題(Lee,1994)。

1. 在 SOL 等標準化考試中,一名學生在百分位排名中位於第 90 位,這意味著什麼?

    a)Better than 90 percent of his/her peers.
    b)Worse than 90 percent of his/her peers.
    c)Worse than 90 of his/her peers.
    d)Better than 90 of his/her peers.

2. 以下哪個不屬於對標準化考試的批評?

    a)It is unreliable.
    b)Its' results can be used by teachers and the educational system as a whole to improve their methods.
    c)It is racially biased because it asks questions that are unrelated to some students' culture.
    d)It puts unreasonable pressure on students and teachers to do well.

3. 老師剛剛審查了今年的 SOL 成績。她發現,即使是在數學和語文方面都取得高分的學生,似乎也無法理解長除法。她應該...

    a)Focus on verbal instruction since the students did well in that area.
    b)Use the same verbal instruction method year after year since that seemed to work and reform her long division plans.
    c) Reteach the lesson in long division and find a reliable teacher whose students did well on that part of the test for some ideas on how to improve her instruction.
    d) Give up, these disadvantaged kids are incapable of learning anything anyway!

4. 一位安靜、勤奮的亞裔學生 Chris Young 的學習成績越來越差,在 SOL 考試的閱讀部分表現不佳。他拒絕參加課後輔導,只與其他亞裔學生交往。以下所有選項都有可能鼓勵這位學生取得進步,除了…

    a)Give Chris a sheet of resources that offer online help to students with language barriers.  Being online might reduce any embarrassment he may have in learning English as a second language if this is a problem he is encountering.
    b)Discuss his progress with his family. In some Asian cultures failure is seen as an embarrassment and Chris might not admit that he is having difficulty before it is too late.
    c)Create lesson plans that allow for group work so that Chris has a chance to socialize with different types of students and might be more comfortable with getting help.
    d)Ignore the issue Asian kids ALWAYS do better on things like standardized testing, this is obviously a failure of the test!

1. A 2. B 3. C 4. D

參考文獻

[編輯 | 編輯原始碼]

Bagin, C.B. (1994, February 2). What parents should know about standardized testing in schools. Retrieved April 11, 2009, from Standardized testing Web site: http://www.kidsource.com/kidsource/content/standardized.testing.html

(2009). How standardized testing damages education. Retrieved April 11, 2009, from Fair test Web site: http://www.fairtest.org/facts/howharm.htm

King, L.A., Houston, I.S., & Middleton, R.A An explanation for school failure: moving beyond Black Inferiority and Alienation as a policy-making agenda. British Journal of Educational Studies, 49, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/3122363.

Lee, J.S., & Bowen, N.K. (2006). Parent involvement, cultural capital, and the achievement gap among elementary school children. American Educational Research Journal, 43, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/3699418.

Lee, S.J. (1994). Behind the model-minority stereotype: voices of high- and Low-Achieving Asian American students. Anthropology & Education Quarterly, 24, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/3195858

Rock, D.A., & Stenner , J.A. (2005). Assessment issues in the testing of children at school entry. The Future of Children, 15, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/1602660.

Thernstrom, A. (1992). The drive for racially inclusive schools. Annals of the American Academy of Political and Social Science, 523, Retrieved March 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/1047586

Wolf, S.A., Borko, H., Elliot, R.L., & McIver, M.C. (2000). "That dog won't hunt":exemplary school change efforts within the Kentucky reform. American Educational Research Reform, 37, RetrievedMarch 30, 2009, from http://www.jstor.org.proxy.lib.odu.edu/stable/1163528.


華夏公益教科書