2014論壇/PISA國際評比的迷思

出自均優學習論壇共筆
跳至導覽 跳至搜尋


2012年「國際學生能力評量計畫」(PISA)結果於近日出爐,台灣學生整體進步,台灣數學第4,進步1名;科學第13,退步1名。閱讀第8,比上次大幅進步15名。報告亦點出「台灣數學程度好與程度差的學生,依統計換算,差了七年的教育程度!」

國際學生能力評量計畫(The Programme for International Student Assessment, PISA)的結果與應用經常引起不同觀點、不同學派的學者的爭論,邀請大家一起來探討大型國際性測驗之結果應如何解釋與推論,以及社會大眾對於評量表現排序可能產生的迷思。

課程規劃:

兩位引言人各分享15分鐘共30分鐘,綜合討論60分鐘

主持人:張文昌 全教總專業發展中心執行長

引言人:林毓淳 全教總外事部主任

引言人:陳崇弘 全教總專業發展中心副執行長


參考資料一

PISA 2012能給我們什麼啟示?

全教總外事部 綜合整理

國際學生能力評量計畫(Programme for International Student Assessment,簡稱PISA)公佈之後,有的媒體輿論開始討論誰獨佔鼇頭,誰落後,也有的開始檢討誰進步,誰退步,當然,最後難免開始檢討教育制度的問題。 在這麼多檢討的聲浪中,教育制度的檢討最值得注意,畢竟,教育制度牽涉到教育的整體環境,所以,若是教育制度出狀況,再強的師資陣容也無力回天。

首先值得注意的是推動瑞典教育類型的國家,其PISA成績皆大幅下滑。在這裡所謂的瑞典教育類型,主要指的是推動教育選擇權(如:教育券)制度的國家。這類型的教育制度的特色就是利用教育選擇權來形成教育市場化的氛圍。在這樣的制度下,每個學生都帶著國家投資在其個人的教育成本,收到較多學生的學校,就會獲得較多的資源(我國的公私校學費齊一也是同樣的原理)。英國的自由學校和美國的特許學校也是這類型的教育政策。瑞典在推動教育券之後,其PISA成績每下愈況,而英美等國的成績也沒有任何起色。換言之,想利用校際競爭模式來提升教育品質的方式反而會造成反效果。

其次,也有人開始檢討師資的來源問題。部份報導指出,由於美國過於注重學生標準化測驗,不僅犧牲學生的創造力,標準化測驗所造成的教育環境惡化,衍伸出的加值性教師評鑑--將學生成績與教師工作權掛鉤,也讓許多優秀人才對教職望而卻步,導致學生缺乏好的老師,最終受害的還是整個國家的未來。

第三,上海的成功經驗也引起外界對其教育制度的興趣。由於在教育方面的表現優異,讓上海教師的社會地位得以提升,教職逐步變成吸引人的職業。現在,優秀的老師不僅集中在上海市區,條件較差的學校也一樣有優秀的師資。除此之外,合作學習也是上海教育的特色之一。

從以上的分析資料可以發現:(1)教育自由選擇權的相關政策(如:教育券、特許學校、自由學校等)對於提升教育品質有損。(2)優秀人才是否願意投入教職對教育品質影響很大。至於吸引優秀人才的方式,除了提升社會地位之外,創造一個好的、不會箝制教師的工作環境,也很重要。(3)推動優質的教育得靠團隊的力量,單打獨鬥的教學模式已經難以應付複雜的教學環境。

參考文獻

紐約時報 (2013) 上海中學生再次領先全球教育測試。網址:http://cn.nytimes.com/education/20131205/c05shanghai/zh-hant/

紐約時報 (2013) 國際教育評估,東方壓倒西方。網址:http://cn.tmagazine.com/education/20131210/t10pisa/zh-hant/

紐約時報 (2013) 國際學生評估美國被數學拖了後腿。網址:http://cn.tmagazine.com/education/20131211/t11test/zh-hant/

參考資料二

PISA 2012的重點說明--國際教育組織EI的分析與簡報

以下內容為EI 對PISA 2012的初步回應。

OECD的2012年「國際學生評估計劃」(PISA),涵蓋有史以來數量最多的國家,總計65國。此次評估的重點在於「數學成就」。OECD認為,此一用於評估15歲學生在算術運用、應用知識、閱讀和科學的能力測試,是有效且可靠的。OECD也認為,經過各國自己國內的測試進行評估比較之後,測試本身在文化上是中立的。

PISA的特點之一為國家排名系統。2012年的PISA,是將各國以較高與較低位置定位,以彌補因取樣方法而產生的不確定性。

PISA 2012的主要結論如下:

上海、香港、中華台北/台灣、韓國、中國澳門、列支敦士登、瑞士和荷蘭被認為數學表現最佳。

在2003年(上次PISA進行數學測試)到2012年間,25個國家被認為已經提高數學表現,25個國家在表現上沒有變化,14個國家的表現惡化。

義大利、波蘭、葡萄牙,數學表現在頂端的學生人數增加了,同時,進步遲緩的學生數減少了。

依據PISA的統計,在數學科,男孩優於女孩的,有37個國家;而女孩勝過男孩的,有5個國家。

弱勢學校在吸引合格教師上,仍然有困難。

在學校系統區隔學生的地區,這些學生往往因為社會經濟地位和接觸數學的頻率而被區隔。

雖然辦學自主權是學校績效的一個重要指標,但必須具備:一個強而有力的教育體系,每個人都明白大家共同的期望; 教師必須能夠參與學校的管理,以及學校績效的資料必須公開。

若將學生的社會背景列入考量,私立學校和公立學校的表現,差別不大。

表現好的國家,會努力把高效能的教師放在處於社會不利地位的學校。

「競爭」不是學校成果的預測指標。

父母的要求: 安全的學校環境、積極的學習氛圍、以及良好的校譽。

在較貧窮國家,「資源」是績效的有力預測指標。但在較富裕的國家,關鍵指標則是「資源如何花費」。

高表現國家,教師待遇良好。而且此一政策比「減少班級人數」的政策優先。

優質的幼兒教育是評估學生表現的一個強有力的預測標。

「公平分配資源」和「導入更多資源到弱勢學校」是評估學生表現的一個很好的預測指標。

在學校建築品質與學生表現之間,沒有任何關連。


PISA的主要政策方案如下:

應該運用早期檢測機制,例如芬蘭,以發現低成就之學生。

低成就應列為目標。

應將弱勢兒童列為額外資源或經濟援助的目標。

各國應以普及化的政策提高標準。

邊緣化的學生應該被納入主流教室和學校。


EI的初步評論:

EI歡迎針對「如何透過PISA結果實現優質教育系統」進行政策辯論。由於PISA的方法是基於「最多可能數量的學生所得到的高成就」,因此,所提出的結論,也對如何促進高品質公共教育系統的政策論述,提供了支持性的證據。

然而PISA存在著兩個主要問題。

第一個問題,是它所使用的國家和主管部門的排名表。這通常具有誤導性,也並不公平。例如,持續改進中的教育系統往往佔據了排名表的下方。OECD自己也承認,因為採樣的關係,單一的排名表是不準確的。

第二,學生表現是由單獨的三項素養定義:數學、閱讀和科學。儘管它們很重要的,卻不能以此做為描述學校各類教學品質的通則。藝術、現代外語、人文科學等,就是未被納入PISA研究的學科。

PISA 2012的數學、閱讀和科學,排名在前幾名的國家,大多數在遠東地區。這引發了一個問題,在對較小的地理區域(如上海、香港和澳門)與其他各洲較大的各個不同國家進行比較時,要如何確保有效性和公平性?

令人欣慰的是,OECD首次在區域層面上,提供了一些相對表現差異的分析。然而,大多數媒體和輿論普遍關注自己國家在整體排名表中的位置。因此,我們要注意,由於PISA每一個週期的分析越來越複雜,若將區域的表現因素加入考量,國家排名的效度將越來越低。此外,許多高表現的體制雖然可能在相對排名上失去優勢,但實際上卻一直保持甚至提昇學生的平均成績。

實際上,PISA在這一段時間所進行的各國進步/退步的趨勢分析,是較有趣且重要的。我們現在正以PISA 2012的結果與PISA 2003的結果進行比較。雖然PISA不能做為對教育系統素質的最終評比,但應特別注意學生的整體表現以及各單一國家內,學生在頂部與底部表現的移動比例變化。最重要的關注焦點,應該是仔細審視各單一國家的PISA週期趨勢,而非與其他國家相比。

學生的社會經濟地位仍然是學生表現的一個強有力的預測指標。在各OECD國家,具社會經濟優勢的學生,數學分數較弱勢學生高39分─這等同於將近一年的學校教育。

OECD 的PISA 2012結果顯示,各國國內學校之間更平等的資源分配、學生之間不因社經地位而被區隔、學校在課程和教學法的自主獨立、以及(最重要的)合格教師的普及,是正向學習環境和學生的學習成果重要預測指標。

OECD發現,老師的高薪資與學生的整體表現具有正相關,這點很重要且值得肯定。但是對於OECD認為「要達到高薪資必須提高班級人數」的結論,EI不認同。

小班和高薪教師是建構優質教育系統的兩個基本要素。

EI同意OECD有力的結論,即學校的素質不可能超過其教師的素質。過去十年學生表現顯著提昇的國家,都已經制定政策,透過提昇專業水準、提高薪資以吸引新進人員從事教職、提供激勵教師進行在職進修等,提昇教學人員的素質。

參考資料三

國際學生能力評量計畫(PISA)的迷思

全教總專業發展中心 陳崇弘

前言

國際學生能力評量計畫(The Programme for International Student Assessment, PISA)的結果與應用經常引起不同觀點、不同學派的學者的爭論,我們必須瞭解這類大型國際性測驗之節國解釋與推論是有其限制、國際比較借用力量的問題、社會及官員對於評量表現排序的迷思,值得加以探討。以下歸納出國內外學者提出對於國際學生能力評量計畫的爭議,分述如下:

一、優勢文化國家主導評量計畫

國際學生能力評量計畫是由文化資本優勢的國家所主導,質疑者認為是經濟合作暨發展組織(Organisation for Economic Co-operation and Development, OECD) 藉由國際學生能力評量計畫傳達經濟資本優勢國家對於課程與教學設計的主流概念,其背後的目的在於為這些經濟及資本優勢國家提供服務( Andere , 2008)。此風氣將使許多國家依據國際學生能力評量計畫的設計理念做為課程規劃及教育改革的標的,無形中將導入西方文化的價值觀,使各國教育目標逐漸與這些經濟及資本優勢的國家趨於一致,最後犧牲各國本土文化對課程自主性的掌握(江芳盛、李懿芳,2009)。因此我們必須重新省思全球化及國際化的意義與必要性。

二、過度聯結國家教育政策

部分學者對於評量結果推論各國教育變相的因果關係產生懷疑,透過將學生成就、學校努力與國家政策透過問卷中有限的變項資料,試圖解是其因果關係並做出過度連結,而對於國際學生能力評量計畫之資料能否有效解釋教育變項間的因果關係持懷疑的態度。國際學生能力評量計畫往往忽略了教育的不可預測性以及教育情境的開放性是受到許多複雜因素的影響,很難就單一便向來解釋,如學校教育結構、社會階層及多樣性(Hopmann & Brinek, 2007)。若要以因果關係來推論,就需要更嚴謹的資料來支持。以我國為例,2006年PISA報告出爐時,政府單位宣成我國學生表現傑出,足以顯示我國在科學及數學教育改革成效卓著(李文儀,2007)。

三、世界各國群起仿效

對於表現優異的國家總會引起各國的高度專注,而紛紛前去取經,如芬蘭經驗。某些學者及政府官員大力支持國際學生評量計畫結果對各國教育政策的借用力量(lending power),希望透過資料分析,尋求教育通則的建立,對全球教育系統指引方向(Baker & LeTendre, 2005)。各國教育系統或政策依循各自的文化脈絡建構而成,對於不同文化國家的教育政策、過程及實務進行比較分析將衍生出許多問題,因此這類國際學生評量測驗能提供給國家的借用力量其實是有限的,例如傾向集權或分權的國家之中都有測驗結果良好的國家( Andere , 2008)。

四、全球大聯考效應逐漸產生

國際學生能力評量計畫逐漸受到全球各國重視,2012年有68個經濟體參與測驗,涵蓋全球約87%的世界經濟體,已有超過一百萬名全世界的中學生都接受過評量。世界各國對於國際學生能力評量計畫的高度參與,雖可豐富資料庫的建制,但亦有學者擔心國際學生能力評量計畫會不會成為一種類全球性大型聯考,每3年評量1次,以各國測驗排序結果來評斷其教育成效或表現的重要指標(江芳盛、李懿芳,2009)。大眾對於國際學生評量測驗結果,很容易直接以分數或排行,加以判斷國家的教育是否成功有效,比如社會普遍關心臺灣學生的表現在全球的排名,遠遠超過國際學生能力評量計畫所要傳遞的內涵及意義。

五、官方對於評量解讀謬誤

從國際學生能力評量計畫來看,係屬於「低壓力評量」(Low-stakes assessment),它提供了各國教育政策的參考;反觀「高壓力評量」(High-stakes assessment),其表現好壞接受獎賞與制裁。已走入歷史的國中基本學力測驗,雖設計之初標榜「基本學力」的精神,但它的功能仍脫離不了考試、選擇學校的功能,而失去了原本屬於低壓力的評量,變成了高壓力評量。高壓力評量的負面結果,如:教師測驗內容毀壞相關指標;窄化教學內容與技巧;擴大教育機會的差距;增加教育決策的中央化、降低教師專業化(張富鈿,2001)。日前有消息指出,臺北市教育局原本預定明年(2013)基北區特色招生考試內容為「類PISA考題」,經議員連署而暫緩實施(陳雅芃,2013),顯見教育官員對於國際學生能力評量的內容與計畫本質瞭解不足,在此謬誤之下差一點做出錯誤的政策。一味地仿效題型而植入入學考試制度之中,一方面,無助於紓解學生考試壓力;另一方面,在此高壓力評量下無法測出學生高層次的能力,如:創造思考或個人想法的闡述。

結語

國際學生能力評量計畫應回歸計畫本質,長期追蹤學生表現測驗,對於分析與比較不同時期我國學生能力素養的變化,提供具有意義的訊息,亦可供國人瞭解國際上認為未來生活所需的關鍵能力。不應過度解釋評量排序及分數,應瞭解計畫背後蘊含的意義與本質,我國教育是否應全面複製?或進行適當調整,加入本土文化內含是我們必須深思的課題。

參考文獻

李文儀(2007)建構數學 讓學生變笨?數學能力 我全球第一。自由時報電子報。2013年12月2日,取自 http://www.libertytimes.com.tw/2007/new/dec/5/today-t1.htm

江芳盛、李懿芳(2009)。國際學生評量計畫(PISA)試題特色分析及其對我國教育之啟示。國際學生教育資料與研究雙月刊,87,27-50。

張富鈿(2001)。OECD國際性學生評量之探討。教育研究月刊,83,28-43。

陳雅芃(2013)。北市議員連署 暫緩考類PISA。聯合新聞網。2013年12月2日, 取自 http://mag.udn.com/mag/edu/storypage.jsp?f_ART_ID=450062&kdid=AR10&r=9

Andere, E. (2008).The lending power of PISA: League tables and best practice in international education. Hong Kong: The University of Hong Kong, Comparative Education Research Center.

Baker, D. P., & LeTendre, G. K. (2005). National differences, global similarities: World culture and the future of schooling. California: Stanford University Press.

Hopmann, S. T., Brink, G. & Retzl, M. (2007). PISA according to PISA─ Does PISA keep what it promises? LIT Verlag: Berlin and Vienna.