寫信時間
2000年4月20日
主題
考試
關(guān)鍵詞
考試四法
內(nèi)容提要
選擇:考驗和互相較量
達標:設(shè)定標準的到達
檢驗:規(guī)定內(nèi)容的掌握程度
發(fā)揮:顯示實力
收信人
劉平 張欣
劉平、張欣:
你們剛剛經(jīng)歷了考試,無論結(jié)果如何,亦得亦失而已。
開學(xué)數(shù)周,課程展開,大家關(guān)心本課的考試,我對同學(xué)們說,將會按講義的基本知識部分,列出20道選擇題,每題a、b、c、d四個選擇答案。答卷完成后,我將把所有500份卷子摞齊了,在每題的正確答案的號碼上,用一根大釘子釘下去,填對號的就被釘過,得分。其實我和同學(xué)都覺得略有荒唐,一個藝術(shù)課程,十幾個欣賞的傍晚,天下大作,相與分析;玄談妙想,感悟體會,一待經(jīng)過,就是“通過”了一段美育,也就通過了這次課程。各人自我修養(yǎng),按其秉賦本性生發(fā)開去,尤其在座者與我以心相印,根本無以言表,不堪訴說,怎么可以用些什么知識概念來衡量評價?在北大,每位同學(xué)只有一次(2學(xué)分)的藝術(shù)課程中,知識就象糖果紙,課程面授過程就如糖果,真正傳達交流的是那種甜味,糖果有時已是多余,因為它帶來某種負擔(dān),糖果紙更是包裹運送糖果之外皮。莊子說“得魚而忘筌”,持執(zhí)尚在魚也。如果得了魚,就著水燉出一鍋濃湯,嘗盡鮮美,魚亦須忘。但是期末考試卻要把糖果紙拿來展玩,就只配用大鐵釘釘一下了。
本來北京大學(xué)是個治學(xué)要求勤奮、嚴謹、求實,教課追求自由、創(chuàng)新的勝地。近年來考試有了一種規(guī)定,都以百分制結(jié)算,藝術(shù)課程都要閉卷(實際是把藝術(shù)課程規(guī)定為藝術(shù)學(xué)課程),分數(shù)要“正態(tài)分布”,似乎一個課程,無論全體師生多么努力,都要擠出幾個不及格或勉強及格者;反之,無論師生多么敷衍,也要選出幾個優(yōu)異的高分得主。教務(wù)管理部門的出發(fā)點是用嚴格考試提高教學(xué)質(zhì)量,這大概是沒有辦法的辦法。如果大學(xué)的教授是公開聘任,權(quán)威學(xué)術(shù)委員會(本專業(yè)教授和校長組成)和受教育者(學(xué)生與其他人員組成)流動選擇,再由教授盡心盡力負責(zé)治理教學(xué),教學(xué)質(zhì)量必然提高。而用考試來監(jiān)督、制約教師和學(xué)生,像在北京大學(xué)這種地方,學(xué)生都是英才,是久經(jīng)考場的得“道”之輩,對付考試,已在中學(xué)應(yīng)試教育中將各種伎倆練就,教學(xué)中越把重點放在考試分數(shù)上,他們就越有對付的辦法。如果用單一“閉卷—百分制—正態(tài)分布”的方法考我教的藝術(shù)課程,肯定是從未聽課而會抄背書上條文的學(xué)生得高分,或者聽課馬虎,重知識而輕思想、輕感受的人得高分,而真正有會于心,感應(yīng)相交的學(xué)生,分數(shù)無以顯示他們的成績,也許他們反過來會覺得在這種考試中得高分是其不屑所為。
但是,我們可以不考試來組織大學(xué)教學(xué)嗎?這個問題是不能問的。最多可以恢復(fù)北京大學(xué)八十年代的考查制,選了藝術(shù)課程,就是“合格”,不選不合格,就象晨練,圍著未名湖繞圈圈,跑過了,就合格。
考試是組織教學(xué)的必要手段,除了晨練和藝術(shù)課程可以考查通過之外,應(yīng)該根據(jù)教學(xué)組織的確切需要來設(shè)置。至少可以分為4種:1. 選擇;2. 達標;3. 測驗;4. 發(fā)揮。
1.選擇考試目的是選拔,使用的方法是考驗和較量。比如你們報考藝術(shù)學(xué)系研究生,80人報名,選取10名,所有80人各人總分多少,平均分是多少都無意義,關(guān)鍵是要考驗這80人中最優(yōu)秀者(或者說最符合藝術(shù)學(xué)研究需要的前10名)。試題應(yīng)該讓80人能夠充分顯示出:
(1)科研能力(理性的質(zhì)量);
(2)學(xué)科基本知識;
(3)科學(xué)方法的掌握程度;
(4)對藝術(shù)品的感覺力。
如果試題出得恰當,80人都可以盡力顯示,在各個方面清晰地拉開距離,再由各方面綜合考慮而選擇人選。這時出具的考題,就要有很高的測試機制,也就是原則上是80個人的各個人的水平都能因此而得到區(qū)別,被試者應(yīng)該分別各得1分—80分(或20分—100分)。雖然數(shù)人可以完全不分高下,得同一分數(shù),但試題應(yīng)該盡量變換精度,使大體不分高下者,可微見分別。設(shè)80人都是高手,可考到80,80.2……到90分之間,這是正態(tài)分布之真正意義所在。如果試題有所偏頗,就無從達到期望之目的,使測試者與被試者悵憾。這種類型的考試與大學(xué)統(tǒng)考、選拔官員,選拔運動員一樣,就是讓被試者相比。在大學(xué)中此種考試只用于選拔,而不必用于教學(xué)。
2.達標考試的目的是分段推進基礎(chǔ)訓(xùn)練,使用的方法是確定標準,公布成績。比如你們在體育課上要跑、跳、投、擲以達到規(guī)定指標,英語分四級、六級、托福、GRE等。如果一組同學(xué)人人都能達到標準,就人人都合格;無人達到,就無人合格,不存在什么“比例”,因為標準是法則,不可動搖和臆改,否則此基礎(chǔ)訓(xùn)練的所有進程和分段原則將會混亂,失去了此種考試的本來意義。達標也可以采取百分制,比如我有一次公選課,預(yù)設(shè)知識項五十種,作為這段教學(xué)的訓(xùn)練標準,要求同學(xué)掌握,當時300多個同學(xué)選課,唯我們系同學(xué)最認真,十多個同學(xué)掌握90%以上的知識項,所以盡得90多分、100分,而有些同學(xué)專業(yè)較忙,只求過關(guān),也有只掌握其60%者,故得60、70分。成績報上,主管教學(xué)的一個主任來找我,讓我改掉藝術(shù)系同學(xué)的成績,質(zhì)問:“哪有學(xué)生可以得100分的?”我就反問:“哪有學(xué)生不可以得100分的?”又質(zhì)問:“為什么不按比例正態(tài)分布?為什么沒有不及格的?”我反問:“這一班學(xué)生在這次課上恰巧人人這么努力,為什么要有不及格的?”后來他說是學(xué)校教務(wù)處的規(guī)定,我只好去教務(wù)處謝罪,但成績不改。也許,教務(wù)處認為藝術(shù)學(xué)課程不是達標考試的對象,而我把普通藝術(shù)教育設(shè)計了一個分段等級測試方法,公式為:年齡×年級×專業(yè)參數(shù)= 知識掌握量(對小學(xué)、中學(xué)也可適用),所以在我的教學(xué)中,都使用了達標考試。
3.測驗考試的目的是檢測本課教學(xué)的效果。根據(jù)教學(xué)規(guī)劃和教學(xué)大綱,一門課的教學(xué)目的是預(yù)先設(shè)定的,這個目的不能以教師的主觀意志為根據(jù),而是由他負責(zé)執(zhí)行教學(xué)規(guī)劃。教學(xué)規(guī)劃為一個大學(xué)專業(yè)學(xué)生整體(平均)的學(xué)習(xí)目標和能力、知識指標而給出有理由、有證據(jù)的綱領(lǐng),其中包括本門課在整體結(jié)構(gòu)中的功能和目的。這個目的必須受整體教學(xué)規(guī)劃和教學(xué)大綱的約束,受到管理部門和學(xué)生的稽查,所以每門課都應(yīng)公布教案(我1995年回國后已經(jīng)開設(shè)了17 門課,全部有教案,打算在系網(wǎng)頁建成后,全部公布在網(wǎng)上以便稽查),這時測驗考試才有根據(jù)。將設(shè)定的教學(xué)目的在一學(xué)期的教學(xué)之后加以測驗,記錄學(xué)生掌握了所授內(nèi)容的百分之多少,記為百分制。
這種測驗考試是大學(xué)教育中最普遍的方法,因為它是整個科學(xué)系統(tǒng)傳授過程的質(zhì)量控制。北大現(xiàn)行的測驗考試已經(jīng)出現(xiàn)“腐敗”,就是教師成了專制的一方,他/她自己編制一個教材,這個教材從未受到本行專家委員會的委托、仔細推敲和認定,所以以此為基準來考試學(xué)生,尚未取得合法性,也就是說,本門學(xué)科的知識和方法在教材中應(yīng)該是“公認”的(經(jīng)過科學(xué)反復(fù)檢驗和權(quán)威機關(guān)審定的),這樣學(xué)生才能以此為根據(jù),作為學(xué)習(xí)的依靠。否則,學(xué)生就會偏依一人之見,而遮蔽學(xué)科之公理。因為學(xué)生沒有資格挑選教材,更沒有權(quán)利臧否教師(正在推行的教學(xué)評估因為無同類型可比性,而是每課單獨答問,結(jié)果有可能教的不夠水平的課“看起來”很好,而極嚴格認真的高水平課“看起來”反而不如前者),所以只能對付考試。最常用的辦法就是請求教師出具復(fù)習(xí)范圍,有兩天一夜背會,立即迎考。我常常想,這樣也是個辦法,以后一門課上兩天一夜就夠了,大學(xué)效率提高,何必大家胡混?
4.發(fā)揮考試的目的是測試學(xué)生的本門課程的科研能力和相關(guān)知識,使用的方法是學(xué)期論文或面試。學(xué)期論文是以結(jié)果評價,所以可以花很大的時間和精力來增加論文的分數(shù)。(具體學(xué)期論文的要求見《關(guān)于科學(xué)語言》一信。)面試是互動性測試,考試是為了全面考查受試者,以及他的判斷、應(yīng)答能力。這時教師的主觀成份很大,只能憑感覺評價,所以面試常??嫉牟皇菍W(xué)生,而是考查師生的關(guān)系,即佛教中常說的“緣份”。
對于大學(xué)的考試,無論上述四種中的哪一種,都是以現(xiàn)有的知識為標準的,即使是發(fā)揮考試,也要符合一般的學(xué)術(shù)規(guī)范和本門學(xué)科的知識范圍。假設(shè)一個學(xué)生的才能和知識的掌握超出了現(xiàn)有規(guī)范和教師所掌握的知識范圍(在計算機聯(lián)網(wǎng)、數(shù)據(jù)庫廣泛進入教學(xué)后,這種事情通常會發(fā)生),考試非但不能測試出學(xué)生的實際水平,相反,還會是非混淆,所以,一切考試將受到懷疑!
作為教師,我采用過一種考試,就是劉平參與的,讓受試者在與試者(我)對話中,用各種方式顯示與我的區(qū)別。區(qū)別越大,得分越高。另外的教師小組(白巍老師和高譯老師)根據(jù)錄相帶評分,我不參與。這種方法徹底顛覆了考試的通常規(guī)則,考試不再是老師考學(xué)生,也不是教師與學(xué)生同時受到測試(教學(xué)普查),而是使考試成為一次學(xué)習(xí)的機會,創(chuàng)造的機會,融會的機會和覺悟的機會。我不能把這種創(chuàng)造考試列為第5種,因為它太不能為一般的教學(xué)系統(tǒng)所容,權(quán)且把它作為一種藝術(shù)。
對于學(xué)生,不對付考試是無能的表現(xiàn),應(yīng)該認清考試的本質(zhì)和各自不同的目的和方法,甚至了解主考教師的學(xué)養(yǎng)和秉性,有的放矢,克服考關(guān)。只是你們不要把考試成績作為衡量學(xué)習(xí)成果的唯一標準,尤其不要讓別人以考試成績所作的評價左右你們對真理的追求。
即此 祝
進步
朱青生
2000年4月20日.