日檢如何計算及合格得分數？JLPT能力測驗怎麼扣分？

舊制「素點計分」有趣的小插曲

2010年之前的舊制的日檢JLPT採用「素點」計分的方式，也就是一般考試的固定一題扣幾分的方式，但是沒想到2004那一年因為題目出錯的關係，所以總分400分本來要280分才算及格的舊一級（N1），竟然及格分數突然改為278分，還特地發了公告通知大家這件事。而我的一個學生剛好還真的考了278分還拿到一級合格證書，所以都被同學笑他的一級是撿到的。
當初如果採用這種新制的「尺度得點計分」的方式就不會有這種情況發生了。

何博士明明有寫錯為何還是滿分？

何必博士去考日檢N1的時候，有一題在2選1的情況下還是寫錯了，但是分數依然是滿分，為何會這樣呢？原來就是2010年之後的分數並非用一題固定幾分的方式來計算，且讓我們來看一下它是怎麼計算的吧！

日檢的合格分數

日檢的每一個級數滿分都是180分
N5合格分數80分＝ 45%
N4合格分數85分＝ 47%
N3合格分數95分＝ 53%
N2合格分數90分＝ 50%
N1合格分數100分＝ 55%
雖然如果單純計算合格分數跟總分的比例的話，連最難的N1都只要55%就可以合格了(舊制的是70%)。但是因為是尺度得點計分方式的關係，所以不可以這樣單純計算，還要看你的分數在所有應考者裡面的比例分佈。

日檢採用的「尺度得點計分方式」

跟其他考試不樣，日檢採用的並不是錯幾題就扣幾分的方式，而是採用「尺度計分」的計算方式，這個方式是基於「項目反應理論」所發展出來的。所謂「項目反應理論」（Item Response Theory，簡稱IRT）是一種用於評估和分析測試題目（項目）和受試者回答這些題目反應的模型或理論。相對於傳統的測試理論（如古典測試理論），IRT提供了一種更為複雜和精細的方式來理解測驗題目的特性及其與受試者能力之間的關係。

由圖中我們可看到，如果得到90分的考生的百分比順位是在60的話，那就表示有60%的人的分數在這個考生的後面。

「尺度得點計分」有何好處？

要採用「尺度得點計分」，要有兩個前提：

1.考試的人數要夠多。
2.必須要相信人群當中就是有「厲害/一般/笨拙」的人。

雖然日本語能力試驗已經分級考試，所以題目的難易度已經在一個範圍裡面了，但是為了要讓得分具有可比較的意義，不會因為不同次的考試而無法比較，所以採用了「尺度得點計分」的方式。
如果一個考試只有100個人考，這樣沒辦法知道這個考試是簡單或困難，因為這一百個人有可能都是優秀的學生，或者都是一般的學生，但是如果是幾萬人考，就不用考慮這個問題了。另外如果是採用一般的「素點計分」，也就是固定錯幾題扣幾分的方式的話，則因為每一次考試有難易度不同的問題，所以分數間的差異就變成沒有意義了。難怪以前有人說日檢考試一次簡單一次難，就是因為以前是採固定扣分的方式計算的，容易造成考試難易度影響分數的情況。
如果採用「尺度得點計分」的方式，則理論上同一個考生不管考哪一次考試所得到的分數都會是一樣的，這樣不同次考試所得的分數之間的差異才能夠真正代表能力的差異。

結論來說，尺度得點計分有以下好處：
1. 無論哪一次考試的相同分數都具有可相比意義。
2. 不用考慮考試難易度的差異問題。
3. 就算出錯考題也不會影響整體分數。

圖片是N1的尺度得點分佈圖，橫軸是得分縱軸是百分比，也就是得到滿分180分的只有贏過99.3％以上的人才有，也就是只有0.7%的人得到180分滿分。如果要得到175分，則要贏過98.8%的人才有。如果是N1及格分數的100分，則要贏過65.2%的人才可以，反過來說，N1合格的比例是34.8%。

「尺度得點計分」計算方式

比如一個含有10個題目的考試，總分為180分，一般來說，這些題目應存在不同的難易程度，但實際上，題目的難易並非事先由出題老師定義的，而是應該看所有人的作答結果才知道，大部分的人都答對的，當然就是簡單的，反之就是困難的。
當10個題目作答完畢後，將出現1024(2的10次方）種可能的答題組合，每位考生的答題組合都會是1024種可能中的其中一種。
對於大部分的人都能夠答對的題目我們標記為B；而只有少數人答對的題目我們標記為A，按此原則標記之下Ａ一定比Ｂ少，因為獲得A的不但答對了大部分人答對的，還答對了大部分的人答錯的題目。當然，也存在一些人，他們答錯了大多數人答對的題目，在大多數人答錯的題目上當然更不會，這部分人被稱為C，是成績最低的一群人。
將以上ABC三類人按百分比排序後，再將他們均勻地分佈在0至180分的分數區間內，所以獲得的分數就是他們的優劣表現，而且不用管考題難易度，只要考生人數夠多，同一個考生不管考哪一次考試其分數都會分佈在相同的區間之內。
因此，像何必博士這樣明明知道有答錯題目，但是因為還是分佈在極少數的頂尖分數區間當中，所以系統還是給何必博士180分的滿分。因此，全對一定是滿分，但是滿分不一定是全對喔。
另外，若有題目是幾萬人都沒有人答對，則該題目便失去了意義，不是題目出錯要不然就是答案給錯，如果採用舊制的「素點計分」那就要大費周章昭告天下而且還要修改合格分數了，不過如果採用「尺度得點」就完全不會有任何影響了。

「尺度得點計分」有何影響

這種計分方式會變成這樣
假如本來是一題2分的題目
大部分答對你答錯，會被扣大於等於2分
大部分答錯你答錯，會被扣小於等於2分

所以如果你要何必博士說對考生有何影響？其實我會跟你說沒影響。雖然有理論說這樣更應該要重視「基礎實力」，也就是大部分人答對的千萬不要錯，但是當你考試的時候你根本就不知道到底什麼是簡單什麼是困難。

所以還是那句話，努力準備就對了。

尺度得點計分方式參考文獻

池田央（1994）『現代テスト理論』朝倉書店
豊田秀樹（2002）『項目反応理論 [ 入門編 ] – テストと測定の科学 -』朝倉書店
渡辺直登・野口裕之（編）（1999）『組織心理測定論-項目反応理論のフロンティア-』白桃書房

日檢如何計算及合格得分數？JLPT能力測驗怎麼扣分？

目錄

舊制「素點計分」有趣的小插曲

何博士明明有寫錯為何還是滿分？

日檢的合格分數

日檢採用的「尺度得點計分方式」

「尺度得點計分」有何好處？

「尺度得點計分」計算方式

「尺度得點計分」有何影響

尺度得點計分方式參考文獻

購買日語線上課程

目錄

舊制「素點計分」有趣的小插曲

何博士明明有寫錯為何還是滿分？

日檢的合格分數

日檢採用的「尺度得點計分方式」

「尺度得點計分」有何好處？

「尺度得點計分」計算方式

「尺度得點計分」有何影響

尺度得點計分方式參考文獻

購買日語線上課程

相關文章

輸入關鍵字並按下 Enter 開始搜尋