項目分析/応答理論がより広く適用されない統計的な理由はありますか?たとえば、教師が25問の多肢選択式テストを行い、全員が10問正解した場合、10問は非常に低い割合で回答され(たとえば10%)、残りの5問は約50%の人が回答した。難しい質問にさらに重みを付けるために、スコアの重み付けを変更することは理にかなっていますか?
それでも、現実の世界のテストでは、ほとんどの場合、すべての質問に等しく重み付けされています。どうして?
以下のリンクでは、差別の指標と、どの質問を選択するのが難しいかについてのその他の対策について説明しています。http: //fcit.usf.edu/assessment/selected/responsec.html
ただし、質問の識別インデックスを計算する方法は、前向きな方法でのみ使用されるようです(たとえば、質問がうまく識別できない場合は、それを投げます)。現在の母集団に対してテストの重み付けが変更されないのはなぜですか?