1つの可能性があります。
従来、教師のパフォーマンスを評価することは困難でした。この難しさの一部は、学生ごとに特定の科目に対する関心のレベルが異なることです。特定の学生がAを取得した場合、これは必ずしも教育が優れていることを意味するものではありません-むしろ、非常に才能のある興味のある学生が、教育の質が低くても成功するために最善を尽くしたことを意味する場合があります。逆に、Dを取得する学生は、必ずしも教育が貧弱であることを意味するわけではありません-むしろ、教育とインスピレーションを得るための教師の最善の努力にもかかわらず、無関心な学生がcoast走したことを意味する場合があります。
難易度は、生徒の選択(したがって生徒の興味のレベル)がランダムではないという事実によって悪化します。学校では、ある科目(または科目のグループ)を他の科目よりも強調するのが一般的です。たとえば、学校は人文科学よりも技術的な科目を強調する場合があります。そのような学校の生徒は、おそらく技術分野に非常に興味があるため、最悪の教師でも合格点を取得します。したがって、数学に合格する学生の割合は、教育の良い尺度ではありません-優秀な教師は、学習を熱望している学生よりもはるかに優れていると期待しています。対照的に、それらの同じ学生は芸術に全く興味がないかもしれません。すべての生徒がAを取得できるようにすることは、最高の教師からであっても期待することは困難です。
もう1つの難点は、特定のクラスでのすべての成功がそのクラスの教師に直接起因するわけではないことです。むしろ、成功の理由は、学校(または学区全体)が達成の動機と枠組みを作成したことにあります。
これらの困難をすべて考慮するために、研究者は教師の「付加価値」を評価するモデルを作成しました。本質的に、このモデルは、各生徒の本質的な特性(学習に対する全体的な関心度と成功度)、および生徒の成功に対する学校と地区の貢献度を考慮し、「平均」で期待される生徒の成績を予測しますその環境で教える。次に、モデルは実際の成績を予測された成績と比較し、それに基づいて、他のすべての考慮事項を考慮して、教育が適切か、適切かどうか、または悪いかを判断します。モデルは非数学者には複雑に見えるかもしれませんが、実際には非常にシンプルで標準的です。数学者は、何十年も同様の(さらに複雑な)モデルを使用しています。
要約すると、Ms。Isaacsonの推測は正しい。彼女の66人の生徒のうち65人は州の試験で得点しましたが、犬が教師だったとしても、彼らはまったく同じ得点を持っているでしょう。実際の優秀な教師は、これらの学生が単に「熟練した」だけでなく、同じテストで実際に「良い」スコアを達成できるようにします。
この時点で、モデルに関する私の懸念のいくつかに言及することができました。たとえば、モデル開発者は、授業の質を評価する際のいくつかの困難に対処していると主張しています。それらを信じるのに十分な理由はありますか?低所得人口の地域では、予想される「地区」および「学校」のスコアが低くなります。近所の予想スコアが2.5であるとします。平均3を達成する教師は、良い評価を得ます。これにより、教師は、たとえば4または5のスコアではなく、3のスコアを目指すようになります。言い換えると、教師は、完璧ではなく平凡を目指します。これを実現したいですか?最後に、モデルは数学的には単純ですが、人間の直感の仕組みとは非常に異なる方法で機能します。結果として、モデルを検証または異議を唱える明確な方法はありません」の決定。アイザックソンさんの不幸な例は、これが何につながるかを示しています。そんなに重要なことで、盲目的にコンピューターに頼りたいですか?
これは素人への説明であることに注意してください。ここで、物議を醸す可能性のあるいくつかの問題を回避しました。たとえば、低所得層の学区は貧しい人々のパフォーマンスを低下させると言われたくありません。
また、目標は実際にモデルの合理的に公正な説明を与えることであると想定しました。しかし、これはNYTの目標ではなかったと確信しています。私の意見では、彼らの説明が不十分な理由の少なくとも一部は意図的なFUDです。