標準化された試験で採点曲線を上るのに、EXTRA正解が徐々に少なくなりますか?


7

私が座る試験の前年の評価曲線は次のとおりです。 ここに画像の説明を入力してください

試験にそれぞれ均等に重み付けされた100(または任意の数)の質問があるとすると、平均から離れるにつれて、パーセンタイルを上に移動するために余分な正解が少なくなりますか?

たとえば、60パーセンタイルから70パーセンタイルに移動するのに、45パーセンタイルから55パーセンタイルに移動するよりも、正解が少なくて済みますか?もしそうなら、なぜですか?

これを信じる私の理由は、同様にマークされた試験から私が持っている別の別の曲線にあるケースである:

ここに画像の説明を入力してください

このグラフにはパーセンタイルが表示されていませんが、平均から離れるにつれて、パーセンタイルを上(または下)に移動するために必要な追加のマークが少なくなっているように見えます。注:1つのアスタリスクは4人の学生を表します。LHSの数値は、正解の生の質問の数を示しています。*

しかし、これの正式な理由を考えることはできません(私の統計知識は限られています)。

それとも、試験で1マークを追加すると、最初に座っていた曲線の位置に関係なく、パーセンタイル曲線が同じ量だけ上に移動するのですか?

参考:この試験では、100のうち何%になるかによってABまたはCは得られません。それは単に学生をランク付けするので、たとえ回答の50%しか正しく得られなかったとしても、100パーセンタイル(または99.99th:これは常に私を混乱させます)が最高の学生になります。


あなたがなぜこれを知りたいのか疑問に思っているなら。私の試験には複数のセクションがあり、各セクションのパーセンタイルグレーディングを取得します。合計スコアは、各セクションの平均になります。したがって、私の質問への回答に応じて、試験のすべてのセクションで均等に勉強するかどうか(そして、たとえば55、55、55番目を目指す)、または最も強い科目に有利なように勉強を偏らせて、そのマークを押すかどうかを決定します迅速に」(そして45度目、45度目、80度目を目指して)、パーセンタイル曲線を上げます。


これが数学スタック交換のより良い質問であるかどうか誰かに教えてもらえますか?そのサイトとこのサイトの両方で正規配布タグを見つけました。
K-Feldspar 2016

1
パーセンタイルカーブの形状に関する直感については、独立したベルヌーイ試行として質問に正解したかどうかをモデル化できます。各質問に正解する確率が同じである場合、誰かの全体的なスコアは二項分布に従います(正規分布で近似できます)。
マシューガン

ご回答ありがとうございます。私はそれらのリンクを読みましたが、答えはまだはっきりしていません(ベルヌーイ裁判を行う方法がわかりませんでした)。しかし、私はこの7sage.com/lsat-score-percentile-conversionを見つけましたこれは、別の試験の生のマークとパーセンタイルを示しています。このことから、私が思っていたのとは正反対のように見えました。これは、90から100の正しい質問に移動すると2%増加し(2パーセンタイルのように)、60から70の正しい質問に移動すると22%増加します(22パーセンタイルなど)。
K-Feldspar 2016

これに基づいて、パーセンタイルを上に移動することはますます困難であり、平均から離れるにつれて、パーセンタイルを上に移動するためにますます正しい答えが必要になると結論します(ただし、これを正しく解釈した場合、これは、2番目に投稿したグラフとは矛盾しているようです) )。
K-Feldspar 2016

1
私は完全な骨頭だったので、最後のコメントを削除しました(完全に間違っていました)。パーセンタイル曲線を見ると、勾配は中央で最も高くなっています。37から39右または73から75右に移動しても、57から59右に移動するよりもパーセンタイルへの影響は少なくなります。追加の質問を正解することは、あなたが平均しているセクションで最大の価値があります。
2016

回答:


4

理由の理解は、シンプルだが現実的なモデルから収集できます。

質問に示されている曲線は、各質問が寄与する46問のテストと一致しています 100/462正しく答えた場合は合計スコアに、それ以外の場合は何も貢献しません。スコアの分布が、各生徒がそれぞれの質問を個別に推測した場合に得られる結果に非常に近いという意味で「一貫性」があります。54.5% 正しい可能性と 10054.5=45.5% 正しくない可能性。

テストの管理の終わり近くのいくつかの状況を考慮してください。すべての質問に回答しました。あなたはあなたのスコアを知りません。しかし、あなたはいくつかの答えを変えることを考えています。

  1. あなたのスコア(あなたには分からない)が真ん中にあり、 54.5。これは、生のスコアに対応します54.5%×46=25、取得したことを示します 25 正しい質問と 4625=21違う。質問をランダムに選んで変更すると、25/46=54.5% それが正しい可能性があります-そしてあなたはあなたの答えを間違ったものに変えるでしょう-そして唯一 45.5%それが間違っている可能性があり、あなたはそれを正しいものに変えるでしょう。したがって、スコアを下げるよりもスコアを上げる方が少し難しいです。

  2. あなたのスコアが実際に高いと仮定します 65: あれは、 30 正しいと 16不正解。これで、誤った質問の1つにランダムに降りてそれを変更し、それによってスコアを向上させるチャンスは、約1/3このハイスコアを上げるのは、下げるより2倍難しいです。

  3. 逆に、同様の分析を使用すると、回答の1つをランダムに変更することで、低スコアを改善するのが簡単になります。

より一般的には-そしてこれは運だけに基づいているように見えるモデルよりも魅力的なモデルであると思うかもしれません-あなたのスコアが期待されるテストを考えてください 100p%基礎知識に基づいた合計の。予想されるテストのスコアを改善するには100p100(p+x)% -つまり、 100x ポイント-あなたはあなたのパフォーマンスを維持する必要があります 100p% 追加するのに十分な学習中に正しい答えの 100x のポイント 100(1p)間違った答えで失ったポイント。この知識の相対的な改善は、次の2つの方法で表すことができます。

  1. あなたは割合を減らしました 1p 間違った答えの 1px、の変更 x/(1p); そして

  2. あなたは割合を増やしました p 正しい答えの p+x、の変更 +x/p

これらの比率(符号まで)、つまり

xpx(1p)=p1p

オッズですp。バランスの取れた方法で-間違った答えを少なくすることと正しい答えをより多く取得することの両方の必要性を説明することによって、それは、100x のスコアで始まる 100p。なので100p に向かって成長する 100 ポイント、分母の減少するサイズ 1pは、すでに高いスコアを改善することが次第にはるかに難しくなる方法を示しています。おおよそ、90%95%97%同様に難しいです。(これらは約のオッズです919、および 32、それぞれ。)

また、スコアが50%を超える場合に上昇するよりも、質問の小さなエラーによりスコアが低下する可能性がはるかに高いことに注意してください。スコアが低い場合はその逆です。推測とランダムな間違いは、貧しい学生と良い学生を傷つけます。

研究戦略に関する限り、この分析は、最も苦手なセクションを研究することで最大の利益を得ることができることを示唆しています-研究努力の各ユニットが各セクションで同じ相対的なパフォーマンスの向上をもたらすと仮定します。


@whuber、ありがとうございます。なぜ100/50 = 2の代わりに100 /46≈2を選択したのか、つまり50ではなく46の質問テストを行ってみませんか。46の意味は何ですか?
K-Feldspar 2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.