信頼区間が広すぎて役に立たないと考えているクライアントに何と言いますか?


22

私がコンサルタントであり、信頼区間の有用性をクライアントに説明したいとします。クライアントは、私の間隔が広すぎて役に立たない、そして彼は半分の幅を使うことを好むだろうと私に言います。

どうすれば対応できますか?


15
より多くのデータを収集するように請求します。
みすぼらしいシェフ

2
これは、統計コンサルティングのクライアントのタイプに関する必読論文を思い出させます。

@Procrastinator PDFバージョンのペーパーへのリンクを投稿してもよろしいですか?
想定

1
@Max、明らかにJSTORを介してのみ利用できるようです。PDFを掲載しています...サービスのJSTORの(非常に合理的)条件の違反になります
ベンBolker

@shabbychef-多くの場合、これは、特にサンプルがすでに大きい場合に、精度を高める非常に非効率的な方法です。たとえば、通常の平均ciのciの幅を半分にするには、サンプルサイズを4倍にする必要があります。行く前にモデルの改善に時間を費やし、最大コストを4倍に増やす方が良いでしょう!
確率論的

回答:


16

それは、クライアントが「役に立つ」という意味に依存します。間隔をarbitrarily意的に狭めるというクライアントの提案は、間隔を狭めることで何らかの方法でエラーのマージンを減らすという誤解を反映しているようです。データセットがすでに収集され、修正されていると仮定すると(そうでない場合、コメントの@shabbychefのジョークが答えを提供します)、クライアントへの応答は、「無料ランチ」がない理由を強調して説明する必要がありますあなたはしているの間隔を狭くすることで何かを犠牲にします。

具体的には、データセットが固定されているため、信頼区間の幅を縮小できる唯一の方法は、信頼レベルを下げることです。したがって、真のパラメーター値が含まれていると確信している間隔を広くするか、自信がない間隔を狭くするかを選択できます。つまり、信頼区間が広いほど保守的です。もちろん、幅または信頼レベルのいずれかを無意識に最適化することはできません。これは、パラメーター空間全体に広がることで信頼区間を空虚に生成でき、カバレッジが0 であっても無限に狭い信頼区間を取得できるためです。 100%0%

控えめな間隔がより有用であるかどうかは、コンテキストと間隔の幅が信頼レベルの関数としてどのように変化するかに明確に依存しますが、はるかに低い信頼レベルを使用して取得するアプリケーションを想像するのに問題がありますより狭い間隔が望ましいでしょう。また、信頼区間が広く普及しているため、たとえば60 %の信頼区間を使用している理由を正当化することは困難です。 95%60%


6
何もあきらめずに単純に信頼区間を縮めることはできませんが、片側検定と両側検定の違いに似た柔軟性が少しあります。さらに、同じデータのより良いモデルが、異なる(そしておそらくより小さい)信頼区間を生成する可能性があります。
ダグラスザーレ

3
あなたは最後の部分を少し短く売っていると思います。95%CI の遍在性は文化的な現象です。コンテキストによっては、他の値も一般的です。たとえば、プロットするとき、エラーバーは標準エラー(つまり、68%CI)であることがよくあります。(+ 1、btw)
グン-モニカの復職

2
精神的には、この返事は良いのですが、2番目の段落は限定的すぎると思います。統計学者がこの政党にもたらす大きな利点の1つは、クライアントのニーズによりよく対応できる代替手順の知識です。多くの場合、別のCI手順を選択することにより、CIの幅を狭めることができます。これには、より多くのデータを収集する必要はなく(-1から@shabbychef、私は恐れています)、信頼レベルを下げる必要もありません。本当に難しいのは、手順が事後に選択されたCIを解釈することです。そのため、データを分析(または収集)する前に、この会話が必要です。
whuber

7
私はこれに反応しています、マクロ、実際には柔軟性に欠けるとうまく機能しないからです。リスクは、クライアントがあなたのアドバイスを無視して、それ以上何も知らない人からの助けを求めることです(しかし、統計に関する十分な専門知識を主張します)。OPのシナリオはおなじみの一般的なシナリオです。クライアントに情報を提供し、教育し、代替案を提供する機会と見なすのが最適です(長所と短所の率直な話し合いとともに)。「はい、CIを小さくすることはできますが、それを行うことの結果の一部は」「いいえ、あなたは台無しです」と言う必要があります。
whuber

2
@whuber(+1)は、より効率的な代替手段が利用できる場合に適しています- データを収集/分析する前に統計学者と相談するもう1つの理由です。
マクロ

2

クライアントが信頼区間を使用する対象に完全に依存することをお勧めします。

  1. ある種のレポート/出版物など。通常、95%CIが報告されます。クライアントがあなたの専門知識に遅れをとる傾向があるかどうかに応じて、「統計的に正当化されていない」と彼に伝えて、そのままにしておくことができます。そうでない場合、あなたは彼らが望むものであなた自身のプロの快適さについて判断する必要があります。
  2. 何らかの内部ドキュメント-同意しないことを明確にし、95%ではないため、読者が現在見ている信頼区間のタイプを明確にします。
  3. 推定の不確かさの尺度として、どれだけの感度分析をしなければならないかを決定するために言ってください。95%CIと68%CIのようなものの両方を含む完全な分布を示す図を彼らに与えて、彼らにそれを持たせます。

「だからもっと大きな研究を実行する」ことを私の口から出せないようにできたら、私は自分自身を非常に誇りに思うでしょう。


1
+1。(2)で行ったコメントは、おそらく(1)で説明した状況にも関連すると思います。
マクロ

0

ほとんどの人が行うように、標準偏差を使用します。68%CIに慣れている人は95%CIが怖いことがあります。


4
この場合、個々の値の変動性ではなく、たとえばサンプル平均の精度を示すことに単に興味があるように思えます。なぜ標準偏差を推奨するのですか?
chl

フィッシャーはもともと、95%CIを2つの標準偏差の近似値として提案していました。
パトリックカルドン

1
@ Patrick、chlのポイントを見逃したか(そのような間違いを犯さなかったFisherの不実表示)、または「標準誤差」を意図した「標準偏差」を書いたようです。ほとんどのCIは、標準偏差ではなく、もちろん標準偏差に基づいています。2 SDはCIに近似せず、その逆
whuber

もちろん、標準誤差は平均値の標準偏差に過ぎないため、用語にすぎません。つまり、CIが標準偏差に基づいていないというのは、本当ではありません。それらはサンプルの標準偏差に基づいているのではなく、平均の標準偏差に基づいています。
アーロン-モニカの復活

2
すべての推定値が平均値ではありません。平均以外の推定値には標準誤差があり、whuberが示唆するように、推定値の変動性に基づいてパラメーターの信頼区間を生成するために使用されるのは、推定値の標準誤差です。
マイケルR.チャーニック

0

90%や95%などの特定の標準レベルで信頼区間を指定します。クライアントは、間隔が広すぎて役に立たないかどうかを判断できます。しかし、もちろん、それを短くして便利にすることができるという意味ではありません。サンプルサイズを大きくすると、サンプルサイズの平方根の係数でおおよそ減少するため、所定の信頼レベルで間隔の幅を小さくすることを提案できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.