公開する重要な数字の数について十分に確立されたルールはありますか?
特定の例/質問を次に示します。
有効数字の数を変動係数に関連付ける方法はありますか?たとえば、推定値が12.3でCVが50%の場合、「。3」で表される情報がゼロに近づくことを意味しますか?
信頼区間に桁違いの範囲がある場合、同じ数の有効数字があるはずです、例えば:
12.3(1.2、123.4)vs 12(1.2、120)
誤差推定値の有効数字の数は、平均の有効数字の数と同じかそれより少ないべきですか?
公開する重要な数字の数について十分に確立されたルールはありますか?
特定の例/質問を次に示します。
有効数字の数を変動係数に関連付ける方法はありますか?たとえば、推定値が12.3でCVが50%の場合、「。3」で表される情報がゼロに近づくことを意味しますか?
信頼区間に桁違いの範囲がある場合、同じ数の有効数字があるはずです、例えば:
12.3(1.2、123.4)vs 12(1.2、120)
誤差推定値の有効数字の数は、平均の有効数字の数と同じかそれより少ないべきですか?
回答:
私は普遍的なルールがあるとは思わないので、私はそれを補うつもりはありません。これらの考えとその背後にある理由を共有できます。
要約にデータ自体(最大、最小、順序統計など)が反映されている場合、最初にデータを記録するために使用したのと同じ数の有効数字を使用します。これにより、データの精度に関するドキュメント全体で一貫した表現が提供されます。
サマリーの精度がデータより高い場合、その余分な精度を反映する方法で値を書き込みます。たとえば、値の平均には、個々の値の精度の倍があります。おおよそ、場合は1つの余分な有効数字、は2 桁などです。 (これは明らかに対数10のスケールで丸めています。)
- この点に関して、CVは有用な情報を提供しないことに注意してください。
-かなりの精度で推定値を取得できます。他の何かと一致するように丸める必要はありません。たとえば、1,000,000整数の平均は10.977であり、標準誤差は0.00301です。平均を小数点以下3桁(および4〜5桁の数字)に書き込むという私の決定は、SEの大きさの順序に基づいていました。これは、最後の桁が部分的に信頼できることを示します。SEを3つのsig fig(小数点以下5桁)に書き込むという決定は、よりarbitrary意的です。2つのsig figが機能します。おそらくそうではないでしょう。4つのsigイチジクも機能し、平均で4-5のシグイチジクと一致します。4を超えるsigイチジクは過剰になります。(データの4番目の瞬間に関してSE自体の標準誤差を推定し、それを使用して適切な丸めの量を決定できますが、私たちのほとんどはそのような問題に直面しません...)
実質的な丸めを行っているときに、読者に信号を送ります。 レポートで統計的検定自体について議論している場合は特に注意してください。理由は、人々があなたの仕事を使って自分の計算をチェックするかもしれないからです。わずかな違いでさえエラーを明らかにすることがあります。123を120に丸め、他の誰かが作業をチェックして123を取得し、自分の1人が誤っていると疑うので、問題を引き起こしたくありません。
一貫してください。ある時点で値を123としてリストし、後で120として参照すると、読者を失う可能性があります。
ばかげてはいけません。(たとえば、データに2つのsigイチジクしか含まれていない場合に15のシグニチグに統計結果を与えるレポートに出くわすと、私は自動的に無能だと疑います。)
12(1.2、123.4)をお勧めします。ほとんど意味がないので.3を省略しますが、多くの人が(1.2、120)を見ると、120の最後の「0」が重要であると見なします。