有効数字を使用しないのはなぜですか?


18

統計で有効数字を使用しない理由は何ですか?推定値を使用しているため、精度に関する規則は適用されません;)?


1
読者はこのスレッドを見つけることもできます:重要な数字の数をテーブル入れてください
グン-モニカを復活

私はこの有益な情報を見つけました:davegiles.blogspot.com/2011/12/…–
ジョン

有効数字に注意を払うことが本当に重要な例はstats.stackexchange.com/questions/113314にあります。OPは、データが回帰手順に入力された精度の違いに起因する著しく異なる回帰結果を取得しました。
whuber

回答:


19

数字に存在する意味のある精度の程度を示すために、いくつかのフィールド(化学でそれらについて知った)で有効数字が使用されます。これは統計の重要なトピックでもあるため、実際にはこれを常に報告しています。異なる形式で報告するだけです。具体的には、推定の精度レベル(平均など)を示す信頼区間を報告します。

(-0.12、1.12)などの推定値の95%CIを(0.12,1.12)リストし0.501295198239759230.50129519823975923のように、平均値の桁を好きなだけリストできます。問題はありません。実際、統計学者のAndrew Gelmanは、少なくとも4つ をリストすることを推奨しています(2009、p。4)


(最後の部分は頬の舌です、私の不敬なことでごめんなさい;-)。
GUNG -復活モニカ

2
+1。桁数が多いと不iな応答が生成されるようです。別のSEサイトの同様の質問に対する私の返信の最後の数行を参照してください。
whuber

@gung CIのエンドポイントを小数点以下2桁で表すにはどうしますか?
user765195

@ user765195、私はそれらの数字を作りました。実際には何も参照しないでください。
GUNG -復活モニカ

@gung私が尋ねたいのは、CIのエンドポイントの精度は何ですか?たとえば、二項比率でウィルソンCIを計算する場合、有効な桁数は何ですか?
user765195

12

多くの推定値、p値などで報告される桁数を制限する理由の1つは、認識に基づいています。p = 0.04872429のようなものを報告することは、結果がより正確であると知覚される原因となる結果の精度を意味します。

本質的に、統計結果を報告する際に数字を多く使用することは、あなたの発見を不当な権威の空気で覆い隠そうとすることを味わいます。


1

私はそれが本当に必要とされる信頼レベルに依存すると思います、例えば、CERNが結果の多くのために使用する99.999%以上に対して、95%に適切な有意桁は少ないです。


さらなる解明のために、Wikipediaの精度と精度に関する記事は、元のポスターの良い読み物になるでしょう。
ロバートジョーンズ

これは良い点ですが、特定の計算で𝛂 = .05の丸めが結果に大きな影響を与える場合があります。
timothy.s.lau

1

データを有効桁数に丸めるか、最終回答を丸めるかについて話しますか?データを丸めると、統計計算で使用する必要のあるノイズを捨ててしまう状況に陥ることがあります。


最終的な答えと中間計算の両方が、教科書でも一般的に丸められていることを意味します。
timothy.s.lau
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.