変動係数の解釈方法は?


33

変動係数を理解しようとしています。次の2つのデータサンプルに適用しようとすると、結果の解釈方法を理解できません。

サンプル1が 、サンプル2がます。サンプル2サンプル1をご覧ください。10 15 17 22 21 27 = + 100,5,7,12,11,1710,15,17,22,21,27=+ 10

どちらも同じ標準偏差が、およびです。μ 2 = 18.67 μ 1 = 8.66667σ2=σ1=5.95539μ2=18.67μ1=8.66667

これで、変動係数が異なります。サンプル2の場合、サンプル1の場合よりも少なくなりますが、その結果をどのように解釈すればよいでしょうか?分散に関しては、両方とも同じです。手段のみが異なります。ここで、変動係数の使用は何ですか?誤解を招くだけの場合もあれば、結果を解釈できない場合もあります。σ/μ


10を追加する代わりに1000を追加すると、2番目のセットの数値は、最初のセットよりも平均値よりもはるかに小さくなります。変動係数は、この表現です。

回答:


42

あなたのような例では、データが単に相加的に異なる場合、つまり定数をすべてに追加し、標準偏差が変わらないことを指摘すると、平均は正確にその定数によって変更されるため、変動係数はから、これは興味深くも有用でもありません。σ / μ σ /μ + K kσ/μσ/(μ+k)

興味深いのは乗法的な変化であり、変動係数には何らかの用途があります。すべてに定数乗算すると、変動係数がになります。つまり、以前と同じままになります。@Aksalalと@Macondの答えのように、測定単位の変更はその典型的な例です。K σ / K μkkσ/kμ

変動係数には単位が含まれていないため、基礎変数に含まれる単位または次元はすべて除算により洗い流されるため、次元もありません。これにより、変動係数は相対的変動性の尺度となり、長さの相対的変動性は重みなどと比較されます。変動係数が何らかの説明的な使用を発見した分野の1つは、生物学における生物のサイズの形態計測学です。

原則と実践では、変動係数は完全に定義されており、完全に正の変数に対してのみ有用です。したがって、詳細に値を持つ最初のサンプルは適切な例ではありません。これを見る別の方法は、平均がゼロになると係数が不定になり、平均が負になると係数が負になることです。後者の場合、標準偏差は正であると仮定します。いずれの場合も、相対的な変動性の尺度として、または実際には他の目的のために、尺度を役に立たないものにします。 0

同等のステートメントは、すべての値に対して対数が通常の方法で定義されている場合にのみ変動係数が興味深く有用であり、実際に変動係数を使用することは対数の変動を見ることと同等です。

ここでは読者には信じられないように思えますが、平均気温が Cに近づくと係数が爆発し、負氷点下の平均気温。さらに奇妙なことに、代わりに華氏を使用することで問題が解決されるという提案を見てきました。逆に、変動係数は、測定尺度が比率尺度として適格である場合にのみ定義される要約尺度として正しく言及されることがよくあります。たまたま、変動係数は、ケルビンで測定された温度でも特に有用ではありませんが、数学的または統計的というよりも物理的な理由によります。0

気候学の奇妙な例のように、著者は信用も恥も値しないので、私は言及しないままにしておくが、変動係数はいくつかの分野で過剰に使用されている。時折、平均偏差と標準偏差の両方をカプセル化する一種の魔法の要約尺度と見なす傾向があります。比率が理にかなっている場合でも、平均と標準偏差をそこから回復できないため、これは自然に原始的な考え方です。

統計では、変動がガンマまたは対数正規に従う場合、変動係数はかなり自然なパラメーターです。これらの分布の変動係数の形式を見るとわかるように。

変動係数はある程度有用ですが、それが適用される場合、より有用なステップは、対数変換または一般化線形モデルでの対数リンク関数の使用による対数スケールでの作業です。

編集:すべての値が負の場合、記号は無視できる規則と見なすことができます。同じ場合、変動係数の実質的に同一の双子です。σ/|μ|


3
+1この投稿には、問題の議論の一部となるべき対数と積極性に関するキーポイントが含まれています。「戦争物語」も読みやすくしています。
whuber

変数が0の場合、CVを計算できないと思いましたか?

1
@ジャーフ:考えてみてください。すべての値が0の場合、変動はなく、計算するものもありません。個々の値が0であるからといって問題はありません。それ自体は平均が0であることを排除しないためです。その場合、CVは不定です。しかし実際には、すべての値が正の場合にCVが最も役立ちます。
ニックコックス

13

「この町には1,625,330人がいます。プラスマイナス5人」と言ったと想像してください。あなたは私の正確な人口統計学的知識に感銘を受けるでしょう。

しかし、「この家には5人いる。プラスまたはマイナス5人」と言ったら。あなたは私が家に何人いるのか見当もつかないと思います。

同じ標準偏差、CVは大きく異なります。


1
これはCoVが何であるかを説明する合理的な方法ですが、OPの質問にどの程度関連するのかは明確ではありません。
GUNG -復活モニカ

OPは次のよ​​うに尋ねます。「分散に関しては両方とも同じです。平均のみが異なります。ここで、変動係数の使用法は何ですか?」私の例は、分散を解釈する方法としてのCVの使用を示していると思います。
バート

1
私はあなたに投票しませんでした。OPの2つの明確な質問は、「その結果をどのように解釈するのですか?」と「ここでの変動係数の使用は何ですか?」です。あなたの説明は良いですが、CoVが何であるかを理解することは、それらの質問への答え全体ではなく、それらの質問に答える最初のステップにすぎません。
GUNG -復活モニカ

4

通常、異なる測定単位または非常に異なるスケールの変数に変動係数を使用します。ノイズ/信号比と考えることができます。たとえば、生徒の体重と身長の変動を比較したい場合があります。米国とモナコのGDPの変動。

あなたの場合、値はそれほど大きくないため、変動係数はあまり意味をなさないかもしれません。


2

定義()が示唆するように、値が大きいサンプルは、その平均と比べて変動が少なくなります。実際には非常に簡単です。変動係数は、異なるスケールのサンプル(または母集団)間の変動を比較するときに役立ちます。国間の賃金を扱っていると考えてください。統計として変動係数の代わりに変動を使用する場合、米国と日本の賃金の変動を比較することは、1 USD〜= 100 JPYと賃金の1単位の差が両方のサンプルで同じことを意味しないため、あまり有益ではありません。さて、この例では、すべてをUSDに変換してから計算を行うことができますが、異なるスケール間で変換する方法が常に明らかとは限りません。たとえば、異なる種の体重の変動を比較する場合。s/x¯


2

実際には、仮説と実験を知らない、または理解していない場合、両方の統計は誤解を招く可能性があります。この恐ろしい例を考えてみてください...板の上を歩くのではなく、綱渡りの2つの高層ビルを歩く 綱綱の直径は1インチで、厚板の幅は12インチだとしましょう。5人はロープを歩くように頼まれ、5人は板を歩くように頼まれました。次の結果が見つかりました。

ロープの端(または側面)からの各ステップの平均距離(インチ):0.5、0.2、0.3、0.6、0.1

厚板(インチ)の端(または側面)からの各ステップの平均距離:5.5、5.2、5.3、5.6、5.1

あなたの例と同じように、この例では、板の値は綱渡りの値と単純に+5の差があるため、等しい標準偏差になります。ただし、各実験の標準偏差が0.2074であると言った場合、2つの実験は同等であると言えます。ただし、綱渡りの実験のCVが板の4%未満と比較してほぼ61%だったと言った場合、何人がロープから落ちたのかを尋ねる傾向があるかもしれません。


0

CVは、さまざまなサンプルデータセットの変動性を比較するために使用される相対的な変動性です。あなたの例では、同じ標準偏差/分散が小さいほど、CVは小さくなります。これは、CVデータセットが小さいほど相対的なばらつきが小さいことを示しています。毎月10000を稼ぎ、100を稼ぐと仮定します(異なる平均)おそらく毎月100(損失)を失うでしょう。より大きなバリエーション。


1
これは既存の回答に何も追加しないと言わざるを得ません。
ニックコックス

0

この場合、cvは結果を説明するための適切な統計ツールではありません。

実施された研究の性質、したがって目的に応じて、研究者は特定の仮説または証明のポイントを持っています。最適かつ適切な統計ツールを使用して実験を設計、実行、およびデータを分析する必要があります。つまり、実験がグループ1とグループ2の成長を比較する場合、両方のcvは同じですが、T検定または対応するT-テストまたはAnova(より大きな実験)は、2つのグループ間の違いを簡単に証明できます。

ここで重要なのは、適切な統計ツールを適用して、結果について意味のある説明をすることです。cvは記述統計の選択肢の1つにすぎないことに注意してください。

私の2セント

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.