直感と変動係数の使用


11

私は現在、Coursera.orgの運用管理入門コースに参加しています。コースのある時点で、教授は操作時間の変動に対処し始めました。

彼が使用する測定は、標準偏差と平均の間の比率である変動係数です

cv=σμ

なぜこの測定が使用されるのですか?たとえば標準偏差を使用する以外に、CVを使用する利点と欠点は何ですか?この測定の背後にある直感は何ですか?

回答:


8

これは、データのばらつきまたは変動性の相対的な尺度と考えています。「標準偏差は2.4です」という記述を考えると、平均(したがって、測定単位)を考慮しないと、何もわかりません。平均が104の場合、標準偏差2.4は、平均が25,452で標準偏差2.4である場合とはかなり異なるスプレッドの状況を示します。

比較を容易にするために、データを正規化(平均を差し引き、標準偏差で除算)する同じ理由で、異なる単位で表されたデータを比較可能なまたは等しいフッターに配置します。これにより、この変動性の測定も正規化されます。


2

変動係数は、事実上、それが比率(つまり、パーセンテージとして表すことができる)であるという点で、データセット(時系列など)の変動の正規化された、または相対的な測定値です。直感的に、平均が期待値である場合、変動係数は、平均に対する測定値の予測変動です。

これは、複数の異種データセット間または同じデータセットで行われた複数の測定間で測定値を比較する場合に役立ちます。2つのデータセット間の変動係数、または2つの測定セットに対して計算された係数は、それぞれのデータが直接であっても直接比較できます。非常に異なるスケール、サンプリングレート、または解像度で測定されます。対照的に、標準偏差は、それが取得された測定/サンプルに固有です。つまり、標準偏差は、変動の相対的測定値ではなく絶対値です。


この部分についてもう少し説明してください:「変動係数は、ある間隔での測定値の予想される変動性です」?
B_Miner 2012年

@B_Miner信号処理の意味での間隔を意味し、上記で編集しました。Std devは、平均または予想される変動です。
BGreene 2012年

-2

私の理解によると、平均は位置パラメータです。sd / meanは変動係数と見なすべきではありません。どうして?単純な議論は、統計的距離はユークリッド距離とは異なるということです。統計的距離を測定するには、sdを使用します。1つの変数の粗い距離。50が平均で2がsdだとすると、4%はcvになります。今は平均は5で、sdは2 cv = 40%です。統計的変動項は起源から独立しています。そのため、sd自体は変動の良い尺度です。また、物理学の1つのルールとして、2つの単位系を1つの問題で比較しないことを思い出してください。


2
ここで首尾一貫した議論を見るのは難しい。sd / meanを変動係数と見なすべきではありませんか?そのように定義されています。役に立たないという場合は、その理由を説明してください。(名前が間違っていると思う場合は、別の話です。)統計距離はユークリッド距離とは異なりますか?それは単なる主張であり、統計的距離によってあなたが何を意味するかを知ることにかかっています。多くの種類の距離が統計に表示されるため、アサーションはあいまいのままです。(私は反対票を投じませんでしたが、これを書き直すことをお勧めします。英語でより優れたコマンドを使用できる友人と協力する必要があるかもしれません。)
Nick Cox
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.