確率変数をその平均値で置き換えることができないのはいつですか?


10

モデリングとシミュレーションで頻繁に簡略化されるのは、確率変数をその平均値で置き換えることです。

この単純化はいつ誤った結論につながるのでしょうか?


2
変数」は、変数分散、またはバリューアットリスクを表しますか?
Henry

3
メンバーのNetflixサブスクリプションの料金を支払うサービスを開始するのは楽しいでしょう。料金のみXランダムドメインで選択され、[-100100]、したがって、屋知っている、無料のNetflix!後で、一部のお客様に代わりにx2USDを支払うオプションを提供します|x| USDmonthx[100,100]x2 USDmonth
2017年

3
非常に単純なケースでは、極端な場合、関心のあるすべての情報を失う可能性があります。YとXの両方をそれらの平均で置き換えたXでのYの回帰を考えます。斜面に関する情報はすべて失われます。
Dason、2017年

1
欠損値を置き換えることについて質問していますか、または特定のコンテキストでランダム変数を置き換えることについて質問していますか(たとえば、変量効果モデルに基づいて予測を行う)。
IWS

回答:


20

欠損値をポイント推定値で置き換える場合、その変動性はすべて無視されます。したがって、元の変動性をすべてモデルに伝搬することはありません。パラメーター推定のが小さすぎるようです。推論を行う場合、p値は低くバイアスされます。あなたの sが狭すぎるとなります。予測を行う場合、が狭すぎます。

全体的に:あなたはあなたの結論を確信しすぎます。


2
いい答えです!このように考えてください。確率変数には分布があります。左に、右にskwededできます。私はバイモーダルなどにすることができます。変数をその平均値に減らすことで、すべての余分な情報(不確実性)を削除し、分布(間隔)を単一のポイント推定値に置き換えます。
11ドル

1
欠損値をポイント推定値で置き換えると、データがランダムに欠損していると見なされます。確率変数の平均値は、データが欠落している場合、データの平均値と等しくない場合があります。
Neil G

@NeilGはnitpickに申し訳ありませんが、欠損値をその平均値で置き換えても、データがランダムに欠損していると想定することにはなりません。特に-やや紛らわしい-データの欠落に関する用語は、「ランダムに欠落」は、他の既知のデータen.wikipedia.org/wiki/Missing_data)の条件付きでランダムに欠落しているデータであると見なします。IMO、データの置き換え方法は、その背後にある理由について何も意味しません。その推論は明示的にする必要があり、不足しているデータを処理する適切な方法につながります。そうは言っても、私はステファンの答えに完全に同意します。
IWS

@IWS欠落インジケーターが観測データを条件とすることは問題ありません。ランダムに欠落しているとは、欠落インジケーターが観測されていないデータに依存していることを意味します。観察されることを条件として変数をその平均値に置き換える場合、データが無作為に欠落していない限り、無条件の平均値と同じではない可能性があります。
Neil G

@NeilG 最後のコメントの最後の文に「ランダムに欠落」と書いたとき、「ランダムに完全に欠落」を意味するのではないですか。もしそうなら、私たちは同意しますが、私は単に用語についてつまらないことを言っていました。(上記のコメントに入力したWikiページを参照。私は常にその用語を教え、読み、使用してきました)
IWS

13

ステファンのポイントに加えて:

  • 確率変数の非線形関数に関心があるほとんどすべてのアプリケーションでは、平均を代入すると一般にバイアスが生じ、結果が矛盾する可能性があります。エネルギーはV ^ 2に比例するため、粒子の平均速度と平均質量は、一般に平均運動エネルギーと一致しません。
  • 平均値は、確率変数の可能な結果でさえない場合があります。私の考えられる結果が0「患者の死亡」と1「患者の生存」である場合、患者を0.1「ほとんど死亡しているがわずかに生存している」と表現するモデルがあるとおそらく役に立たない。


1
@アレクシスですが、もちろんです!
Geoffrey Brent

0

金融市場での実際の例(あなたが得た2つの回答に関連)。オプションの価格は、資産の価格が特定のレベルを上回る(または下回る)確率に基づいています。

たとえば、資産の期待値が80の場合に、価格100で資産を購入するオプションの価格。確率変数(資産価格)を平均で置き換えると、価格はゼロになります(次のようになります)。 100の資産で80の費用がかかることはありません。資産の確率を考慮に入れると(そしてそれが正しい方法です)、資産価格が100を超える可能性があるため、正の価格になります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.