X
分布が不明なような変数があるとします。Mathematicaでは、SmoothKernelDensity
関数を使用して推定密度関数を得ることができます。この推定密度関数は、「密度」がの結果であると仮定する形式のPDF
ような値の確率密度関数を計算する関数とともに使用できます。Rにそのような機能があれば良いでしょう。これがMathematicaでの動作です。X
PDF[density,X]
SmoothKernelDensity
http://reference.wolfram.com/mathematica/ref/SmoothKernelDistribution.html
例として(Mathematica関数に基づいて):
data = RandomVariate[NormalDistribution[], 100]; #generates 100 values from N(0,1)
density= SmoothKernelDistribution[data]; #estimated density
PDF[density, 2.345] returns 0.0588784
ここでは、PDFに関する詳細情報を見つけることができます。
http://reference.wolfram.com/mathematica/ref/PDF.html
density(X)
Rを使用して密度関数をプロットでき、その使用によりecdf(X)
経験的累積分布関数を取得できることを知っていますが、Mathematicaについて説明した内容に基づいてRで同じことを行うことは可能ですか?
どんな助けとアイデアも大歓迎です。
@Glen_b分布内の他の値の確率を見つけるために推定密度を使用したい。たとえば、0〜10の範囲のデータのベクトルがあります。このデータセットには、0〜10の70個の一意の値しか含まれていません。密度をプロットできます。ここで、ランダムサンプリングで観測データにないX = 7.5の確率を見つけることに興味があると仮定します。どうすれば取得できますか。
—
アミン
ecdf(X)
7.5に相当するパーセンタイルが得られることは知っていますが、探しているものではありません。
「X = 7.5になる確率を見つける」-あなたの問題があります!連続分布がある場合(この場合、実際の答えは「0」)、またはそうでない場合(密度がないため、密度推定を使用すべきではありません)。
—
Glen_b-モニカの復活2013
申し訳ありませんが、それはエラーでした。7.5の値のサンプル割合を意味します。最後の2、3の単語を入力していたので、息子は気を散らしました。観測されていないイベントの確率のサンプル推定値はゼロです。事前申請をしたいですか?ポイント推定ではなく、比率の信頼区間が必要でしたか?あなたの実際の問題はまだRの問題ではなく、あなたの問題はあなたが実際に何を望んでいるかを正しく説明しています。質問を編集するか、新しい質問を投稿してください。
—
グレン_b-モニカを復元
density(x)
既に述べたように、pdfの推定値を示しますが、その適合性は、密度を求める目的によって異なります。たとえば、分散にバイアスがかけられていることに注意してください(畳み込みの実行では、カーネルの分散をデータの分散に追加します。それ自体は不偏推定値です)-このようなバイアスと分散のトレードオフは遍在しています。たとえば、log-spline密度推定など、他の選択肢がありますが、その適合性は、何をしたいかによって部分的に決まります。