粒子フィルターにおけるディラック関数の役割


7

確率密度への粒子近似は、ディラック関数の加重和としてしばしば導入されます

p(x)i=1Nωiδ(xxi)

重み付き

ωip(xi)q(xi)

合計が1になるように正規化されます。ここで、q()は重要度密度です。ディラック関数が点pで無限に大きくなるpこと、つまりδ(p)=あり、他の場所ではゼロであること、つまり\ delta(x)= 0〜\ forall x \ neq pであることを理解していδ(x)=0 xpます。また、質点に統合されたディラック関数が1の値を取ることも理解しています。

私の質問は:

  1. 粒子近似のサポートとディラック関数の関係は何ですか?
  2. δを評価するときに合計記号を使用すると、値が0または無限大になるのはなぜですか?代わりに、これは不可欠ではありませんか?
  3. 関数のサポートの概念を、それ自体が関数ではない一連の点(たとえば、xt(i))に拡張するにはどうすればよいですか?
  4. 確率密度関数の表現は、それ自体がゼロまたは無限大のいずれかの値のみを取るδ()の重み付き合計からどのようにして発生しますか?

提供できる可能性のある説明についてありがとうございます。


1
stats.stackexchange.com/questions/73623の関連スレッドは、これらの質問にいくつかの光を当てるかもしれません。(まったく同じ状況ですが、重みは均一です。)
whuber

回答:


6

@ user20160は既に(1)〜(3)の質問に対する良い回答を提供していますが、最後の質問はまだ完全に回答されていないようです。

  1. 確率密度関数の表現は、それ自体がゼロまたは無限大のいずれかの値のみを取るの重み付き合計からどのようにして生成できますか?δ()

ウィキペディアの引用から始めましょう。このケースではかなり明確な説明が提供されています(追加した太字に注意してください):

ディラックのデルタは、原点が無限大である場合を除いて、どこでもゼロである実線上の関数と大まかに考えることができます。

δ(x)={+,x=00,x0

アイデンティティを満たすためにも制約されます

δ(x)dx=1

これは単なるヒューリスティックな特性です。ディラックデルタは、実数で定義された関数がこれらの特性持たないため、従来の意味での関数ではありません。ディラックのデルタ関数は、分布またはメジャーとして厳密に定義できます。

さらに、Wikipediaはより正式な定義と多くの実用的な例を提供しているので、記事全体を読むことをお勧めします。それから一例を引用しましょう:

確率理論と統計では、ディラックデルタ関数は、確率密度関数(通常は完全に連続的な分布を表すために使用されます)を使用して、離散分布または部分的に離散的な部分的に連続した分布を表すためによく使用されます。たとえば 、点と、対応する確率で構成される離散分布の確率密度関数は、次のように書くことができます。f(x)x={x1,,xn}p1,,pn

f(x)=i=1npiδ(xxi)

この方程式の意味するところは、の周りにすべての質量を持つ連続分布合計を取ることです。累積分布関数の観点から分布を想像しようとすると、それはnδxi=δ(xxi)xiδxi

Fxi(x)={0if x<xi1if xxi

したがって、以前の密度を累積分布関数に書き直すことができます

F(x)=i=1npiFxi(x)=i=1npi1xxi

ここで、は指すインジケーター関数です。これは基本的には変装したカテゴリ分布であることに注意してください。さらに、任意の関数でディラックデルタを定義できます。1xxixi

f(x)δ(xxi)dx=f(xi)

したがって、インジケーター関数の連続バージョンとして「機能」します。

要点のメッセージは、ディラックデルタが標準関数ではないということです。これは、ゼロでの無限大とも等しくありません。無限大は数値ではないので、それが役に立たないので、それに対して算術演算を実行できませんでした。ディラックデルタは、連続的で1に統合されるいくつかのを指すインジケーター関数と単純に考えることができます。黒魔術は含まれていません。離散値を処理するために微積分をハッキングする方法にすぎません。xi


4

粒子近似のサポートとディラック関数の関係は何ですか?

分布は、デルタ関数の加重合計として近似されます。したがって、近似のサポートは、デルタ関数のサポートの和集合です。各デルタ関数は、その値が無限である単一の点()を除いて、どこでもゼロです。したがって、各デルタ関数のサポートはその単一の点であり、近似分布のサポートは点のセットです。xt(i){xt(i)}i=1N

を評価するときに合計記号を使用すると、値が0または無限大になるのはなぜですか?代わりに、これは不可欠ではありませんか?δ

合計は、デルタ関数の重み付き合計として分布を表すためにあります。「デルタ関数を各ポイント、その振幅をます。」分布は連続的であるため、各点での値は確率ではなく確率密度です。関連する確率を得るために、ある領域の密度を統合します。スケーリングされた各デルタ関数の積分はます。つまり、各点の確率はであり、他の値の確率は0です。xt(i)πt(i)πt(i)xt(i)πt(i)

以下は、デルタ関数を使用して連続分布を近似する例です。分布はガウス分布です。は、50のスケーリングされたデルタ関数の合計である分布を使用して近似されます。デルタ関数の位置はからサンプリングされます。ggfg

ここに画像の説明を入力してください

目で見ると、は見やすい形がないため、PDFはあまり似ていません。ただし、デルタ関数は、密度が高い領域でより密にパックされます。積分を始めると、類似性がより明白になります。たとえば、CDFは非常によく似ています。平均、分散なども同様です。サンプル/デルタ関数の数が増えると、近似の品質が向上します。fg

関数のサポートの概念を、それ自体が関数ではない一連の点(たとえば、)に拡張するにはどうすればよいですか?xt(i)

サポートは、セットではなく関数に対して定義された概念です。関数のサポートは、出力が非ゼロである入力のセットです。上記のように、関数を集合各点にあるデルタ関数の合計として定義すると、その関数のサポートはます。また、検討することができますインジケータ機能の。セイ、いくつかの大きなセットのサブセットである(例えば実数)。インジケーター関数はで定義されます。場合は、それ以外の場合はます。したがって、インジケーター関数のサポートはです。SSSSLIS(x)L1xS0S


説明していただきありがとうございます。私がまだ理解していないのは、確率密度関数の表現が、それ自体がゼロまたは無限大のいずれかの値のみを取るδ(⋅)の加重和からどのように発生するかです。
コンスタンティン

1
これは、連続分布を離散分布で近似しているためです。
JDL

@ user20160おおよそのCDFをどのように計算しましたか?
tintinthong 2017

1
@tintinthongこれは、デルタ関数で構成されたPDFを統合することで得られる「経験的CDF」です。各点での値は、位置がであるデルタ関数の一部にすぎません。en.wikipedia.org/wiki/Empirical_distribution_functionxx
user20160 2017

@Constantinこの返信は少し遅れています。この方法で連続分布を近似できる理由は、真の密度が高い領域ではデルタ関数がより密にパックされるためです
user20160

2

確率密度関数の表現は、それ自体がゼロまたは無限大のいずれかの値のみを取るδ(⋅)の重み付き合計からどのようにして発生しますか?

ディラックのデルタ関数を、離散値と連続値の間の架け橋と考えてください。ディラックは、連続的な数学ツールを離散量に適用することにより、数学を簡略化するためにそれらを思いつきました。ディラックのデルタは、離散値を処理するのが面倒すぎる場合とまったく同じ状況で考えます。

したがって、あなたの例では、誰かが確率密度関数を持つことを望んでいました。すごい!しかし問題は、入力が離散的な観測であることです。だから、この男はディラックの機能を知っていて、それをプラグインしました:

p(x)i=1Nωiδ(xxi)

この式を理解するには、ディラックのデルタがどのように定義されているかを覚えておいてください:

f(x)δ(xx0)dx=f(x0)
δ(x)0,x0

あなたがそれを説明した方法が定義されていないことに注意してください:

ディラック関数は、ポイントpp、つまりδ(p)=∞で無限に大きくなり、他の場所ではゼロになります。

これはディラック関数を考える正しい方法ではありません。離散値を連続式(積分)にリンクすることを目的とする上記の積分と常に考えてください。x0dx

次に、方程式に積分を適用します。

p(x)dx(i=1Nωiδ(xxi))dx=iωi

ディラックのデルタがなく、積分を合計に適用した場合、未定義の積分が得られます:

(i=1Nωi)dx=

要約すると、ディラックのデルタの目的は離散量を連続空間にもたらすことであり、定義はまさにそれを示しています。離散値から連続密度関数を作成します。p(x)N

繰り返しますが、ディラック関数を「で無限大、どこでもゼロ」と考えるのは誤解を招きます。この説明は、直感の点で役立つものは何もありません。もうやめろ。x0

ディラクト自身が「量子力学の原理」で関数をどのように定義したかを次に示します。 ここに画像の説明を入力してください

これは、関数の目的を説明する方法であり、「被積分関数」という単語を繰り返し続け、「便利さ」を強調する方法に注意してください。 ここに画像の説明を入力してください


1

あなたの混乱はすべて、ディラックのデルタを関数として考えた結果だと思います。そうではありません(ウィキペディアの記事https://en.wikipedia.org/wiki/Dirac_delta_functionを参照)。

デルタ関数は、積分の内部に現れる場合にのみ、数学的なオブジェクトとして意味があります。この観点から、ディラックデルタは通常、関数であるかのように操作できます。

@Timが引用したように、Diracデルタ関数は、分布またはメジャーとして厳密に定義できます。

これは単なるヒューリスティックな特性です。ディラックデルタは、実数で定義された関数がこれらの特性を持たないため、従来の意味での関数ではありません。ディラックのデルタ関数は、分布またはメジャーとして厳密に定義できます。

私はそれを尺度(すなわち、本質的にあなたが統合するもの)として考える方が簡単だと思います。したがって、関数fが与えられると、

μ(f):=f(x) dμ(x)

密度p(x)がある場合、これは測度誘導します。P

P(f)=f(x) p(x)dx

そしてデルタ関数はような 測度誘導しますνν(f)=f(0)

したがって、関数表記は、たとえばメジャーを一緒に追加するのに役立ちます(Q2)。つまり、それが実際に言っていることは次のとおりです。 ここでμ(f):=i=1nνxi(f)

νxi(f)=f(xi)

この視点はサポートの質問も明確にします。サポートは任意の関数を使用して定義されます:ゼロでサポートされていないすべての関数fは = 0 になります分布のサポートμ(f)

Wikipediaの記事で述べたように、デルタ関数はゼロで、平均でガウス分布によって誘導された措置の限界として建設見および標準偏差を消失させることができる()(としてガウスPDFを示す)σg(x;μ;σ)

ν(f)=limσ0f(x)g(x;0,σ)dx


それで、論文が分布のモンテカルロ表現をとして示している場合、それは形式的に正しくありませんか?1/Nδ(x)
コンスタンティン

私はそのように言いますが、ステートメントを文脈で見ると常に役立ちます
seanv507
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.