多様体上の統計のグラフィカル直観


12

、この記事は、文を読むことができます:

モデルは通常、有限次元多様体上の点θで表されます。

上の微分幾何学と統計マイケル・K・マレーとジョン・W・ライスによってこれらの概念は、数学的な表現を無視して散文読めるでもで説明されています。残念ながら、イラストはほとんどありません。同じことがのために行くこの記事 MathOverflowに。

トピックをより正式に理解するための地図または動機として役立つ視覚的表現の支援をお願いしたいと思います。

マニホールドのポイントは何ですか?このオンライン検索からのこの引用は、データポイントまたは分布パラメーターのいずれかである可能性があることを示しているようです:

多様体と情報幾何学に関する統計は、微分幾何学が統計学と出会う2つの異なる方法です。多様体に関する統計では、多様体上にあるのはデータですが、情報幾何学では、データはRnにありますが、パラメーター化された対象の確率密度関数のファミリーは多様体として扱われます。このような多様体は統計的多様体として知られています。


ここで、接線空間の説明に触発されてこの図を描きました

ここに画像の説明を入力してください

C(M)pM(ψ:RM)p.p,C(t)R,(fψ)(t)ψMp,f,fp

同等性(または統計に適用される同等性の1つ)はここで説明さており、次の引用に関連しています

s

Rss.

Rψ:RMf(fψ)(t).f:MRψf


背景が追加されたもの:

注目に値するのは、これらの概念がMLの非線形次元削減に直接関係しないことだと思います。それらは情報ジオメトリに似ています。ここに引用があります:

Rnn


Oren Freifeldによる形状変形のモデリングへの応用を伴う多様体に関する統計からの以下の情報:

ここに画像の説明を入力してください

MTpMpMTpMMTpMpMTpMMpM完全にその片側にあります。TpMの要素は接線ベクトルと呼ばれます。

[...]多様体では、統計モデルはしばしば接線空間で表現されます。

[...]

M

DL={p1,,pNL}M

DS={q1,,qNS}M

µLµSM

{logμL(p1),,logμL(pNL)}TμLM,logμL(pi)i.i.dN(0,ΣL) {logμS(q1),,logμS(qNS)}TμSM,logμS(qi)i.i.dN(0,ΣS)

[...]

DLMμLΣLDSμSΣS

同じ参照で、私が尋ねているこのグラフィカルな概念の最も近い(そして実際にのみ)例をオンラインで見つけます:

ここに画像の説明を入力してください

これは、データが接線ベクトルとして表された多様体の表面にあり、パラメータがデカルト平面にマッピングされることを示しますか?


1
ここで何をしようとしていますか?マニホールドを描画しますか?それらのほとんどは、描くには退屈すぎる。たとえば、ガウス分布を試してください。
Aksakal

θRnf(θ)=0

2
うまくいけば、@ whuberがやって来て、彼がチャットで行っていたコメントについて詳しく説明します。
ガン-モニカの復活

1
編集した質問に対する短い答えは「いいえ」です。接線空間は、マニホールド内のすべてのスムーズパスの速度を表します。統計学におけるその主な役割は、マニホールドが有限にパラメーター化されたファミリーを記述する可能性を最大化することです。「多様体学習」では、多様体がデータの局所近似として使用されます。これは、線形回帰における「列空間」の曲線バージョンです。そこでは、接線空間がアンビエントユークリッド空間内に埋め込まれています。ローカルでは、データの「方向」を記述し、通常のバンドルでは「エラー」の方向を示します。
whuber

1
TpMpppTMTMTpMTqMMTxRnx

回答:


3

(Θ)N(μ,σ2),R2xy

ここに画像の説明を入力してください

pdf

フィッシャー情報距離:幾何学的な読み取り、コスタSI、サントスSAとStrapasson JEの間の類似性を利用するガウス分布のフィッシャー情報行列及びメトリックベルトラミ-Pointcaréディスクモデル閉鎖式を導出します。

x2+y2x2=1pdfs,PQ,pdfsgμν(Θ)eμeν

D(P(x;θ1),Q(x;θ2))=minθ(t)|θ(0)=θ1,θ(1)=θ201(dθdt)I(θ)dθdtdt

I(θ)=1σ2[1002]

ここに画像の説明を入力してください

カルバック・ライブラー情報量は幾何学と関連するメトリックを欠いているにもかかわらず、密接に関連しています。

そして、興味深いのは、フィッシャー情報行列がシャノンエントロピーのヘッセ行列として解釈できることです。

gij(θ)=E[2logp(x;θ)θiθj]=2H(p)θiθj

H(p)=p(x;θ)logp(x;θ)dx.

この例は、より一般的なステレオグラフィックの地球地図と概念が似ています

ML多次元埋め込みまたは多様体学習については、ここでは扱いません。


1

確率をジオメトリにリンクする方法は複数あります。楕円分布(例:ガウス分布)について聞いたことがあると思います。用語自体はジオメトリリンクを意味し、その共分散行列を描くと明白になります。多様体では、可能なすべてのパラメータ値を座標系に配置するだけです。たとえば、ガウス多様体は 2次元になります。は任意の値を指定できますが、正の分散のみです。したがって、ガウス多様体は空間全体の半分になります。面白くないμ,σ2μRσ2>0R2


「多様体」はその埋め込み空間よりも低い次元であるはずだと私は思ったと思いますか?それで、ハーフスペースはカウントされませんか?
GeoMatt22 2016年

ガウシアンでは、それは多様体でもありません。制約が必要なため、何らかの平面または線になります
Aksakal

私はあなたが「意味するか...あなたの答えの意味を理解しようとしていますジオメトリリンク」?また、私はMathOverflowでこの関連記事を見つけました。
Antoni Parellada 2016年

3
それは、フィッシャー・ラオのような適切なメトリックでさらに面白くなり、その後、ポアンカレ双曲線半位en.wikipedia.org/wiki/Poincar%C3%A9_half-plane_model
mic

2
全員に:(1)パラメトリックファミリーを記述する多様体は固有多様体であり、ベクトル空間に埋め込む必要はありません。(2)それらは単なる微分可能多様体以上のものです。FisherInformationはそれらにリーマン計量(局所距離)を与え、幾何学的に研究できるようにします。これにより、「空間全体の半分」が曲面になります。R2
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.