タグ付けされた質問 「information-geometry」

4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


4
KLの相違について質問がありますか?
2つの分布をKL発散と比較していますが、この尺度について読んだことによると、ある仮説を別の仮説に変換するために必要な情報量である非標準化数を返します。2つの質問があります。 a)KLの発散を定量化して、効果の大きさやR ^ 2など、より意味のある解釈を行う方法はありますか?標準化の形式はありますか? b)Rでは、KLdiv(flexmixパッケージ)を使用する場合、数値の安定性を提供するために、espより小さいすべてのポイントを何らかの標準に設定する「esp」値(標準esp = 1e-4)を設定できます。私はさまざまなESP値で遊んでいましたが、私のデータセットでは、数字を小さくするほどKLの発散が大きくなります。何が起こっている?espが小さいほど、より多くの「実際の値」が統計の一部になるため、結果の信頼性が高まると予想されます。番号?それ以外の場合は統計を計算せず、単に結果テーブルにNAとして表示されるため、espを変更する必要があります...

3
情報ジオメトリを使用して距離とボリュームを定義します...便利ですか?
確率分布の空間でフィッシャーの情報メトリックを自然なローカルメトリックとして使用し、それを統合して距離とボリュームを定義することを提唱する多数の文献に出会いました。 しかし、これらの「統合された」数量は実際に何かに役立つのでしょうか?理論的な正当化はなく、実用的なアプリケーションはほとんど見つかりませんでした。1つはドキュメントを分類するために「フィッシャーの距離」を使用するGuy Lebanonの作品であり、もう1つはモデル選択のロドリゲスのABCです...「Fisherのボリューム」はモデル選択に使用されます。どうやら、「情報量」を使用すると、モデル選択のためにAICおよびBICよりも「桁違いに」改善されますが、その作業のフォローアップは見ていません。 理論的な正当化は、この距離または体積の測定値を使用し、MDLまたは漸近的な引数から導出された境界よりも優れた一般化境界を持つか、合理的に実用的な状況で証明できるこれらの量のいずれかに依存する方法があるかもしれませんこの種の結果はありますか?

1
フィッシャー情報の決定要因
(同様の質問をmath.seに投稿しました。) 情報幾何学では、フィッシャー情報行列の行列式は統計多様体上の自然な体積形式であるため、幾何学的な解釈が優れています。たとえば、ジェフリーズの事前定義に現れるという事実は、再パラメータ化の下での不変性に関連しています。これは幾何学的特性です。 しかし、統計におけるその決定要因は何ですか?意味のあるものを測定しますか?(たとえば、ゼロの場合、パラメーターは独立していないと言います。これはさらに先へ進みますか?) また、少なくともいくつかの「簡単な」場合に、それを計算するための閉じた形式はありますか?

2
多様体上の統計のグラフィカル直観
で、この記事は、文を読むことができます: モデルは通常、有限次元多様体上の点θθ\thetaで表されます。 上の微分幾何学と統計マイケル・K・マレーとジョン・W・ライスによってこれらの概念は、数学的な表現を無視して散文読めるでもで説明されています。残念ながら、イラストはほとんどありません。同じことがのために行くこの記事 MathOverflowに。 トピックをより正式に理解するための地図または動機として役立つ視覚的表現の支援をお願いしたいと思います。 マニホールドのポイントは何ですか?このオンライン検索からのこの引用は、データポイントまたは分布パラメーターのいずれかである可能性があることを示しているようです: 多様体と情報幾何学に関する統計は、微分幾何学が統計学と出会う2つの異なる方法です。多様体に関する統計では、多様体上にあるのはデータですが、情報幾何学では、データはRnRnR^nにありますが、パラメーター化された対象の確率密度関数のファミリーは多様体として扱われます。このような多様体は統計的多様体として知られています。 ここで、接線空間の説明に触発されてこの図を描きました。 C∞C∞C^\infty(M)(M)(\mathcal M)p∈Mp∈Mp\in \mathcal M(ψ:R→M)(ψ:R→M)(\psi: \mathbb R \to \mathcal M)p.p.p.p,p,p,C∞(t)→R,C∞(t)→R,C^\infty (t)\to \mathbb R,(f∘ψ)′(t)(f∘ψ)′(t)\left(f \circ \psi \right )'(t)ψψ\psiMM\mathcal Mp,p,p,f,f,f,fffppp 同等性(または統計に適用される同等性の1つ)はここで説明されており、次の引用に関連しています。 sss RsRs\mathcal R^ss.s.s. RR\mathbb Rψ:R→Mψ:R→M\psi: \mathbb R \to \mathcal Mfff(f∘ψ)′(t).(f∘ψ)′(t).\left(f \circ \psi \right)'(t).f:M→Rf:M→Rf: \mathbb M \to \mathbb Rψψ\psifff 背景が追加されたもの: 注目に値するのは、これらの概念がMLの非線形次元削減に直接関係しないことだと思います。それらは情報ジオメトリに似ています。ここに引用があります: RnRnR^nnnn Oren Freifeldによる形状変形のモデリングへの応用を伴う多様体に関する統計からの以下の情報: MMMTpMTpMTpMp∈Mp∈Mp …

1
情報ジオメトリの明確化
この質問は、Amariによる論文「曲線指数ファミリの曲がった幾何学-曲率と情報損失」に関係しています。 テキストは次のようになります。 LET であるn個の座標系との確率分布の次元マニホールドθ = (θ 1、... 、θ N)、p個のθ(X )> 0が想定され...Sん= { pθ}Sn={pθ}S^n=\{p_{\theta}\}んnnθ = (θ1、… 、θん)θ=(θ1,…,θn)\theta=(\theta_1,\dots,\theta_n)pθ(x )> 0pθ(x)>0p_{\theta}(x)>0 私たちは、すべてのポイントを考えることがのS N機能搭載など、ログのp θ(X )のXを ...θθ\thetaSんSnS^nログpθ(x )log⁡pθ(x)\log p_{\theta}(x)バツxx ましょうの正接空間であるS Nにおけるθ、大まかに言えば、である、の小さな近傍の線形化バージョンで識別θでS N。してみましょうE I(θ )、私は= 1 、... 、n個の自然の基礎となるT θ協調システムに関連付けられています...TθTθT_{\theta}SんSnS^nθθ\thetaθθ\thetaSnSnS^nei(θ),i=1,…,nei(θ),i=1,…,ne_i(\theta), i=1,\dots,nTθTθT_{\theta} 各点のでのS N機能搭載ログPのθ(X )のXは、考えるのが自然であるE I(θ )におけるθの関数として表すE I(θ )= ∂をθθ\thetaSnSnS^nlogpθ(x)log⁡pθ(x)\log p_{\theta}(x)xxxei(θ)ei(θ)e_i(\theta)θθ\thetaei(θ)=∂∂θilogpθ(x).ei(θ)=∂∂θilog⁡pθ(x).e_i(\theta)=\frac{\partial}{\partial\theta_i}\log p_{\theta}(x). 私は最後の声明を理解していません。これは、上記の論文のセクション2に記載されています。接線空間の基準は上記の方程式でどのように与えられますか?この種の資料に精通しているこのコミュニティの誰かが私がこれを理解するのを助けてくれると助かります。ありがとう。 更新1: 場合、私は(@aginenskyから)ことを同意するが、、その後直線的に独立している∂∂∂θipθ∂∂θipθ\frac{\partial}{\partial\theta_i}p_{\theta}これらが最初の場所で接空間のメンバーであるかも線形独立であるが、非常に明確ではありません。それでは、どの缶∂∂∂θilogpθ∂∂θilog⁡pθ\frac{\partial}{\partial\theta_i}\log p_{\theta}接空間のための基礎として考慮されます。どんな助けでもありがたいです。∂∂θilogpθ∂∂θilog⁡pθ\frac{\partial}{\partial\theta_i}\log p_{\theta} …

1
方向性統計の最もわかりやすい紹介?
質問:指向性統計への「最もアクセスしやすい」導入であるリファレンスに対する推奨事項はありますか? 「アクセシブル」とは、多くの著者がその分野で経験豊富で知識が豊富であるため、新規参入者を混乱させる当たり前のことをよく考えていることを意味します。したがって、主にこの落とし穴を回避する方向統計(コンパクトリーマン多様体での観測の統計)の入門書がある場合、知りたいと思います。 ただし、回答者が1〜2文で説明できる推奨事項があれば役立つと思います。 前提条件については、基本的な微分とリーマン幾何学、および基本的な統計を知っています。しかし、私は完全な専門家ではないので、その資料のいずれかを再度説明する参照は、私にとって問題にはなりません。 また、付随的な質問として、情報ジオメトリの知識は方向性統計とどの程度重複していますか?どちらも(リーマン)幾何学の統計的質問への適用を伴うことは知っていますが、それはそれについてです。 試み: 以下の(記事ではない)参照がWikipediaで見つかります-しかし、初心者にとってそれらがどれほど役立つか、役に立たないかはわかりません。 Batschelet、E。生物学における循環統計、Academic Press、ロンドン、1981。ISBN0-12-081050-6。 フィッシャー、NI。、循環データの統計分析、ケンブリッジ大学出版局、1993。ISBN0-521-35018-2 フィッシャー、NI。、ルイス、T。、エンブレトン、BJJ。Statistical Analysis of Spherical Data、Cambridge University Press、1993。ISBN0-521-45699-1 マルディア、KV。およびJupp P.、Directional Statistics(2nd edition)、John Wiley and Sons Ltd.、2000。ISBN0-471-95333-4 ダウンズ(1972)オリエンテーション統計。Biometrika、59、665〜676 Mardia and Juppの本は、このMathOverflowの投稿にも記載されています。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.