ロジスティック関数で変換されたガウス確率変数の期待値


10

通常、ロジスティック関数と標準偏差はどちらも表されσます。標準偏差にはσ(x)=1/(1+exp(x))sを使用します。

私はランダムな入力を持つロジスティックニューロンを持っています。その平均μと標準偏差sは知っています。平均との差がガウスノイズで近似できることを願っています。したがって、表記を少し乱用して、生成すると仮定しますσ(μ+N(0,s2))=σ(N(μ,s2))σ N μ s 2の期待値は何ですか?σ(N(μ,s2))標準偏差sは、μまたはと比較して大きい場合と小さい場合があります1。期待値の適切な閉じた形の近似は、閉じた形の解とほぼ同じです。

閉じた形のソリューションは存在しないと思います。これは、畳み込みとみなすことができ、およびロジスティック密度のための特徴的な機能が知られている()が、私は確かにそれがどのように役立つかあまりないです。逆シンボリック計算機はで密度を認識することができませんでした0ロジスティック分布の密度の畳み込みと示唆しているが、単純な基本整数が存在しないことを証明しない標準正規分布、の。より状況証拠:ロジスティックニューロンを含むニューラルネットワークにガウス入力ノイズを追加することに関するいくつかの論文では、これらの論文は閉形式の式も提供していませんでした。πt csch πt0

この質問は、ボルツマンマシンの平均場近似の誤差を理解しようとするときに生じました。

回答:


5

以下は私が最終的に使用したものです:

σ(N(μ,s2))=σ(μ+X)XN(0,s2)

σ(μ+X)=σ(μ)+Xσ(μ)+X22σ(μ)+...+Xnn!σ(n)(μ)+...

E[σ(μ+X)]=E[σ(μ)]+E[Xσ(μ)]+E[X22σ(μ)]+...=σ(μ)+0+s22σ(μ)+0+3s424σ(4)(μ)+...+s2k2kk!σ(2k)(μ)...

収束の問題があります。ロジスティック関数には極があり、なので、、奇数です。発散は、プレフィックスが役に立たないことと同じではありませんが、が有意である場合、この系列近似は信頼できない可能性があります。exp(x)=1x=kπikP(|X|>μ2+π2)

以来、我々は、誘導体書き込むことができるの多項式として。たとえば、 andです。係数はOEIS A028246に関連しています。σ(x)=σ(x)(1σ(x))σ(x)σ(x)σ=σ3σ2+2σ3σ=σ7σ2+12σ36σ4


4

ここにあるのは、ロジット正規(またはロジスティック正規)分布に従うランダム変数です(ウィキペディアを参照)。つまり、です。ロジット正規分布のモーメントには、解析解がありません。logit[x]N(μ,s2)

しかしもちろん、数値積分によってそれらを得ることができます。Rを使用する場合、必要なものがすべて含まれているlogitnormパッケージがあります。例:

install.packages("logitnorm")
library(logitnorm)
momentsLogitnorm(mu=1, sigma=2)

これにより、

> momentsLogitnorm(mu=1, sigma=2)
      mean        var 
0.64772644 0.08767866

そのため、平均と分散を直接提供する便利な関数さえあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.