タグ付けされた質問 「normalization」

通常「正規化」とは、データを再表現して、値を指定された範囲内に収めることを意味します。

1
Silver&Dunlap 1987の複製がうまくいかないのはなぜですか?
Silver&Dunlap(1987)を複製しようとしています。私は単に平均相関を比較している、または平均z変換相関と逆変換を比較しています。彼らが見つけたバイアスの非対称性を再現していないようです(逆変換されたzはrsよりも母集団の値に近くありません)。何かご意見は?1987年のコンピューティング能力が十分に空間を探索しなかった可能性はありますか? # Fisher's r2z fr2z <- atanh # and back fz2r <- tanh # a function that generates a matrix of two correlated variables rcor <- function(n, m1, m2, var1, var2, corr12){ require(MASS) Sigma <- c(var1, sqrt(var1*var2)*corr12, sqrt(var1*var2)*corr12, var2) Sigma <- matrix(Sigma, 2, 2) return( mvrnorm(n, c(m1,m2), Sigma, empirical=FALSE) ) …

3
ロジスティック回帰で異なる分布の予測子変数をどのように処理しますか?
x1とx2を指定してyを予測するためにロジスティック回帰を使用しています。 z = B0 + B1 * x1 + B2 * x2 y = e^z / (e^z + 1) ロジスティック回帰は、変数のスケールが大きく異なる場合にどのように処理されるはずですか?変数の高次係数を使用してロジスティック回帰モデルを構築することはありますか?私はこのようなものを想像しています(2つの変数について): z = B0 + B1 * x1 + B2 * x1^2 + B3 * x2 + B4 * x2^2 または、ロジスティック回帰を使用する前に、x1とx2の値を単純に正規化、標準化、または再スケーリングする正しい答えは何ですか?

3
ベイズ正規化定数の直感
スクリーニングの可能性が80%、事前確率が10%、偽陽性率が50%の一般的に言及されているマンモグラフィスクリーニング問題、またはそのバリアントでは、陽性スクリーニングが癌を示すという条件付き事後確率は簡単に説明できます。存在はわずか15%です。これは、n = 1000、真の癌症例= 100、検出された癌= 80、および偽陽性= 450のカウントによって最も簡単に示されます。陽性スクリーニングが癌の存在を示す確率は、真陽性/(真陽性+誤検知)または80 /(100 + 450)= 0.145または15%。 直感は、真陽性と偽陽性の合計がすべての結果のサブセットを構成するため、真陽性は真陽性と偽陽性の合計に条件付けられるということです。これは、偽陰性と真陰性が計算から除外されるため、条件付きセットがサブセットになるためです。 問題を二項尤度と事前ベータの連続ケースにシフトすると、正規化定数は真陽性の項(p =比例)のように積分になります。 ∫10(nx)px(1−p)n−xΓ(a+b)Γ(a)Γ(b)pa−1(1−p)b−1dp∫01(nx)px(1−p)n−xΓ(a+b)Γ(a)Γ(b)pa−1(1−p)b−1dp\int_0^1 {\left( {\begin{array}{*{20}{c}}n\\x\end{array}} \right)p_{}^x{{(1 - p)}^{n - x}}\frac{{\Gamma (a + b)}}{{\Gamma (a)\Gamma (b)}}p_{}^{a - 1}{{(1 - {p_{}})}^{b - 1}}} dp % MathType!MTEF!2!1!+- % feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn % hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr % 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq-Jc9 % vqaqpepm0xbba9pwe9Q8fs0-yqaqpepae9pg0FirpepeKkFr0xfr-x % fr-xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 % qadaWdXaqaamaabmaapaqaauaabeqaceaaaeaapeGaamOBaaWdaeaa % peGaamiEaaaaaiaawIcacaGLPaaacaWGWbWaa0baaSqaaaqaaiaadI % …

3
同じ分布の2つのデータセットを使用しているときに、いつデータを正規化するのですか?
2つのデータセットD1とD2があるとします。両方とも同じ基礎となる分布Xからサンプリングされています。ニューラルネットワークをトレーニングするためにそれらを使用したいと思います。特徴はすべて範囲[0;の符号なし整数です。2 ^ 64]。 機能のスケールが大きく異なるため、シグモイド関数と組み合わせてzスコアの正規化を使用することにしました。つまり、Zスコアの正規化されたデータをロジスティック関数に送り、特徴を[0; 1]範囲。 この時点では、どの時点でデータを正規化するかわかりません。 1.)D1を使用して、D1のみを考慮して得られるmean_1とstd_dev_1で正規化します。D2のプロセスを繰り返し、mean_2とstd_dev_2を使用して正規化します。次に、2つのデータセットを使用してネットワークを順次トレーニングします。 2.)D1とD2を追加してセットD3を取得し、データセット全体(mean_3とstd_dev_3)を計算して正規化します(D1 + D2)。次に、それを使用してネットワークをトレーニングします。 ここで2つの質問: a)2つの方法で同様の結果が得られますか?D2がD1より後に利用可能になる可能性があり、データセット全体でネットワークを再トレーニングする必要があるかどうかを知る必要があるため、私にとって特に重要です。 b)訓練されたネットワークで推論を行う場合、新しい入力を正規化するためにどのパラメーターを使用する必要がありますか?たとえば、mean_3とstd_dev_3を使用する必要がありますか? 編集:2つのデータセットの組み合わせの平均と標準偏差は、元のデータセットの平均と標準偏差から計算できることがわかりました。つまり、(理論的には)それらを順次トレーニングし、それらの分布パラメーターを組み合わせて推論の入力を正規化することができます。

2
トリプレットネットワークのL2正規化の目的
顔認識のためのトリプレットベースの遠隔学習は非常に効果的です。紙の特定の側面に興味があります。顔の埋め込みを見つける一環として、L2正規化を使用して隠しユニットを正規化します。これにより、表現が超球上にあるように制約されます。なぜそれが役立つか必要なのですか?

2
画像スタイル転送で使用される重み正規化手法
畳み込みニューラルネットワークを使用した紙の画像スタイル転送を実装しようとしています。セクション2-深い画像表現で、著者は次の重み正規化手法について言及しています。 画像と位置に対する各畳み込みフィルターの平均アクティブ化が1に等しくなるように重みをスケーリングすることにより、ネットワークを正規化しました。このような再スケーリングは、出力を変更せずにVGGネットワ​​ークに対して実行できます。これは、線形線形活性化関数のみを修正し、機能マップに対する正規化やプールは含まないためです。 以前に尋ねた関連質問から、著者がILSVRC検証セットの画像からのアクティベーション値を使用して重みを正規化していることがわかりました。 私は自分でそれを思い付くことができなかったので、そのような正規化を実行することの数学的な定式化を知りたかった。 問題の私の理解によると、私はアクティベーションマップ(X)を持ち、それに対応して、前のレイヤーのKアクティベーションマップ(L)と次元3x3xKの重み行列(W)を持っています。 WそれはXを生成します。今度は、検証セットのすべての画像についてレイヤーLのすべてのニューロンの活性化値をキャプチャしたら、検証セットのすべての画像にわたってXのすべてのニューロンの平均を1にすることです。どういうわけかWを調整することによって それを実現するために私がWに何をすべきかわからなかった。 また、これを最初のレイヤーの重みを正規化し、次に新しい機能マップを使用してレイヤーの重みを正規化することにより、カスケード(順次)でこれを実行するかどうかを確認したかったすべてのアクティベーションマップの元の事前トレーニング済みの重みとしての前のレイヤーの値?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.