独立成分分析の意味を理解する


18

主成分分析の意味を理解するという質問を見て、楽しんでいますが、今では独立成分分析にも同じ質問があります。ICAを理解する直感的な方法について包括的な質問をしたいのですか?

理解したいです。目的を知りたい。私はそれを感じたいです。私は強く信じています:

あなたはそれをあなたの祖母に説明できない限り、あなたは本当に何かを理解していません。
- アルバート・アインシュタイン

まあ、私はこの概念を素人やおばあちゃんに説明することはできません

  1. ICAを選ぶ理由 このコンセプトの必要性は何ですか?
  2. これを素人にどのように説明しますか?

これは返信が遅いことはわかっていますが、次のリンクを提供します。ICAの背後にある数学と推論の部分を把握したいすべての人にお勧めします。これは、ソースの非ガウス分布に関する直感を明確にするのに役立ちました。
mrt

回答:


18

これが私の試みです。

バックグラウンド

次の2つのケースを考慮してください。

  1. あなたはパーティーでプライベートな目です。突然、古いクライアントの誰かが誰かと話しているのを見ると、言葉の一部を聞くことができますが、彼の隣にいる他の誰かがスポーツに関する無関係の議論に参加しているので、まったく聞こえません。あなたは近づきたくありません-彼はあなたを見つけます。パートナーの電話(バーテンダーのノンアルコールビールを納得させるのに忙しい人)を用意して、10メートルほど隣に置きます。電話は録音中です。また、電話は古いクライアントの話と干渉するスポーツの男を録音します。自分の携帯電話を持ち、自分が立っている場所から録音を開始します。約15分後に、2つの録音で家に帰ります。1つは自分の位置から、もう1つは約10メートル離れた場所からです。両方の録音には、古いクライアントとMr. Sportyが含まれています。
  2. あなたは窓の外で見えるかわいいラブラドル・レトリーバー犬の写真を撮ります。画像をチェックアウトすると、残念ながらあなたと犬の間にある窓からの反射が見えます。あなたは窓を開けることができません(そうです、そうです)、あなたは彼が逃げるのを恐れているので外に出ることができません。そのため、わずかに異なる位置から別の画像を(何らかの理由で)取得します。あなたはまだ反射と犬を見ていますが、あなたは別の場所から写真を撮っているので、それらは現在異なる位置にあります。また、ウィンドウは平らであり、凹凸ではないため、画像内の各ピクセルで位置が均一に変化することに注意してください。

問題は、どちらの場合も、会話を復元する方法(1)または犬の画像(2.)で、同じ2つの「ソース」を含むがそれぞれからの相対的な寄与がわずかに異なる2つの画像がある場合です。 。確かに私の教育を受けた孫はこれを理解できます!

直観的なソリューション

少なくとも原則として、どのようにして混合物から犬のイメージを取り戻すことができますか?各ピクセルには、2つの値の合計である値が含まれています!さて、各ピクセルが他のピクセルなしで与えられた場合、私たちの直感は正しいでしょう-各ピクセルの正確な相対的寄与を推測することはできなかったでしょう。

ただし、同じ関係を保持していることがわかっているピクセルのセット(または記録の場合は時点)が与えられます。たとえば、最初の画像で犬が反射よりも常に2倍強く、2番目の画像で犬がちょうど反対の場合、結局は正しい貢献を得ることができるかもしれません。そして、反射が正確にキャンセルされるように、手元の2つの画像を差し引く正しい方法を考え出すことができます![数学的には、これは逆混合行列を見つけることを意味します。]

詳細に飛び込む

2つの信号が混在しているとします

Y1=a11S1+a12S2Y2=a21S1+a22S2

S1Y1Y2S1=b11Y1+b12Y2b11b12S2b21b22

しかし、一般的な信号ではどうやって見つけることができますか?それらは類似しているように見えたり、類似した統計を持っているなどです。したがって、それらは独立していると仮定しましょう。ノイズなどの干渉信号がある場合、または2つの信号が画像である場合、干渉信号は何か他のものの反射である可能性があります(異なる角度から2つの画像を撮影しました)。

Y1Y2S1S2バツ1バツ2

バツ1バツ2S1S2バツ1バツ2bj{aj}{bj}S

{bj}バツ1バツ2

最初にこれを考慮してください。複数の独立した非ガウス信号を合計すると、その合計はコンポーネントよりも「ガウス」になります。どうして?中心極限定理により、2つの独立の合計の密度について考えることもできます。変数。これは密度の畳み込みです。いくつかの独立性を合計すると。ベルヌーイ変数、経験分布はますますガウス形状に似てきます。真のガウス分布でしょうか?おそらくそうではありません(しゃれは意図していません)が、信号のガウス分布をガウス分布に似た量で測定できます。たとえば、過剰な尖度を測定できます。本当に高い場合は、おそらく同じ分散を持ち、過剰な尖度がゼロに近いものよりもガウス性が低くなります。

{bj}バツ1バツ2{bj}

もちろん、これは別の仮定を追加します-最初に2つの信号は非ガウスでなければなりません。


3
+1。良い答えですが、おばあちゃんレベルでは間違いありません(少なくともそれはあなたの平均的な祖母ではありません)。おそらく、より一般的な/直感的な導入によってそれを序文にすることができます(たとえば、「カクテルパーティー問題」の伝統的な線に沿って)。
アメーバは、モニカを復活させる

ありがとう。問題と解決策に関する背景を追加しました。
よき

3

とても簡単です。あなた、あなたのおばあちゃんと家族がテーブルの周りに集まっていると想像してください。より大きなグループの人々は、チャットのトピックがそのサブグループに固有である場所で解散する傾向があります。おばあちゃんはそこに座って、話しているすべての人の雑音を聞きます。それは単なる不協和音のように見えます。彼女が一方のグループに目を向けると、10代/若者のグループでの議論を明確に分離できます。もう一方のグループに目を向けると、成人の人々のチャットを分離できます。

要約すると、ICAは特定の信号(1人または話している人のグループ)を信号の混合(群衆の話し)から分離または抽出することです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.