信号源の2つの個別の母集団が混在している場合、独立したコンポーネント分析を使用できますか?


10

私は(ほとんど)独立成分分析(ICA)が1つの母集団からの信号のセットでどのように機能するかを理解していますが、私の観測(X行列)に2つの異なる母集団(異なる手段を持つ)からの信号が含まれている場合、それを機能させることができません。それがICAの固有の制限なのか、それとも私がこれを解決できるのか疑問に思っています。私の信号は、分析されている一般的なタイプとは異なります。私のソースベクトルは非常に短い(たとえば、3つの値が長い)のですが、多数(たとえば、1000)の観測があります。具体的には、幅広い蛍光信号が他の検出器に「波及」する可能性がある3色で蛍光を測定しています。私は3つの検出器を使用しており、粒子に3つの異なるフルオロフォアを使用しています。これは非常に貧弱な分解能分光法と考えることができます。任意の蛍光粒子は、3つの異なるフルオロフォアのいずれかの任意の量を持つことができます。ただし、蛍光体の濃度がまったく異なる傾向がある混合粒子のセットがあります。たとえば、1つのセットには通常、多くのフルオロフォア#1とほとんどないフルオロフォア#2がありますが、他のセットには#1がほとんどなく#2がたくさんあります。

基本的に、1つのフルオロフォアからの信号の一部を別のフルオロフォアの信号に追加するのではなく、スピルオーバー効果をデコンボリューションして、各粒子の各フルオロフォアの実際の量を推定します。これはICAで可能であるように思われましたが、いくつかの重大な失敗(行列の変換は、信号の独立性を最適化するために回転するのではなく、母集団の分離を優先するようです)の後で、ICAが適切なソリューションではないのか、それともこれに対処するために、他の方法でデータを前処理します。

1つのデータセットに2つの母集団があるFastICAアルゴリズムの結果

グラフは、問題を実証するために使用した私の合成データを示しています。2つの母集団の混合からなる「真の」ソース(パネルA)から始めて、「真の」混合(A)行列を作成し、観測(X)行列を計算しました(パネルB)。FastICAはS行列(パネルCに表示)を推定し、私の真のソースを見つける代わりに、2つの母集団間の共分散を最小化するためにデータを回転させるように見えます。

提案や洞察を探しています。

回答:


1

概念的には、ICAが機能するためには、SAME現象をN回観測する必要があり、これらの信号(混合物)を<N個の成分に分解しようとします。

あなたの説明から、各検出器は異なるエネルギー粒子を数えています。つまり、「混合」は実際にはすでに3つの異なる信号です。4つの異なるマイクの録音を使用して、2つの異なる(相互に独立した)音源を区別する例を考えてみましょう。この場合、各マイクは両方の音源の(異なる)合計を録音しています。あなたのケースでは、あなたが観察している現象のため、各「マイク」(検出器)は両方のソースの(異なる)合計を記録していませんが、むしろ各ソースを別々に記録します(ほとんどの場合)。

ご説明のとおり、同じイベントが複数の検出器によって記録される場合があります(波及)。この場合、ICAを要求すると、その合計を分解しようとします。

したがって、おそらく、3つの異なる検出器のそれぞれによって記録されたイベント間の相互相関を、スピルオーバーの量の指標として取得するなど、もっと単純なものを検討する必要があります。

ただし、この場合、観測の「トリプレット」を1000個調べる代わりに、3つの異なる時系列を作成します。検出器ごとに1つの時系列。各検出器のイベント(時間内)を記述します。

検出器と装置が十分に速い場合、この信号は指数関数的に減衰する一連のパルスのように見えます。そうでない場合、信号は、システムのインパルス応答を畳み込んだ一連のパルスのようになります(平滑化バージョン)。どちらの場合も、同じイベントが複数の検出器で検出された場合、これらの検出器の出力は同時にレベルが上がります(相互相関または他の形式の相関メトリックが増加します)。最初のケース(高速システム)では、その上昇を検出しやすくなります。

したがって、この問題は、イベントを正しくカウントするために、そのイベントを割り当てる検出器を決定する必要がある問題になりました。これを行うには(ICAを使用せずに)いくつかの方法がありますが、検出器のスペクトル応答(パルス振幅VSエネルギーまたは電圧出力VSエネルギー)を知っている必要があります。次に、検出器の応答の各パルスの「重み」を調べることにより、カウントされた粒子の重み付き合計を作成できます。または、パルスに「ウィンドウ」を適用することもできます。つまり、検出器のピーク応答の周囲の鋭いしきい値を考慮し、そのような(通常は高い)パルスを生成するイベントのみをカウントします。検出器のピーク性能の周りの短い領域を考慮すると、スピルオーバーによって作成された(低い)パルスが拒否されます。

これがお役に立てば幸いです。私はあなたの設定を正しく理解したと思います。


0

「信号」がICAに適したタイプではないようです。ただし、特に各フルオロフォアタイプから予想される個別の信号(エネルギーレベルまたは波長)がわかっている場合は、クラスター化アルゴリズムのメリットがあると思われます。理想的な合成クラスターを作成し、それと観測データを共クラスター化できます。クラスターの量やその他のパラメーターを変化させることにより、各フルオロフォアのスピルオーバーを追加のクラスターとしてお互いに飛び出させることができるはずです。(k-meansとは対照的に)スペクトルまたは階層的なクラスタリング手法がこれに最適です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.