Tukey Median Polish、アルゴリズムはマイクロアレイのRMA正規化に使用されます。ご存知かもしれませんが、マイクロアレイデータは非常にノイズが多いため、すべてのプローブとマイクロアレイの観測を考慮して、プローブの強度を推定するより堅牢な方法が必要です。これは、アレイ全体のプローブの強度を正規化するために使用される典型的なモデルです。
I = 1 、... 、I
Y私はj= μ私+ αj+ ϵ私はj
i = 1 、… 、Ij = 1 、… 、J
ここで、はアレイ上のプローブの変換されたPM強度です。はバックグラウンドノイズであり、通常の線形回帰のノイズに対応すると想定できます。ただし、分布の仮定は制限的な場合があるため、Tukey Median Polishを使用してとの推定値を取得します。これは、アレイの効果から信号、プローブによる強度を分離するため、アレイ全体で正規化する強力な方法です。配列効果正規化することで信号を取得できます L O G I T H jのT H ε I J ε ^ μ I ^ α J α ^ α JYijlogithjthϵijϵμi^αj^ααj^すべてのアレイ用。したがって、プローブ効果とランダムノイズだけが残ります。
前に引用したリンクでは、Tukeyの中央値研磨を使用して、プローブ効果でランク付けすることにより、差異的に発現する遺伝子または「興味深い」遺伝子を推定しています。しかし、論文はかなり古く、おそらく当時は人々はまだマイクロアレイデータを分析する方法を理解しようとしていました。エフロンのノンパラメトリックな経験的ベイズ法の論文は2001年に発表されましたが、おそらく広く使用されていなかった可能性があります。
しかし、今ではマイクロアレイについて(統計的に)多くを理解しており、それらの統計分析についてはかなり確信しています。
マイクロアレイデータはかなりノイズが多く、RMA(中央値ポーランド語を使用)は最も一般的な正規化方法の1つですが、その単純さのためかもしれません。その他の一般的で洗練された方法は、GCRMA、VSNです。関心はプローブ効果であり、アレイ効果ではないため、正規化することが重要です。
ご想像のとおり、この分析は、遺伝子間での情報の借用を利用するいくつかの方法によって恩恵を受けることができました。これらには、ベイズ法または経験的ベイズ法が含まれる場合があります。あなたが読んでいる紙が古くて、これらの技術がそれまで出ていなかったかもしれません。
2つ目のポイントについては、はい、おそらく実験データを変更しています。しかし、私は、この修正はより良い原因のためであり、それゆえ正当化できると思います。その理由は
a)マイクロアレイデータはかなりうるさいです。関心がプローブ効果である場合、RMA、GCRMA、VSNなどによるデータの正規化が必要であり、データ内の特別な構造を利用するのが良いでしょう。しかし、私は2番目の部分を行うことは避けます。これは主に、事前に構造がわからない場合は、多くの仮定を課さない方がよいためです。
b)ほとんどのマイクロアレイ実験は本質的に探索的です。つまり、研究者はさらなる分析または実験のために、いくつかの「興味深い」遺伝子のセットに絞り込もうとしています。これらの遺伝子が強いシグナルを持っている場合、正規化のような変更は最終的な結果に(実質的に)影響を与えるべきではありません。
したがって、変更は正当化される場合があります。ただし、正規化をやり過ぎると誤った結果が生じる可能性があることに注意してください。