3
特徴選択のための中央値研磨の使用
最近読んでいた論文で、データ分析セクションで次のビットに出くわしました。 次に、データテーブルを組織とセルラインに分割し、2つのサブテーブルを個別に中央値研磨(行と列を繰り返し調整して中央値0にする)してから、単一のテーブルに再結合しました。最後に、テストされた3つ以上のサンプルで、このサンプルセットの中央値から少なくとも4倍に発現が変化する遺伝子のサブセットを選択しました。 ここでの推論にはあまり従わないと言わざるを得ません。次の2つの質問に答えていただけないでしょうか。 データセットの中央値を調整することが望ましい/役立つのはなぜですか?異なる種類のサンプルに対して別々に行う必要があるのはなぜですか? これはどのように実験データを変更しないのですか?これは、大量のデータから多数の遺伝子/変数を選択する既知の方法ですか、それともアドホックですか? おかげで、