タグ付けされた質問 「bioinformatics」

分子生物学、遺伝学、ゲノミクスなどの分野のデータを整理、維持、分析することを含む、コンピューティングと生物科学の岐路に立つ分野

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

1
ランダムウォークは正確に何をしますか?
正直なところ、私はこの質問に関する多くのWebサイトと回答を読みましたが、理解しやすい簡単な言葉では説明していません。私がしたいのは、ランダムウォークの機能と、それを遺伝子セット濃縮分析にどのように使用できるかを理解することです。 ここに公開された論文があります。 誰かがそれを簡単な言葉で説明できますか?

1
訴訟でのDNAの使用
私は現在、新聞を見つけた次の記事に基づいて、ニールオーウェンの次のケースを研究しています。 「20歳の学生は、イギリスの犯罪歴で最大のDNA検査プログラムの1つを行った後、女子生徒の残忍なレイプと殺害のために昨日終身刑を言い渡されました。ニールオーウェンは彼の遺伝子指紋が敷地内で2000人の男性を大量DNAスクリーニングした後、現場で発見されたDNAと一致しました。彼は犠牲者の家から100ヤードしか住んでいませんでした。実験室での実験では、他の誰かが1億6千万人に1人の割合で殺人の可能性があることが明らかになりました。」 ここでまず第一に、私はここで検察官の誤りに問題があることを認識しています。1億6,000万分の1は、実際にP(一致する血液型の無罪)を指す場合、P(一致する血液型の証拠)として解釈されるためです。しかし、私の質問は、防衛の推論に言及しています。 弁護人はイギリスには約3,000万人の男性がいると指摘し、オーウェンが有罪であった正しい確率は約16/19であり、合理的な疑いを超えて有罪判決を下すには十分高くないと主張した。だから私の二つの質問は 1. 16/19という数値が計算されたと思いますか?(人口3,000万人、1億6000万分の1の確率が使われたと思いますか?) 2.どのような暗黙の仮定がなされましたか、そしてそれらはどのくらい妥当ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.