統計とビッグデータ signal-detection

3

信号検出理論から導出されたメトリックを使用せずに信号検出データを分析することは有効ですか？

信号検出実験では、通常、観測者（または診断システム）に信号または非信号を提示し、観測者は提示されたアイテムが信号であるか非信号であるかを報告するよう求められます。このような実験では、2x2行列を満たすデータが生成されます。信号検出理論は、「信号/非信号」の決定が、信号試行が一般に非信号試行よりも高い値を持つ連続性の信号性に基づいているシナリオを表すようなデータを表します。「シグナル」を報告する基準値を選択します。上の図では、緑と赤の分布はそれぞれ「信号」と「非信号」の分布を表し、灰色の線は特定の観測者が選択した基準を表しています。灰色の線の右側の緑の曲線の下の領域はヒットを表し、赤の曲線の下の領域は誤報を表します。灰色の線の左側の緑の曲線の下の領域はミスを表し、赤の曲線の下の領域は正しい拒否を表します。想像できるように、このモデルによれば、上記の2x2テーブルの各セルに分類される応答の割合は、次のように決定されます。緑と赤の分布からサンプリングされた試行の相対的な割合（基本レート）オブザーバーが選択した基準分布間の分離各分布の分散分布間の分散の等価性からの逸脱（分散の等価性は上に描かれています）各分布の形状（両方とも上記のガウス分布）多くの場合、＃5と＃6の影響は、オブザーバーにいくつかの異なる基準レベルで決定を下すことによってのみ評価できるため、現時点では無視します。さらに、＃3と＃4は相互にのみ意味を持ち（例えば、分布の変動性に対する分離の大きさ）、「識別可能性」（d 'としても知られる）の尺度によって要約されます。したがって、信号検出理論は、信号検出データからの2つの特性、つまり基準と識別可能性の推定を禁止しています。しかし、研究レポート（特に医療分野）が信号検出フレームワークを適用せず、代わりに「陽性的中率」、「陰性的中率」、「感度」、「特異性」などの量を分析しようとすることに気づきました。これらはすべて、上記の2x2の表とは異なる限界値を表しています（詳細については、こちらをご覧ください）。これらの限界プロパティはどのようなユーティリティを提供しますか？私の傾向は、それらが基準と識別可能性の理論的に独立した影響を混乱させるので、それらを完全に無視することですが、おそらく彼らの利益を考慮するための想像力を欠いています。

14 diagnostic signal-detection

1

（d-prime）とAUC（ROC曲線下の領域）の間の接続。基礎となる仮定

機械学習では、ROC曲線の下の領域（多くの場合、省略されたAUCまたはAUROC）を使用して、システムが2つのカテゴリーをどれだけうまく区別できるかを要約します。信号検出理論では、d′d′d'（感度指数）が同様の目的で使用されることがよくあります。この2つは密接に関連しており、特定の前提条件が満たされていれば、両者は同等であると思います。の計算は、通常、（例えば、上記のリンクウィキペディアを参照）の信号分布のために正規分布を仮定に基づいて提示されます。ROC曲線の計算ではこの仮定は行われません。これは、しきい値処理可能な連続値の決定基準を出力する分類子に適用できます。d′d′d' ウィキペディアによれば、は2 AUC − 1に相当します。両方の仮定が満たされている場合、これは正しいようです。しかし、仮定が同じでない場合、それは普遍的な真実ではありません。d′d′d'2AUC−12AUC−12 \text{AUC} - 1 仮定の違いを「AUCは基礎となる分布についての仮定を少なくする」と特徴づけることは公正ですか？または、実際にはAUCと同じくらい広く適用できますが、d ′を使用する人々が正規分布を仮定する計算を使用する傾向があるのは、単なる一般的な慣習ですか？私が見逃した根本的な仮定に他の違いはありますか？d′d′d'd′d′d'

13 machine-learning roc auc signal-detection d-prime

2

100％のヒット率確率と0％の誤警報確率を持つd素数

古いアイテムと新しいアイテムの検出を含むメモリタスクのdプライムを計算したいと思います。私が抱えている問題は、一部の被験者のヒット率が1であるか、誤警報率が0であるということです。これにより、確率がそれぞれ100％と0％になります。 dプライムの式はですd' = z(H) - z(F)。ここでz(H)、z(F)はヒット率のz変換と誤警報です。 z変換を計算するには、Excel関数NORMSINV（つまり、z(H)=NORMSINV(hit rate)）を使用します。ただし、ヒット率または誤警報率がそれぞれ1または0の場合、関数はエラーを返します。これは、私が理解しているように、z変換がROC曲線の下の領域を示しているため、数学的に100％または0％の確率が許容されていないためです。この場合、天井性能の被験者のd 'の計算方法がわかりません。 1つのウェブサイトでは、1と0のレートを1-1 /（2N）と1 / 2Nに置き換えることを提案しています。Nはヒットと誤警報の最大数です。別のWebサイトでは、「HもFも0でも1でもない（そうであれば、少し上または下に調整する）」とあります。これは恣意的です。誰かがこれについて意見を持っているか、適切なリソースを私に指摘したいですか？

10 roc excel signal-detection d-prime

2

細胞シグナルデータの時系列のピークの評価

細胞シグナル測定における応答の存在を測定しています。最初に行ったのは、データの時系列に平滑化アルゴリズム（Hanning）を適用してから、ピークを検出することでした。私が得るものはこれです：応答の検出を「ええ、継続的な低下の上昇を見る」よりも客観的にしたいのであれば、どのアプローチが最適でしょうか？線形回帰によって決定されたベースラインからのピークの距離を取得することですか？（私はpythonコーダーであり、統計についてほとんど理解していません）ありがとうございました

9 time-series python signal-detection

5

曲の一部を検出する

うまくいけば、これはあまり主観的ではありません... 音楽スタイルに関係なく、曲のさまざまな「部分」を検出するための取り組みの方向性を探しています。どこを見ればよいかわかりませんが、他のStackOverflowサイトの力を信頼しているので、ここにいる誰かが方向性を示すのに役立つと思いました。基本的に、連続する繰り返しパターンをグループ化し、それらを「パーツ」と呼ぶことで、曲のさまざまなパーツを検出できます。それはそれほど難しいことではないかもしれません-わずかな変動があっても、コンピューターは信号の繰り返しを検出するのにかなり優れています。しかし、「パート」がオーバーラップするのは、ほとんどの音楽でそうであるように難しいです。どのような音楽がこのようなシステムに最も適しているかを言うのは難しいです。ほとんどのクラシックスタイルの交響曲は、処理が最も簡単だと思います。この分野で研究を探す場所についてのアイデアはありますか？

9 signal-detection

タグ付けされた質問 「signal-detection」

タグ付けされた質問「signal-detection」