タグ付けされた質問 「fraud」

2
統計フォレンジック:ベンフォード以降
サードパーティが作成した科学作品の詐欺、異常、不正行為などを検出するための広範な方法はありますか?(最近のMarc Hauser事件でこれを尋ねる動機がありました。)通常、選挙と会計詐欺のために、ベンフォードの法則のいくつかの変種が引用されています。ベンフォードの法則では、数値がほぼ対数均一であることが求められているため、これがたとえばマークハウザーの場合にどのように適用できるかはわかりません。 具体例として、多数の統計的検定のp値を引用した論文があると仮定します。これらをログの均一性に変換してから、ベンフォードの法則を適用できますか?このアプローチにはあらゆる種類の問題があるようです(たとえば、いくつかの帰無仮説は合法的に偽である可能性があり、統計コードはほぼ正しいだけのp値を与える可能性があり、テストは均一なp値のみを与える可能性がありますヌルの下で漸近的になど)

2
ピアソンの相関検定のp値は、相関係数とサンプルサイズだけで計算できますか?
背景:著者は、著者がサンプルサイズ878からピアソン相関0.754を報告している1つの記事を読みました。相関テストの結果のp値は、「2つ星」有意です(つまり、p <0.01)。ただし、このような大きなサンプルサイズでは、対応するp値は0.001(3つ星が有意)未満である必要があると思います。 このテストのp値は、ピアソン相関係数とサンプルサイズだけから計算できますか? はいの場合、これをRでどのように行うことができますか?

1
このデータに不正なフラグを立てますか?
4つの繰り返しと23の処理を含むランダム化されたブロック設計からいくつかのデータが与えられたとしましょう。データを最初に検査した後、8つの処理ですべての繰り返しが同一であることがわかりますが、これは明らかに誤りです。問題を報告した後、データの「正しいバージョン」を後で送信するデータの責任者からの混乱が原因であることが通知されます。データの修正バージョンは次のようになります。 治療担当者の値 A 1 5727.000 A 2 5400.000 A 3 5800.000 A 4 5473.000 B 1 4618.000 B 2 4844.000 B 3 4966.000 B 4 4496.000 ... Z 1 4329.345 Z 2 4597.275 Z 3 4833.246 Z 4 4199.098 そのようなデータで私の注意を引く最初のことは、問題が報告された8つの処理のみに小数部がないことです(残りの処理はすべて問題ありません)。したがって、私はそれらをより詳しく見て、処理内のサンプル平均から各観測値を差し引くことを決定し、次のようなものを見つけます 治療担当者値デルタ A 1 5727.000 +127 A 2 5400.000 -200 A …

2
投票用紙詰めによる選挙詐欺はどのように可能ですか?
来たるロシアの大統領選挙に関するNPRの話では、投票所の5%に複数の投票用紙を提出する試みを拒否する新しい電子投票箱が装備されると述べました。これは広範な投票箱詰め込みを止めるのに十分ではないという「懸念」がありました(これはほとんどの話のトピックでした)。特別な投票箱の有効性をしばらく無視すると、有権者の5%の「既知の正確な」サンプルは、残りの95%が改ざんされたかどうかを判断するのに十分ではないでしょうか? これらのボックスがなくても、大きな統計的異常を発生させることなく、誤った投票用紙を使用して選挙を確実に不正に行うことはどのように可能ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.