検索エンジンのバイアスを検出する方法はありますか？

検索エンジンは、情報ゲートキーパーとしてますます依存するようになっていますが、検索エンジンが結果をランク付けするために使用する基準は、ユーザーには不透明です。ユーザーは、検索結果の品質を犠牲にして関心を引くために、結果がなんらかの方法でバイアスまたは改ざんされていないことを確認できますか？

政府は、政治的に望ましくないと見なされるWebサイトのランキングを削除または下げるように検索プロバイダーに日常的に要求しています。企業は、プロバイダーに支払いをして、特定の結果を他のユーザーよりも高くして、収益を増やすことができます。ファイアウォールは、ユーザーに送信される前に結果を干渉する可能性があります。

一見無害であるように見えるかもしれないランキングアルゴリズムへの無害な変更でさえ、バイアスがかかっているように見えますが、実際には（実際の品質とは関係なく）共通の属性を共有するWebサイトに害を及ぼすように設計されている可能性があります。

一定期間の結果を監視し、「隠された変数」（おそらく政治的な所属）がWebサイトのランキングの変化の推進要因であるかどうかを評価することによって、検索エンジンのバイアスを検出することは可能ですか？

卑劣なプロバイダーは、ターゲットとするWebサイト（およびおそらくランダムなWebサイトも同様にユーザーの注意をそらすため）のランキングを徐々に下げていく可能性があります。プロバイダーが検出なしに導入できるバイアスの制限は何ですか？または、意図的に結果を生成する重み付けされたランク付け基準を誤って選択することにより、そのような干渉を常に隠すことができます（「データスヌーピング」によって）。

ランキング基準が公開された場合、この変更はありますか？検索エンジンが使用する基準をオープンソースにする必要がありますか？

これは、CDOなどの複雑な金融商品が売り手によって改ざんされたかどうかを検出することは、最も密な部分グラフの問題を解決することと同等であるという結果を思い出します。

http://www.cs.princeton.edu/~rongge/derivative.pdf

ありがとう！

ds.algorithms data-mining

— 手。
ソース

これはクールな質問ですが、1つのcstheory関連の質問のみを確認するように修正します。最も明らかなのは、これを参照リクエストにして、「これをすでに見た人はいますか？」と尋ねることです。誰もいないと確信している場合は、「これを正式にモデル化するにはどうすればよいですか？」良い質問かもしれません。あまりにも多くの質問を抱えており、それらの一部が潜在的に非理論的なものである場合、「実際の質問ではない」として閉じられる可能性があります。

— Artem Kaznatcheev

ランキングスキームを公開すると、スパマーによる攻撃にさらされることに注意してください。興味深い変種は次のようになります。「ランキングに「公開キー」に相当するものはありますか」

— Suresh Venkat 2012年

@SureshVenkatは、「ランキングスキームを公開することで攻撃に備える」と言いますが、あいまいさによって<s>セキュリティ</ s>の公平さを示唆しているようです;）。

— Artem Kaznatcheev

いいえ。しかし、それが私がランキング方式の公開鍵バージョンについて尋ねた理由です。

— Suresh Venkat、2012

検索プロセスに参加している当事者以外は悪意のあるユーザーであることが想定されているため、通常の解決策は、プロセスを利己的なユーザーとのゲームとしてモデル化することです。正しくモデル化されていれば、検索エンジンがそのようなことをすることが有益であるかどうかを知ることができます。次に、そのような改ざんを防止するメカニズムを設計できます。

— ヘリウム

これは明らかに非常に自由回答型の質問ですが、話題を続けるために、ここでは「公平性」の考え方とそれを実施する方法への1つのCS理論アプローチを示します。

「意識による公正さ」Dwork、Hardt、Pitassi、Reingold、Zemel http://arxiv.org/abs/1104.3913

— アーロン・ロス
ソース