タグ付けされた質問 「data-mining」

1
検索エンジンのバイアスを検出する方法はありますか?
検索エンジンは、情報ゲートキーパーとしてますます依存するようになっていますが、検索エンジンが結果をランク付けするために使用する基準は、ユーザーには不透明です。ユーザーは、検索結果の品質を犠牲にして関心を引くために、結果がなんらかの方法でバイアスまたは改ざんされていないことを確認できますか? 政府は、政治的に望ましくないと見なされるWebサイトのランキングを削除または下げるように検索プロバイダーに日常的に要求しています。企業は、プロバイダーに支払いをして、特定の結果を他のユーザーよりも高くして、収益を増やすことができます。ファイアウォールは、ユーザーに送信される前に結果を干渉する可能性があります。 一見無害であるように見えるかもしれないランキングアルゴリズムへの無害な変更でさえ、バイアスがかかっているように見えますが、実際には(実際の品質とは関係なく)共通の属性を共有するWebサイトに害を及ぼすように設計されている可能性があります。 一定期間の結果を監視し、「隠された変数」(おそらく政治的な所属)がWebサイトのランキングの変化の推進要因であるかどうかを評価することによって、検索エンジンのバイアスを検出することは可能ですか? 卑劣なプロバイダーは、ターゲットとするWebサイト(およびおそらくランダムなWebサイトも同様にユーザーの注意をそらすため)のランキングを徐々に下げていく可能性があります。プロバイダーが検出なしに導入できるバイアスの制限は何ですか?または、意図的に結果を生成する重み付けされたランク付け基準を誤って選択することにより、そのような干渉を常に隠すことができます(「データスヌーピング」によって)。 ランキング基準が公開された場合、この変更はありますか?検索エンジンが使用する基準をオープンソースにする必要がありますか? これは、CDOなどの複雑な金融商品が売り手によって改ざんされたかどうかを検出することは、最も密な部分グラフの問題を解決することと同等であるという結果を思い出します。 http://www.cs.princeton.edu/~rongge/derivative.pdf ありがとう!
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.