クライアントは、ポルノのために作業機械を選別することを望んでいます。出来ますか?


30

長年のクライアントが、ポルノのために彼らの作業機械をスクリーニングするのを手伝うように私たちに頼みました。デリケートな素材が見つかった場合、彼らは責任を心配しています。彼らの主な関心事(明白な理由のため)は、ビデオ、オーディオ、および画像ファイルです。可能であれば、不適切なコンテンツがないかテキストベースのドキュメントをスキャンしたいと考えています。彼らは露骨に違法で始まり(詳細をリストする必要はない)、明らかに不快なものに下がっており、一部の人々にとって不快なものも含めて、非営利コンテンツの階層を持っています-ランジェリー広告、ジョークカードお尻の割れ目、ハウィーマンデルに関連するもの。

私の質問は:

  • これは倫理的ですか?私は、すべての従業員が自分の作業機械が会社に属し、検索の対象であることに法的に同意しているからだと思います。上映は、仕事に持ち込まれたパーソナルマシンでは行われません。
  • 実行可能ですか?私は多くの画像処理/インデックス作成を行ってきましたが、これは全く新しい複雑な世界のようです。
  • ポルノを発見するための成功したテクニックへの参照はありますか?
  • 何かが発見されたときに結果をアーカイブするのは適切ですか?

29
これをテストするために誰のポルノが使用されるのでしょうか?
ChaosPandion

12
このプロジェクトのテスターに​​なりたい!!
Mayank

56
4chanで見つけたすべての画像を投稿するスクリプトを作成します。他のメンバーが「MOAR!」と答えた場合、あなたはそれがポルノであることを知っています。スクリプトが禁止された場合、おそらくCPです。
user281377

8
これにはすでに数千万の商用製品があると考える必要があります。
GrandmasterB

34
正直な質問:これは実際にありそうな問題ですか?職場のコンピューターでポルノ?つまり…誰がそれをしますか?さらに、偶然のポルノコンテンツをどのように扱うつもりですか?私のGFは最近、職場のPCでウイルスを使用して、Googleの任意のクエリをポルノサイトにリダイレクトし、「python.org」ではなく「python.com」[NSFW!]と誤って入力することがよくあります。実際には問題です。これは、会社におけるより根本的な信頼や専門性の問題を裏付けていると思います。コンピューターを検索する代わりに、それに対処します。
コンラッドルドルフ

回答:


125

これを行うには、90%のHeadology、10%のソフトウェアを使用します。

まず、従業員のコンピューターを静かにスキャンし、各従業員のファイルとサイズのデータ​​ベースを構築します。

その後、すべてのPCで疑わしいコンテンツをスキャンするというメモを漏らします。つまり、ボスにはポルノなどを特定できるShazamのようなプログラムがあります。

その後、数日後、コンピューターでファイルとサイズを再度スキャンします。削除されたファイルを見てください、それらは映画または画像ファイルですか?そして、それらはあなたが注視する必要がある従業員です。

これらの従業員のPCで画像や映画を定期的にスキャンし、疑わしいコンテンツがないか手動で確認します。


9
そして、+ 1を言及するためのトポロジ。
TRiG

5
@Binary:2段階のアプローチは実に印象的です。
マチューM.

2
+1おばあちゃんへの参照のために私から!
sbi

2
@Anonymousあなたがそれにいる間。Visual BasicでGUIを作成して、IPアドレスを追跡できるかどうかを確認します。youtube.com/watch?v=hkDD03yeLnU。しかし、真剣に、これはいくつかの二流のテレビ番組の脚本をつけるための素晴らしい方法です。
エヴァンプライス

2
なんてひどい考えだ!愛してる♥
チャニ

75

これは明らかなニューラルネットワークタスクです。最初に、会社の専門家によって選択された画像の大規模なトレーニングセットが必要です。

より効果的な解決策は、次の週/月/何でもポルノのためにみんなのマシンをチェックすることを発表し、ディスクを行使するシンプルなアプリを書くことです。その時までに機械が掃除されていることを保証します。


ps-いくつかの「深刻な」ポイント-実際に何も見つけたくありません。

ブラウザーのキャッシュでいくつかの画像を見つけた場合、おそらくそれらは悪いリンクまたは危険なポップアップをヒットします-教師がwhitehouse.comを解雇したことを覚えていますか?あなたがこのために彼らを解雇/懲戒した場合、労働者/組合からの反発があるでしょう。従業員が質問を調査したり、オンラインで価格を確認したりする前に、すべてのクリックを承認のために法務部門に提出する必要がある場合、会社はどのように機能しますか?

マシン上で大量のポルノを見つけた場合、その従業員によってそこに置かれたことをどのように証明しますか?法廷で立ち上がるようなセキュリティおよび監査システムはありますか?システム管理者がそこに配置できず、ユーザーのファイルのように見せることができなかったOSを使用していますか(あるいは知っていますか)?

さらに、私の経験では、ポルノ貯蔵庫の最も一般的な場所は、CxOと上級VPのラップトップです。

事前にファイルが消失するように調整することをお勧めします。


+1-私はこれを%ベースの人間のチェックと組み合わせますが。たぶん、実際の検査のためにワークステーションの0.1%をランダムに選択します。
ドリュー

@nikie:Martinはトレーニングセットについて冗談を言っていました。
アンドリューグリム

これは非常におもしろい解決策であり、正確な解決策です:)
crosenblum

10
待つ。CEOのラップトップにポルノの隠し場所を置いたことをどうやって知ったのですか?
ヤープ

1
マシンがスキャンされる可能性に直面したときに、人々が本当にすべてのポルノを削除してくれたら驚くでしょう。プログラマーはおそらくそれを行うでしょうが、IMEの他の人々は本当に、そのようなことに関しては、「奇妙」です。ただし、これをBinaryのアイデアと組み合わせて、多くのMBが削除されたマシンを詳しく見ることができます。それにもかかわらず、+1私はあなたが本当に何かを見つけたくないという観察について。
sbi

8

この制御のアプローチは、従業員とIT担当者の両方にとって確かに苦痛です。従業員のマシン内に何かが入ると、それを検出する確実な方法はありません。そもそも機械に侵入するのを止める必要があります。
このための最もよく知られている方法は、明らかに訪問できるサイト/ドメインの制御です。そのようなリストは、ネット上のどこかで利用可能でなければなりません。これ以外に、従業員がダウンロードした画像やビデオの数、どこから来たのかを追跡することもできます。
素材が外部ハードドライブなど、Web以外から取得される可能性があります。システムの月に1回のランダムスキャンがあり、ビデオや画像の一部をランダムに選択して手動で確認できます。どうやってそれができるのか分かりません。しかし、画像とビデオのチェックの自動化は確かに範囲外であり、間違いがあります。
実際、従業員が個人的なことをするのを制限するという考えはあまりありません。これについて従業員を信頼する必要があります。従業員はオフィスで忙しくして、この時間を確保できないようにする必要があります。もっと心配なのは、従業員が自分の仕事をしていないことです。または、クラックまたはハッキングされたソフトウェアをインストールしましたか?


1
開発者やその他のクリエイティブな人々には、ロックダウンされたマシンを使用すべきではないことに同意します。しかし-と、私はこれを言うとき私を信頼-ワークフロー文書を処理200人の+従業員を持っているとき、あなたはそれらの人を与えるためにしたくない何もブラウザを含め、それらをそらすことができ、およびを。はい、90%の人々は懸命に働いており、気を散らすことはありませんが、それはあなたが小便を引いて非生産的になる20人以上のゴブシットがあることを意味します。
バイナリウォーリアー

6
とにかく、これらの10%は非生産的です。ウェブサイトを閲覧していない場合は、ゲームをプレイしたり、読書をしたり、ふざけたり、退屈しているなど)。
8

2
人々は仕事を成し遂げるか、成し遂げません。同様のタスクを200回実行して測定できる場合、それらは簡単に見つかります。
JeffO

2
米国では、会社のコンピューターでのポルノに関する法的問題があり、児童ポルノに関する深刻な法的問題があります。ポルノ禁止のポリシーを持ち、それを避けるための措置を講じることが最も安全です。
デヴィッドソーンリー

7

市場には、さまざまな形式の「コンテンツフィルタリング」を実行する製品が多数あります。(いくつかの明白な用語でのGoogle検索は、いくつかの明白な候補を投げ出します。)これらの製品のいずれかを使用することは、多くのスキャン/フィルタリングソフトウェアをゼロから構築するよりもおそらく良い考えです。もう1つのオプションは、国境をただ見ることです。たとえば、外部の電子メールとWebトラフィックを監視します。繰り返しますが、この種のことを行う製品があります。

会社が「悪いもの」についてコンピューターをスキャンすることは倫理的であることは間違いありませんが、これは問題がないという意味ではありません。

創刊:

  • 「不快なコンテンツ」とは何かを決定するのは主観的です。
  • 「裸体の描写」を含む(言う)映像やビデオを検出するためのソフトウェアは(おそらく)信頼性が低く、誤検知や誤検知につながる可能性があります。

つまり...これは、顧客の組織内の誰かが「ヒット」を確認する必要があることを意味します。それにはお金がかかります。

2番目の問題:無実の説明があります。このファイルは、偶然にダウンロードされた可能性があります。または、意欲的な同僚によって植えられた可能性があります。無実の説明がある場合、顧客の組織は、彼らが何をするか、何を言うかを注意深くする必要があります。(OKこれは本当にあなたの問題ではありませんが、逆流の一部を警戒するかもしれません。)

3番目の問題:会社が好ましくない資料を監視する権利を持っているにもかかわらず、多くの従業員はこれを不快に思っています。そして、彼らが遠すぎる場合、これは従業員の士気に影響を与えます。一部の従業員は「歩く」ことになります。他の人は抗議行動を取るかもしれません...例えば、多くの誤検知を作成しようとすることによって。(繰り返しますが、あなたの問題ではありませんが...)

第4の問題:人々は、好ましくない素材を暗号化するか、ポータブルメディアやリムーバブルメディアに置くなどして隠すことができます。


1
OPは、これは責任問題のためであり、米国では非常に理にかなっていると述べた。それは、必ずしも人々を非難するのではなく、コンピューターから物を取り出すことを意味します。
デヴィッドソーンリー

それ以上だったと思います。質問の「仕事用ではない」コンテンツのリストの末尾を検討してください。誰かに「議題」...持っているように聞こえる
スティーブンC

@David:それは常に人々を非難することです。潜在的な責任の問題がある場合、非難する人を見つける(「この人は会社のポリシーに違反しており、それを証明できるので、会社としてではなく個人的に責任がある」)が標準的な働き方になります。実際、それは多くの企業の責任者のほとんどが時間の大部分を費やしており、間違っている可能性のあるものを責めようとする人々を見つけようとし、自分が見つけたトラブルに誰も責任を負わせないことを保証していますインチ
jwenting

6

フランスの法的側面について:

上司はコンピューターとインターネット接続を所有しています。

しかし、従業員のプライバシーは侵害されません。コンピューター上のディレクトリにPERSONALというラベルが付いている場合、上司はそのディレクトリをスキャンできません。

それを回避する唯一の方法は、従業員が違法な資料を保管している証拠の要素を取得し、裁判所にコンピューターのスキャンを要求させることです(フランスではポルノは違法ではないことに注意してください)


著作権で保護された素材である場合を除き、盗難と見なされる場合があります。
TRIG

6
フランスでは、プライベートコピーの例外の概念があります。著作権で保護された素材をコピーすることはできませんが、コピーがプライベートに使用されている場合、著作権所有者は何も主張できません。
ムーヴィシエル

私はフランスに住みたいです...フランス語が話せないのを除いて!
匿名タイプ

5

従業員が自分の作業機械が会社のものであり、検索の対象であることに同意した場合、はい、これは合法です。証拠として、ファイルのアーカイブが必要になる可能性が最も高いでしょう。

実際に資料を見つける方法については。あなたは出来る:

  1. 何よりもまず、特定の単語セット(ポルノ、レズビアンなど)のファイル名をスキャンします
  2. 同じ単語セットのテキストドキュメントをスキャンする
  3. 画像の場合、画像の平均色を見つけることができ、その色が「肌」色と呼ばれる範囲内にある場合は、画像にフラグを立てます(これらのフラグ付き画像をダブルチェックする必要があります)。浜辺の家族写真になってしまう画像について誰かに報告したくないでしょう。

コンピューターに入るときにファイルをスキャンする場合(たとえば、すべての作業マシンにプログラムをロードし、フラグが立てられたケースを中央データベースに記録する)、それがあまりに目立たないと思います(露骨な不信以外は)雇用主は明らかに従業員のために持っています)。

ビデオファイルについては、100%確信はありません。おそらく画像スキャンと同様のアプローチ(ランダムなフレームを選択し、特定のレベルの「肌色」をスキャンします)。

オーディオファイルをスキャンすると、音声認識が行われるように思えますが、これはまったく別のワームです。ただし、ファイル名のスキャンは簡単で、ドキュメント、画像、ビデオと同様に実行できます。


ええ、私は同じ線に沿って考えていました。肌の色合いは、すべての品種で難しいです。誰かの頭の大きな古いショット(私のグラバターのような)は言うまでもなく、肉対非肉比の警告をトリガーする可能性があります。しかし、素晴らしいスタートです。
スキャントロジャー

誤検知のリスクが大きすぎます(関係するビジネスに一部依存します)。
11

ほとんどの人間の肌の色調が特定の範囲に収まる色空間があります。正しく思い出せばYCbCr。画像をブロックに分割し、ほとんどのブロックで平均ピクセル値が範囲内にある場合、「スキン」写真としてフラグを立てます。
Vitor Py

別の問題があります。ビデオのチェックを担当する人があなたを訴えるかもしれません。私は確かにそれをしたくありません。(すべてのポルノがすべての人々の好みに合うわけではありません。)
クリストファー・マーハン

グリーンダムは(はい、東のビッグブラザー政府からの)その顔検出機能のためのOpenCVのを使用することが主張されています。これにより、肌の色調の検出と組み合わせた場合でも、依然として多くの偽陽性が生成されます。
-rwong

4

@Ryanが言ったように、画像解析は色解析に焦点を合わせることができます。

実現可能性?私の妹は、政府の領域で働いており、毎年何らかの形で監査を受けています。かつてはポルノの分野でした。彼女(地質学者)には、いくつかの偽陽性(ピンク色の岩)がありました。



3
  • これは倫理的ですか?

従業員の実装と合理的な期待に依存します。たとえば、ソフトウェアがネットワークに接続されたマシンをスキャンする場合、不正なマシンのプラグインを防ぐためにインフラが必要とする追加の要件があります(それは明らかなはずですが、私が見たネットワークではしばしば見落とされています)。

  • 実行可能ですか?私は多くの画像処理/インデックス作成を行ってきましたが、これは全く新しい複雑な世界のようです。

すべての従業員を薬物検査することは可能ですか?そうかもしれませんが、その価値には疑問があります。ランダム化します。従業員は、自分のマシンがいつでも不適切なコンテンツをスキャンされる可能性があることを知らせてください。

  • ポルノを発見するための成功したテクニックへの参照はありますか?

私はこれに触れていません。ユーモアのセンスを抑えられないと思います。ただし、テキストを検索するときは、スカンソープの問題に注意してください。

  • 何かが発見されたときに結果をアーカイブするのは適切ですか?

これは私に最も関心があり、弁護士に尋ねます。違法なコンテンツを見つけた場合、技術的に開示する法的義務がある可能性があります。それは悪いことです。特にユーザーが自分の本当の過ちにさらされていない場合はなおさらです。あなた(クライアント)は、これをどのように扱うかについての本当の法的助言を必要とします。人事部と弁護士を関与させる。


2

純粋に技術的な観点から:これは、オブジェクトカテゴリの認識の問題のように聞こえます。私はそのようなことは一度もしていませんが、私が読んだことから、最先端のカテゴリ認識システムは次のように機能します:

  • 最初に、多数の関心点を検索します(たとえば、ハリスコーナーディテクター、スケールスペースでのLoG / DoGフィルターの極値を使用します。一部の著者は、ランダムな点を選択することを提案します)
  • 次に、各ポイントにフィーチャー変換を適用します(SIFT、SURF、GLOHなど)
  • 見つけたすべての機能をヒストグラムにまとめます(Bag-Of-Features)
  • 標準の機械学習アルゴリズム(サポートベクターマシンなど)を使用して、多数のトレーニング画像を使用してオブジェクトカテゴリ間の区別を学習します。

2

全員のコンピューターのオペレーティングシステムは、おそらくディスクイメージからインストールされました。

  1. ディスクイメージから始めて、おそらくスキャンする必要のないファイルのリストを取得します。
  2. 各PCの他のすべてのファイルのリストを取得します。
  3. 10〜20台のランダムなマシンから実際のファイルを引き出し、テストベッドとして使用します
  4. 冒fan的で疑わしい単語(ギャル、水差し、「ほとんど法的」、冗談など)の辞書内のアイテムを検索する
  5. ビデオを見る-誰でもビデオを持っている必要がありますか?
  6. 写真を見る
  7. 疑わしいビデオまたは画像ファイルは、他のマシンを検索するために使用できます

1人または2人の従業員が仕事のコンピューターに何かを置く前に捕まるまでにかかります。

このサービスに対してわいせつな金額を請求してください。私はザッポスが従業員にこれを決してしないだろう。


2

あなたがネットワークのドメイン管理者であると仮定します。

  1. 各ユーザーのデスクトップマシンにC $。
  2. ポルノファイルを個人のプライベート共有にコピーします。
  3. 元の場所から削除します。
  4. ポップコーンを作ります。
  5. すべての「証拠」の詳細な分析を完了します。

1

コメントしたかったのですが、担当者が1人しかいないため、できません。

Gravatarの場合、インターネットキャッシュの場所にあるクリーンなサイトのリストから除外する関数を追加できます。IE Gravatarなど、誤検知を避けたいサイト。デスクトップの壁紙などを除外することもできます。彼らがデスクトップにポルノを表示しているなら、あなたは人々があなたの監査の外で気づくと思うでしょう。


1

そのようなことは確実に機能しません。ブロックリストを使用して、名前またはリストに含まれるドメインをブロックできます(一般的な方法)。しかし、これらのリストは決して完全ではなく、基準に基づいて名前をブロックすると、多くの誤検知につながる可能性があります。

サイトのテキストに表示される単語をブロックできますが、これも誤検知につながる可能性があります(「いたずらビット」を検出するためにネットワークを通過するデータのすべてのビットを解析する必要があるため、非常に遅くなります)。

特定の割合以上のスキントーンを示す画像(およびそれらを含むサイト)をブロックできます。しかし、これもまた多くの誤検知につながります。傷や皮膚の状態を示す手足や胴体の画像で医学百科事典をブロックしている大学の医学部は、そのよく知られた例です。そしてもちろん、特定のスキントーンのみをブロックするため、人種差別主義者になるでしょう。白人の肌に合った色をブロックすると、たとえば黒人俳優を使用したポルノが常に存在します。

従業員を信頼するのが最善であり、その信頼が破られたときのためのポリシーを用意してください。


パーソナルプロキシサーバー、暗号化された非表示パーティション、仮想マシン。ものを隠す方法は常にあります。もちろん、3gのAndroidスマートフォンもあります。最後に、雇用者が従業員が自分の帯域幅で自分の電話で必要なものを見ることを止める方法がないことを確認しました。
クリストファーマハン

それが技術的手段が役に立たない理由であり、確かにポリシーがありません。人々が許可されていることと許可されていないことを知っている場合(そして、そのようなポリシーがなくても、ポルノのために作業機械を使用する教育を受けた人を考えることはできませんが、それは別の問題です)ほとんどがそれに固執します。遅かれ早かれ、技術的な手段が整っているかどうかを知ることができます(おそらく、誰かが画面上を通り過ぎて見るはずのないものを画面に表示するでしょう)。
-jwenting

1

私は知りません、中間の答えがなければなりません、それはそれほど侵襲的ではありませんが、本当の問題、責任を解決します。

職場のPCで見つかった違法なもの(仕事に関連しないもの)に対する責任を会社に免除する権利放棄書に署名してもらいます。


私はこの免除が米国でうまくいくとは思わない。他の国については知りません。
デビッドソーンリー

なぜ機能しないのですか?ユーザーがコンテンツをダウンロードし、ソフトウェアをインストールする能力を持っている場合、当然のことながらその責任を負います。
crosenblum

そして、もし会社がポルノを除外する能力を持っているならば、それは一般的に仮定され、そうではない、それは部分的に会社の責任である。
デビッドソーンリー

どこでもない。一部の国では、従業員が意図した目的で使用していたかどうかにかかわらず、会社は所有する機器で何が起こっても責任を負います。これは米国にもある程度当てはまります。実際、それらの製品が合法的に販売された後、その製品の違法使用について会社を訴える試みがありました(例えば、製品が犯罪、幸運なことに通常は捨てられるが、悲しいことに常にではない訴訟で使用されます)。
11年


1

人の趣味の良い写真、水着の写真、ヌード写真、ポルノの描写の違いを判断するための画像とコンテンツの分析...私が知っている限りでは、ソフトウェアだけでできるほど洗練されたものはありません。

@ammoQがコメントで示唆したように、幸いクラウドソーシングはここで役立つはずです。しかし、4chanや他のフォーラムのメンバーは、投稿されているボタン、フレーム、広告などの一般的なWebグラフィックなど、膨大な数のポルノ以外の画像を高く評価するとは思わない。

私の推奨は、Amazon Mechanical Turkなどの既存のクラウドソーシングソリューションを調べることです。(ただし、利用規約ではポルノコンテンツの関与が明示的に禁止されている場合があるため、別の解決策を見つけるか、独自の解決策を展開する必要がある場合があります。)

クラウドソーシングを実行可能にするために、ソフトウェアは次の一部またはすべてを実行する準備ができている必要があります。

  • コンテンツを元のコンピューターにリンクする情報を保存する
  • インベントリ全体で正確な重複を特定し、それらを削除します(ただし、元の情報は保持されます)
  • 画像をある次元、おそらく320x200にダウンサンプリングします。これにより、不必要な詳細を保持したり、ストレージスペース/帯域幅を無駄にしたりすることなく画像のコンテンツを識別できます。
  • 一定の間隔でビデオコンテンツの静止画像を作成し、同じダウンサンプリングルールを適用する

最後に、元の画像とビデオコンテンツを表す縮小画像のデータベースは、会社の行動規範に従ってユーザー(またはリソースがある場合は指定されたチーム)によってチェックされます。プログラムまたはインターフェイスは、一度に1つの画像、またはサムネイルの画面を表示する場合があります。これは、正確な情報を取得するのに最適と思われるものは何でも表示されます。

画像の作成元のコンピューターの身元は、絶対に秘密であり、データを評価する人には知られてはなりません。さらに、ランダム化する必要があり、各イメージはおそらくバイアスを除去するために複数回チェックされます。

同じ手法をテキストに使用することもできますが、最初にキーワードランキングによってコンテンツをスコアリングし、クラウドソースレビューからテキストの大部分を削除することができます。もちろん、長い文書を分類することは、画像を分類するよりも時間がかかります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.