ドキュメント管理システムにレコメンデーション機能を追加したい。ほとんどの会社のドキュメントが保存されているサーバーです。従業員はWebインターフェイスを閲覧し、必要なドキュメントをクリックしてダウンロード(またはオンラインで読む)します。
各従業員は、すべてのドキュメントのサブセットにのみアクセスできます。
私の目標:チームメイトが最近開いたドキュメント、または開いたばかりのドキュメント、または読みたいものの付属文書として機能するスプレッドシートを従業員にお勧めします。
公開データには多くの推奨エンジンがあります(すべてのNetflixユーザーはすべての映画を見ることができます)が、ここでの状況は特別です:各従業員はすべてのドキュメントの一部のみにアクセス許可を持っていますが、Netflixではすべてのユーザーがすべての映画にアクセスできます。
例:Employee1はDocumentAを読み取ることができますが、DocumentBを読み取ることはできません。Employee2は両方を読み取ることができ、Employee3はいずれも読み取ることができません。
もちろん、私は彼女/彼女がアクセスできない文書を従業員に推薦してはなりません。さらに、ドキュメントへのアクセス権を持つ従業員のコンテキストでのみ、ドキュメントの人気を検討する必要があると思います。状況をさらに複雑にするために、従業員はプロジェクトから別のプロジェクトに移動する場合があり、アクセスできるドキュメントに影響を与えます。
- この種の問題に名前はありますか?
- 精度/効率を損なうことなく、より一般的な種類の問題に削減できますか?
- そうでない場合、どのようなアプローチがこの種の問題に適していますか?
注:Netflixのような推奨エンジンでは十分ではありません。50のビューを持つドキュメントは、10人の従業員(私を含む)だけがアクセスできる場合は目立つはずですが、10万人の従業員がアクセスできる場合は目立ちません。
必要に応じて、いくつかのデータの詳細を以下に示します。平均的な会社には1000人の従業員がいて、約10000のドキュメントがあり、従業員は1日あたり約5つのドキュメントをクリックします。各プロジェクトには、平均して10人の従業員がアクセスし、約100のドキュメントがあります。各従業員は、平均5つのプロジェクトに並行して取り組んでいます。