これは実際、機械学習の分野では比較的有名な問題です。〜2006年、Netflixは、推奨システムに最も合理的な改善をもたらすアルゴリズムに100万ドルを提供しました。勝利を収めたソリューションの理論は、機械学習の入門に関するこのCaltechの教科書で簡単に説明されています。
基本的に、アンサンブル学習法が使用されました。特に、一種のブレンドまたはスタッキングが採用されました。これは自明ではありませんが、一種の直感的です。異なる統計的アプローチを調和で使用する直感を理解するために、同じ映画を好むさまざまな理由を考えてみましょう。つまり、ジョーは80年代のアクション映画が好きだからジョーはトップガンが好きかもしれません。したがって、両方の視聴者が視聴した(そして映画を高く評価した)という事実は、必ずしも他の映画が高い確率で好きになるということではありません。予測アルゴリズムは、少なくともある程度はこれらの違いに対応できることが理想的です。
これにより、ソリューションは非常にシンプルに聞こえるかもしれませんが、競合するアルゴリズムのバランスを取り、各ケースの最良の推測に優先順位を付けることは、決して簡単ではありません。Netflixがそのような大きな賞金を提供したという事実は、挑戦の大きさをかなり明白にするはずです。
機械学習を始めたばかりの場合は、関心のレベルと数学の背景に応じて、上記のリソースを確認すると役立つ場合があります。したがって、リグレッションはおそらく問題なく機能しますが、大幅に向上したパフォーマンスが可能です。