Google Prediction APIの背後には何がありますか?


28

Google Prediction APIはクラウドサービスで、ユーザーはトレーニングデータを送信して不思議な分類器をトレーニングし、後でスパムフィルターの実装やユーザー設定の予測など、着信データの分類を要求できます。

しかし、舞台裏には何がありますか?


2
私は彼らがその商業的な秘密を守ろうとしているのではないかと疑っています!
ワンストップ

これは真実かもしれませんが、ビデオ(2010年夏から)は、彼らがその時までにまだ実験していたことを示唆しています。そのため、その後いくつかのリークが発生することを期待して、このQを投稿しました。

6
データをトレーニング/予測するときにPrediction APIが選択できる「いくつかの」アルゴリズムがあります。エンジンは、最適であると判断したものを選択します。一部のユーザーは、アルゴリズムが不明であっても、その選択(goo.gl/mod/5EoA)をもう少し制御することを要求しています。Redditorsは、ここreddit.com/r/MachineLearning/comments/evdxb/…の根性について推測していますが、stat-speakは私には失われています。
ハイパースラグ

2
@hyperslug回答として投稿してください。非常に便利なので、受け入れたいと思います。

回答:


11

Googleは、トレーニングと予測にさまざまな機械学習技術とアルゴリズムを使用しています。大規模な教師あり学習の戦略:1.サブサンプル2.いくつかのアルゴリズムの恥ずかしいほどの並列化3.分散勾配降下4.多数決5.パラメーターの混合6.反復的なパラメーターの混合

彼らは、異なる機械学習技術を使用してモデルをトレーニングおよび予測し、アルゴリズムを使用して、最適なモデルと予測を決定する必要があります。

  1. サブサンプリングはパフォーマンスが劣る
  2. パラメーターの混合は改善されますが、すべてのデータほど良好ではありません
  3. 分散アルゴリズムはより優れた分類器をより速く返します
  4. 反復的なパラメーターの混合により、すべてのデータと同等の性能を実現

しかし、もちろん、APIドキュメントでは実際には明確ではありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.