回答:
確かに、パフォーマンスを改善するために使用されるいくつかの詳細はトリックと見なされ、これらのトリックがデータとネットワークに同じ改善をもたらすかどうかは常にわかりません。
あなたが間違いなく必要とするいくつかのこと:
これは興味深い本です。ニューラルネットワーク:取引の裏技、本の更新された2012年版です。ニューラルネットワークのパイオニアの何人かによるたくさんの記事。
ypxは、トレーニングに関する多くの実用的な問題に美しく触れました。そのため、あなたが提起した他の問題に触れました。多くのエリート産業ラボがまだ結果を公開しています。たとえば、Microsoft ResearchのチームはImageNet 2015で優勝し、新しいディープネットモジュールを説明するテクニカルレポートをリリースしました。画像認識のためのDeep Residual Learning、GoogleのチームはInceptionアーキテクチャ、Going Deeper with Convolutionsも公開しています。重要な革新を共有するという(今のところ)機械学習の文化は重要です。おそらく、キーがデータへのアクセスであるためです。GoogleとFacebookは、私たちがしていないデータにアクセスするだけです。生のアルゴリズム革新にどれほどのクレジットがあり、大量のデータにどれだけのクレジットがあるかは言いがたい。
将来はどうなるのでしょうか?言いにくい。これらのデータ主導型企業がどれほど価値があり、市場がどれだけ競争力があるかを考えると、多くの人々が提起した問題です。しかし今のところ、私は産業研究所が共有するものと共有しないものの十分なバランスがあると思います。正確なコード実装を共有していないことを理解しています。しかし、彼らはいくつかの非常に斬新なイノベーションを共有しています。
重要な結果を発表し、読んだり、読んだり、読んだりする研究者を見つけましょう。私はヤン・ルクンのRedditのAMAを信じて、彼は貪欲な読者であると述べました。これが一番大事なことだと思います。そして、実用的な範囲で、ベンチマークを再作成するか、予算内のデータセットにメソッドを適用してください。
あなたがどこにいるのか、人生のどのステーションにいるのかに関係なく、これは鋭敏さを保ち、スキルを磨き続けるための最良の方法だと思います。貪欲な読者になって、物事を実装し、直感を構築してください。個人的にはImageNetコンテストに参加するためのリソースはありませんが、パフォーマンスの高いImageNetグループの記事をすべて読んだことで、非常に役立ちました。