ニューラルネットワークを設計するための経験則はありますか?


12

ニューラルネットワークアーキテクチャは、ほとんどが問題自体と入出力のタイプに基づいていることを知っていますが、それでも、1つを構築し始めると常に「正方形」が存在します。だから私の質問は-MxN(Mはレコード数、Nはフィーチャの数)の入力データセットとCの可能な出力クラスを考えると-何層/ユニットから始める必要があるかについての経験則はありますか?


この質問への可能な答えは、非常に特定の問題です。画像オブジェクトの認識にはいくつかの便利なルールがあるかもしれませんが、これらのルールは別のデータセットでは機能しない可能性があります。
horaceT 2018

回答:


10

この質問はCrossValidatedで詳細に回答されています:フィードフォワードニューラルネットワークで非表示のレイヤーとノードの数を選択する方法は?

ただし、自分の2セントを追加します。

最適なニューラルネットワークアーキテクチャを選択するための魔法のルールはありませんが、誰かが同様の問題を解決するために使用したアーキテクチャを見つけることができる場合、これは多くの場合、優れた出発点です。

探すのに最適な場所は、Keras、PyTorch、Tensorflowなどの人気のあるニューラルネットワークライブラリを使用した公式または非公式の例と、学術文献に記載されているアーキテクチャです。githubのkeras / examplesは素晴らしいリソースです。

これらのアーキテクチャは、多くの試行錯誤の末に選択された可能性が高いため、ほとんどの作業はあなたのために行われます。


5
CrossValidatedの回答の1つの注意点は、7年以上前のものであり、非表示レイヤーの構成に関する「優れた要約」について15年以上前のFAQを指摘していることです。過去7〜15年間にNNの設定に多くの作業が行われたと言うのは少々控えめな表現です。「1つの隠れたレイヤーで十分」なレジームの範囲外にあるアプリケーションの数が増えています。-そうは言っても、多くの問題にとって、ディープラーニングのアプローチはやり過ぎかもしれません。単一の隠れ層から始めて、必要な場合にのみ深層に行くのは確かな戦略です。
RM

1
良い点、RM-しかし、2番目の答えはもっと最近のものです。
イムラン2018

@Imran OPの質問にはまったく答えられないと思います。隠しノードとアーキテクチャの選択は非常に深い問題であり、まだ十分に理解されていません。クロスレイヤー接続を備えたResNetおよびワイドResNetを目撃してください。
horaceT 2018

コメントをありがとう、@ horaceT。私が試みた答えは、「経験則はありませんが、適用できるヒューリスティックスがある」という意味でした。Res Netsを知っています。他にどのように回答を改善できるか教えてください。
イムラン2018

3

私は、ニューラルネットワークを使用して他のニューラルネットワークを設計するアイデアを調査する論文を読み、ノードとレイヤーのどの構成が最も効率的かを調査しました。こちらがPDFをダウンロードできるページですhttps://arxiv.org/abs/1611.02120


2

@Imran の回答に続いて、彼がリンクしたCrossValidated投稿のコメントの1つでこの論文を見つけました。(経験則を使用する代わりに)遺伝的モデルを使用して適切なアーキテクチャを見つける試みに加えて、セクション2.1では、1つまたは2つの非表示レイヤーシステムに含まれる非表示ユニットの数の理論的な限界を示します。

編集: 私はこの定理をテストしましたが、遺伝的モデルを使用することはランダムなアーキテクチャを選択するのと同じくらい良いことを発見しました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.