R-ニューラルネットワークプロットの解釈


8

stats.SEにも同様の質問があることは知っていますが、私の要求を満たす質問は見つかりませんでした。質問を重複としてマークする前に、コメントでpingしてください。

neuralnetSP500インデックスの時系列を予測するために基づいてニューラルネットワークを実行していて、以下に掲載されているプロットをどのように解釈できるかを理解したいと思います。

ここに画像の説明を入力してください

特に、隠れ層の重みと入力の重みの解釈が何であるかを理解することに興味があります。誰かがその数を解釈する方法を教えてもらえますか?

任意のヒントをいただければ幸いです。


2
ここにあなたの質問に関連する興味深い記事があります。labs.eeb.utoronto.ca/jackson/ecol.%20modelling%20ANN.pdf
MrMeritology 2015

コメントをありがとう、@ MrMeritology!本当に便利だと思いました!
Quantopik 2015

私はあなたがこの(かなり単純な)ニューラルネットワークを理解できると確信していますが、解釈可能性が比較的大きな懸念事項である場合は、おそらく最初からニューラルネットワークを使用すべきではありません。他のアルゴリズムよりも選択した特定の理由はありますか?
デビッド

はい、@ David!このようなモデルを使って学びたいと思います。私は仕事でそれらを使用したことがなく、ただ楽しみのためにそれを勉強しています。プロットを解釈することについて何か考えがありますか?
Quantopik 2015

ANN分析を解釈するのに助けが必要です
明るいカル

回答:


7

Davidがコメントで述べているように、モデルを解釈したい場合は、ニューラルネット以外の何かを探索したいと思うでしょう。それはあなたがネットワークプロットを直感的に理解したいということです、それは画像に関してそれを考えるのが最善です(ニューラルネットワークは非常に得意です)。

  1. 左端のノード(つまり、入力ノード)は生データ変数です。
  2. 黒の矢印(および関連する番号)は、その変数が次のノードにどの程度寄与しているかと考えることができる重みです 青い線はバイアスの重みです。これらの重みの目的は、こちらの優れた答え見つけることができます。
  3. 中間ノード(つまり、入力ノードと出力ノードの間のノード)は、非表示ノードです。これは、イメージの類推が役立ちます。 これらの各ノードは、ネットワークが認識を学習するコンポーネントを構成します。 たとえば、鼻、口、目などです。これは簡単に決定することはできず、非イメージデータを処理する場合ははるかに抽象的です。
  4. 右端(出力ノード)ノードは、ニューラルネットワークの最終出力です。

これはすべて、ネットワークの各層にも適用されるアクティベーション機能を省略していることに注意してください。


β

@Quantopic パッケージのcompute関数を参照していると思いますneuralnet。手作業でソースを作成したい場合、ソースはそれほど複雑ではありません。基本的に、各レイヤーで重みとアクティベーション関数を最終結果に適用します。
cdeterman 2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.