ベイジアンネットワークがニューラルネットワークよりも優れているドメインはありますか?


48

ニューラルネットワークは、コンピュータービジョンタスクで最高の結果を得ます(MNISTILSVRCKaggle Galaxy Challengeを参照)。コンピュータービジョンの他のすべてのアプローチよりも優れているようです。しかし、他のタスクもあります:

ASR(自動音声認識)と機械翻訳についてはあまりよくわかりませんが、(リカレント)ニューラルネットワーク(他のアプローチよりも優れている)も聞いたことがあると思います。

現在、ベイジアンネットワークについて学んでいますが、これらのモデルは通常どのような場合に適用されるのでしょうか。だから私の質問は:

最先端技術がベイジアンネットワークまたは少なくとも非常に類似したモデルである挑戦/(Kaggle)競争はありますか?

(サイドノート:私も見てきた決定木234567、いくつかの最近のKaggleの挑戦で勝利を)


ドメインの問題ではありません。それはあなたが持っているデータの量、あなたの事前分布がどれほど良いか、そして後輩が欲しいかどうかの問題です。
エマー

1
@Emreこれはドメインの問題です...(そしてもちろん、既存のデータセットを使用するだけでなく、新しいデータを作成/ラベル付けするために人々を雇う可能性がある場合はお金の問題です)。
マーティントーマ

あるアルゴリズムが他のアルゴリズムよりも優れていることは、データのプロパティ、構造などがある場合、ドメインの問題になりますが、それは私が提案していることではありません。
エマー

2
したがって、あなたの質問に対する答えは、いいえです。右?すべての答えは、他の予測モデルに対するベイジアンネットワークの利点を示しているように見えますが、実際に他のモデルよりも優れているKaggleの競合は見ていません。誰でも提供できますか?なぜなら、十分なデータの欠如や良い優先順位の選択など、すべての理由と考えられる利点は、理論上は素晴らしいように思えますが、少なくとも1つの例を提供して質問に答えないからです。
MNLR

ベイジアンネットワークは、データ量が比較的制限されている教師なし学習/タスクに役立つことがあります。トレーニングするデータが大量にある場合にのみ、ニューラルネットワークは他のネットワークよりも優れています。
xji

回答:


31

ベイジアンアプローチがよく使用される領域の1つは、予測システムの解釈可能性が必要な領域です。医師にニューラルネットを提供し、95%正確であると言いたくないでしょう。むしろ、メソッドが使用する決定プロセスと同様に、メソッドが行う仮定を説明する必要があります。

同様の領域は、ドメインに関する事前の強力な知識があり、それをシステムで使用したい場合です。




18

ベイジアンネットワークとニューラルネットワークは互いに排他的ではありません。実際、ベイジアンネットワークは、「ダイレクトグラフィカルモデル」の単なる別の用語です。これらは、目的関数ニューラルネットワークの設計に非常に役立ちます。ヤン・ルカンは、ここで、このうちを指摘している:https://plus.google.com/+YannLeCunPhD/posts/gWE7Jca3Zoq

一例。

p(x)=zp(x|z)p(z)dz.
p(x|z)q(z|x)p(z|x)

2つの部分を共同でトレーニングできますか?
nn0p

16

すでに優れた答え。

私が考えることができ、広範囲に取り組んでいる1つのドメインは、顧客分析ドメインです。

カスタマーサポート、マーケティングチーム、成長チームの両方に情報を提供し、警告するためには、お客様の動きと動機を理解し、予測する必要があります。

したがって、ここでは、ニューラルネットワークは解約予測などで非常に良い仕事をします。しかし、私はベイジアンネットワークスタイルを見つけて好みます。

  1. 顧客には常にパターンがあります。彼らには常に行動する理由があります。そして、その理由は、私のチームが彼らのためにしたこと、または彼らが自分自身を学んだことです。そのため、ここではすべてに優先事項があります。実際、顧客が行う決定のほとんどを促進する理由は非常に重要です。
  2. 顧客およびマーケティング/販売目標到達プロセスにおける成長チームによるすべての動きは、因果関係です。したがって、見込み客を顧客に変えるには、事前の知識が不可欠です。

したがって、顧客分析に関しては、事前の概念が非常に重要であり、このドメインにとってベイジアンネットワークの概念は非常に重要です。


推奨される学習:

ニューラルネットワークのベイズ法

ビジネス分析におけるベイジアンネットワーク


15

結果を予測することと同じくらい結果を変えることを気にすることもあります。

十分なトレーニングデータが与えられたニューラルネットワークは、結果をよりよく予測する傾向がありますが、結果を予測できるようになったら、結果に対する入力フィーチャの変更の影響を予測できます。

誰かが心臓発作を起こす可能性があることを知っている実生活の例は便利ですが、XXをやめるとリスクが30%減少することを伝えることができます。

同様に、顧客維持のために、顧客があなたと買い物をやめる理由を知ることは、あなたと買い物をやめそうな顧客を予測するのと同じくらい価値があります。

また、予測は下回りますが、より多くのアクションが行われる単純なベイジアンネットワークは、より「正しい」ベイジアンネットワークよりも優れている場合があります。

ニューラルネットワークに対するベイジアンネットワークの最大の利点は、因果推論に使用できることです。このブランチは統計と機械学習にとって基本的に重要であり、Judea Pearlはこの研究でチューリング賞受賞しています。


しかし、ニューラルネットワークを使用して、さまざまな機能の役割と重要性を判断することもできます。
ホセイン

7

ベイジアンネットワークは、小さなデータ設定でニューラルネットワークよりも優れている場合があります。事前情報がネットワーク構造、事前情報、およびその他のハイパーパラメータを介して適切に管理されている場合、ニューラルネットワークよりも優れている可能性があります。ニューラルネットワーク、特に層数の多いネットワークは、データを大量に消費することが非常によく知られています。定義により、それらを適切にトレーニングするには多くのデータが必要です。


4

このリンクをRedditに投稿し、多くのフィードバックを得ました。ここに回答を投稿した人もいれば、投稿しなかった人もいます。この回答は、redditの投稿をまとめたものです。(私はそれをコミュニティwikiにしたので、私はそれのためにポイントを獲得しません)



2

私はこのために一度小さな例をしました。そのことから、分布をキャプチャしたいが、入力トレーニングセットが分布を十分にカバーしていない場合、ベイジアンネットワークが好ましいと思います。このような場合、一般化されたニューラルネットワークでさえ、分布を再構築することはできません。


-3

ニューラルネットが他の学習者よりも優れていることに強く同意しません。実際、ニューラルネットは他の方法と比較してかなり悪い結果を出しています。また、このビーイングが偶然に頻繁に行われるパラメーターの選択に関するいくつかのアドバイスにもかかわらず、方法論はありません。また、フォーラムでニューラルネットがどのように優れているかについてランダムに話している人もいますが、それについての証拠があるからではなく、ファンシーでバズの言葉、「ニューラル」について引き付けられているからです」 xgboostと比較するためにニューラルネットを試してみましたか?


3
これはあいまいすぎて会話的すぎて、適切な回答を得ることができません。いくつかの詳細、事実、編集により改善されます。
ショーンオーウェン

、特定の事実」は、ニューラルネットが最適であるというメッセージを投稿する人々によって指定される必要があります。 knnがはるかに良い結果を得ているような方法で悪い。
gm1

1
私はあなたの意見を否定しませんが、あなたの答えが本当に質問に答えないということもすべきではありません。したがって、コメントとして追加することを検討してください。そして、それは将来の視聴者が、暴言など、見される可能性があります:)他に、あなたの答えをサポートしている任意の具体的な証拠や理論を追加してください
Dawny33

1
@ gm1「、、特定の事実」は、ニューラルネットワークが最適であるというメッセージを投稿する人々によって指定されるべきだと思います。私はその一般的な声明を書いていないことに注意してください。私はNNが多くの競技会/ CVタスクで勝つと書きました。そして、ニューラルネットワークアプローチが勝ついくつかの課題を追加しました。
マーティントーマ

こんにちは、他のモデルと組み合わせたニューラルネットを使用しなかったと仮定して、ニューラルネットがうまくいったいくつかのKaggleコンペティションがありますが、これはすべてのカグルコンペティションのごく一部です。 kaggle TFIのトップ3?非線形のモデルを使用して、パブリックLBとプライベートLBの両方で実行できると思います。
gm1
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.