他の機械学習アプローチよりもベイジアンネットワークを使用する場合


12

この質問に対する決定的な答えはないだろうと思います。しかし、私は過去に多くの機械学習アルゴリズムを使用し、ベイジアンネットワークについて学習しようとしています。どのような状況下で、または他のアプローチよりもベイジアンネットワークを使用するためにどのような種類の問題を選択しますか?


3
私にとって、ベイジアンネットワークはモデルの条件付き独立性を定義する方法です。それを定義したら、さまざまな学習ツールを使用してモデルパラメーターを推定できると思います。したがって、パラメータ学習とモデルの間には明確な分離が見られます。しかし、私はこれに関する専門家ではないので、誰かがより良い答えを得ることができます。
ルカ

回答:


7

XYP(X,Y)P(Y|X)

P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

BNはDAGを利用して共同配布を処方します。したがって、それらはグラフィカルモデルです。

利点:

  1. 医学などの多くの欠落データがある場合、BNは非常に効果的な場合があります。これは、共同分布(データの生成方法に関するアサーション)をモデリングすることで、完全に観測されたデータセットの依存性が低下するためです。

  2. 視覚的に透明な方法でドメインをモデル化し、キャプチャすることも目的とする場合 原因効果関係、BNは非常に強力です。ただし、BNの因果関係の仮定は議論の余地があることに注意してください。

  3. ジョイント分布を学習するのは難しいタスクであり、離散変数のモデル化(条件付き確率テーブル、つまりCPTの計算による)は、連続変数に対して同じことを試みるよりもかなり簡単です。したがって、BNは実際には離散変数でより一般的です。

  4. BNは観測推論を許可するだけでなく(すべての機械学習モデルが許可するように)、因果的介入も許可します。これはBNの一般的に無視され、過小評価されている利点であり、反事実的推論に関連しています。


1
BNは多くの欠損値を持つデータのモデリングに効果的であると言う利点1では、これらの欠損値はデータの独立性の正しい識別に影響しませんか?
ホセイン

1
はい、モデルをあてはめながら、いくつかの仮定を設定する必要がありますが、たとえば、 PYバツ1バツ2、DAGの因数分解(独立性の前提をカプセル化する)によっては、必要ない場合があります バツ1 もし バツ2は既に利用可能、またはその逆です。
ジュバル

1

私の経験では、高次元のカテゴリデータがある場合、ベイジアンネットワークは非常にうまく機能します。これらは、解釈可能なモデルを提供します。これは、さまざまな変数がどのように相互作用するかを理解するのに(時には)役立ちます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.