ほとんどのポイント(+1)でncasasの回答に同意しますが、いくつかの点で異なるようにお願いします:
- デシジョンツリーは、ブラックボックスモデルとしても使用できます。実際、ほとんどの場合、ブラックボックスモデルとして使用されています。10,000の機能と50の深さのツリーがある場合、人間がそれを理解することを合理的に期待することはできません。
- ニューラルネットワークを理解できます。多くの分析手法があります(モデルの改善を目的とするものについては、私の修士論文の2.5章を参照してください)。特にオクルージョン分析(図2.10)、フィルターの視覚化(図2.11)。また、なぜあなたを信頼する必要がありますか?紙(私のメモ)。
ファンシーオクルージョン分析によるブラックボックスモデルの予測の説明(「なぜあなたを信頼する必要があるのか?」):
私はモデル解釈の神話を指摘したいと思います。解釈可能性に関するいくつかのアイデアを簡潔に定式化します。
あなたの質問
機械学習モデルがブラックボックスと呼ばれるのはなぜですか?
人々がそれを使用する方法:彼らは、人間が与えられた入力に対して何が起こるかを直接言うことを可能にする方法で問題をモデル化しないからです。
個人的な考え
この「ブラックボックスモデル」の概念はあまり意味がないと思います。たとえば、天気予報を考えます。データが与えられた場合に、どの天気が予測されるかを人間が言うことを期待することはできません。しかし、ほとんどの人は、物理的な気象モデルがブラックボックスモデルであるとは言いません。それで、違いはどこにありますか?1つのモデルがデータを使用して生成され、もう1つのモデルが物理学への洞察を使用して生成されたという事実だけですか?
人々がブラックボックスモデルについて話すとき、彼らは通常それが悪いことであるかのようにそれを言います。しかし、人間もブラックボックスモデルです。私がここで見る重大な違いは、人間が犯すエラーのクラスは人間にとって予測しやすいことです。したがって、それはトレーニングの問題(NN側の副次的な例)および教育の問題(NNの仕組みを人間に教える)です。
「ブラックボックスモデル」という用語の使用方法:私にとってより理にかなっているアプローチは、問題を「ブラックボックス問題」と呼ぶことです。これは、user144410(+1)の記述と同様です。したがって、問題をブラックボックスとして扱うだけのモデル(つまり、入力を入れて出力を得ることができるもの)は、ブラックボックスモデルです。問題についての洞察(仮定するだけではない!)を持つモデルは、ブラックボックスモデルではありません。洞察の部分はトリッキーです。すべてのモデルは、モデル化できる機能に制限を設けます(はい、普遍的な近似問題について知っています。固定サイズのNNを使用している限り、適用されません)。問題を突き出さずに(データを見ずに)入力と出力の関係について何かを知っていれば、何かが問題に対する洞察だと思います。
これから何が続きます:
- ニューラルネットワークは非ブラックボックス(ホワイトボックスですか?)
- ロジスティック回帰はブラックボックスモデルにすることができます。
- モデルに関するものではなく、問題とそれに関するあなたの洞察に関するものです。