データにモデルを適合させる基本レベルで機械学習と統計を区別するIMHOには正式な違いはありません。モデルの選択、モデルをデータに適合させる目的、および解釈を拡張する目的には、文化的な違いがある場合があります。
典型的な例では、私たちは常に持っていると考えることができます
- モデルのコレクション for for some index set、 I ∈ I IM私I ∈ II
- そして毎、未知のコンポーネントモデル(のパラメータ、寸法無限大であってもよい)。θ I M IiθiMi
フィッティングデータにすることは、ほとんど常に、未知の成分の最適な選択見つけることからなる数学的最適化問題であるにするいくつかのお気に入りの機能により測定されたデータをフィット。θ I M IMiθiMi
モデルの選択は標準的ではなく、さまざまな手法が利用できます。モデルのあてはめの目的が純粋に予測的である場合、良好な予測パフォーマンスを得るためにモデルの選択が行われますが、主な目的が結果のモデルを解釈することである場合、他のモデルよりも簡単に解釈可能なモデルが選択される場合があります予測力は悪化すると予想されます。Mi
オールドスクールの統計モデル選択と呼ばれるものは、おそらく段階的選択戦略と組み合わせた統計テストに基づいていますが、機械学習モデルの選択は通常、一般に交差検証を使用して推定される予想される一般化エラーに焦点を当てています。ただし、モデル選択の現在の開発と理解は、より一般的な根拠に向かって収束しているようです。たとえば、モデル選択とモデル平均化を参照してください。
モデルから因果関係を推測する
問題の核心は、モデルをどのように解釈できるかです。得られたデータが慎重に設計された実験からのものであり、モデルが適切である場合、モデル内の変数の変化の影響を因果効果として解釈でき、実験を繰り返してこの特定の変数に介入する場合、もっともらしい推定効果を観察することが期待できます。ただし、データが観察的である場合、モデルの推定効果が観察可能な介入効果に対応するとは期待できません。これには、モデルが「機械学習モデル」であるか「古典的な統計モデル」であるかに関係なく、追加の仮定が必要になります。
単変量パラメーター推定と効果サイズの解釈に焦点を当てた古典的な統計モデルを使用して訓練された人々は、因果解釈が機械学習フレームワークよりもこのフレームワークでより有効であるという印象を持っている可能性があります。そうではないと思います。
統計における因果推論の領域は、実際に問題を除去するものではありませんが、因果結論が明示される前提を明確にします。それらはテスト不可能な仮定と呼ばれます。統計における論文の因果推論: Judea Pearlによる概要は、読むのに適した論文です。因果推論からの主要な貢献は、観察されていない交絡因子が実際に存在するという仮定の下での因果効果の推定のための方法の収集であり、そうでなければ主要な関心事です。上記のパール紙のセクション3.3を参照してください。より高度な例は、論文「Marginal Structural Models and Causal Inference in Epidemiology」に記載されています。
検証できない仮定が成り立つかどうかは、主題の問題です。データを使用してテストすることはできないため、これらは正確にはテストできません。仮定を正当化するには、他の引数が必要です。
機械学習と因果推論が出会う例として、Mark van der LaanとDaniel RubinによるTargeted Maximum Likelihood Learningに示されているターゲット最尤推定のアイデアは、通常、ノンパラメトリック推定のための機械学習手法を活用してから「ターゲティング関心のあるパラメータに向かって。後者は、原因となる解釈を伴うパラメーターになります。Super Learnerのアイデア興味のあるパラメータの推定のために機械学習技術に大きく依存することです。Mark van der Laan(パーソナルコミュニケーション)による重要なポイントは、古典的で単純な「解釈可能な」統計モデルがしばしば間違っており、偏った推定量と推定の不確実性の楽観的な評価につながることです。