部分依存プロットのy軸の解釈

22

部分依存プロットに関する他のトピックを読みましたが、それらのほとんどは、それらを正確に解釈する方法ではなく、異なるパッケージで実際にプロットする方法に関するものです。

私はかなりの量の部分依存プロットを読んで作成しています。私は、彼らが私のモデルからの他のすべての変数（χc）の平均の影響で関数ƒS（χS）に対する変数χsの限界効果を測定することを知っています。yの値が大きいほど、クラスの正確な予測に大きな影響を与えます。しかし、私はこの定性的な解釈に満足していません。

私のモデル（ランダムフォレスト）は、2つの控えめなクラスを予測しています。「はい」と「いいえ」。TRIは、これに適した変数であることが証明されている変数です。

私が考え始めたのは、Y値が正しい分類の確率を示しているということです。例：y（0.2）は、TRI値が30を超えていると、True Positive分類を正しく識別する可能性が20％であることを示しています。

逆に

y（-0.2）は、TRI値が<〜15の場合、True Negative分類を正しく識別する確率が20％であることを示しています。

文献で行われている一般的な解釈は、「TRI 30より大きい値がモデルの分類にプラスの影響を与え始める」というように聞こえますが、それだけです。潜在的にあなたのデータについて多くを語ることができるプロットにとって、それはとても曖昧で無意味に聞こえます。

また、すべてのプロットは、y軸の範囲内で-1から1の範囲で制限されます。-10〜10などの他のプロットを見ました。これは、予測しようとしているクラスの数の関数ですか？

誰もこの問題に話すことができるかどうか疑問に思っていました。これらのプロットまたは私を助けてくれるいくつかの文献をどのように解釈すべきかを教えてください。多分私はこれを読みすぎていますか？

統計学習の要素であるデータマイニング、推論、および予測を非常によく読んでおり、素晴らしい出発点でしたが、それだけです。

— エレナウクリナ
ソース

プロットは、TRI 30まではいのツリー確率を平均して示し、その後は増加します。このリンクでは、PDPバイナリ分類と連続変数プロットの解釈方法について説明しています。

— -LazyNearestNeigbour

13

部分依存プロットの各ポイントは、固定レベルのTRIが与えられた場合に、すべての観測値にわたって「Yes木」クラスを支持する平均投票率です。

それは正しい分類の確率ではありません。正確性、真のネガティブ、真のポジティブとはまったく関係ありません。

フレーズを見たら

TRI 30より大きい値は、モデルの分類にプラスの影響を与え始めます

膨らんだ言い方です

TRI 30より大きい値は、TRI 30より小さい値よりも「はい木」をより強く予測し始めます。

— シャドウトーカー
ソース

2

部分依存関数は、基本的にその変数の「平均」トレンドを提供します（モデル内の他のすべてを統合します）。その傾向の形が「重要」です。異なる予測変数からのこれらのプロットの相対範囲を解釈できますが、絶対範囲は解釈できません。お役に立てば幸いです。

— チアックス
ソース

2

y軸の値を確認する方法は、他のプロットで互いに相対的であることです。その数が他のプロットの絶対値よりも大きい場合、その変数が出力に与える影響が大きくなることがより重要であることを意味します。

部分依存プロットの背後にある数学とその数の推定に興味がある場合は、http：//statweb.stanford.edu/~jhf/ftp/RuleFit.pdfセクション8.1で見つけることができます。

— user3386377
ソース