2
ランク付けされたデータ(スピアマン相関)の回帰直線をプロットすることは「大丈夫」ですか?
スピアマン相関を計算したデータがあり、それを出版物のために視覚化したいと思います。従属変数はランク付けされますが、独立変数はランク付けされません。視覚化したいのは、実際の勾配よりも一般的な傾向なので、独立性をランク付けし、スピアマンの相関/回帰を適用しました。しかし、自分のデータをプロットし、それを自分の原稿に挿入しようとしたとき、私は(このWebサイトで)このステートメントに出くわしました。 スピアマンの順位相関を行う場合、説明や予測に回帰直線を使用することはほとんどないため、回帰直線に相当する値を計算しないでください。 以降 線形回帰または相関の場合と同じ方法で、スピアマンの順位相関データをグラフ化できます。ただし、グラフに回帰直線を置かないでください。ランク相関で分析した場合、グラフに線形回帰直線を配置すると誤解を招く恐れがあります。 問題は、回帰直線は、独立をランク付けしてピアソン相関を計算しない場合とそれほど変わらないということです。傾向は同じですが、ジャーナルのカラーグラフィックの法外な料金のために、モノクロ表現で行ったので、実際のデータポイントがあまりにも重なりすぎて認識できません。 もちろん、これを回避するには、2つの異なるプロットを作成します。1つはデータポイント(ランク付け)、もう1つは回帰直線(ランク付けなし)ですが、引用したソースが間違っているか問題であることが判明した場合私の場合はそれほど問題ではありませんが、それは私の人生を楽にします。(私もこの質問を見ましたが、それは私を助けませんでした。) 追加情報を編集: x軸の独立変数はフィーチャの数を表し、y軸の従属変数は分類アルゴリズムがパフォーマンスで比較された場合のランクを表します。これで、平均的に比較できるアルゴリズムがいくつかありますが、プロットで言いたいのは、「分類子Aはより多くの特徴が存在するほど良くなり、分類子Bはより少ない特徴が存在するときに良くなる」のようなものです。 2を編集してプロットを含めます。 プロットされたアルゴリズムのランクと特徴の数 プロットされたアルゴリズムのランクとランク付けされた機能の数 したがって、タイトルから質問を繰り返すには: スピアマンの相関/回帰のランク付けされたデータの回帰直線をプロットしても問題ありませんか?