中央値およびグラフィック表現で報告するエラー?


11

私は、パラメトリックANOVAとt検定からノンパラメトリックKruskal-Wallis検定とMann-Whitneysに加えて、ランク変換された2ウェイANOVAとバイナリを含むGzLMから、論文データにさまざまな検定を使用しました。ポアソンおよび比例データ。これをすべて結果に書き込む際に、すべてを報告する必要があります。

比率データの非対称信頼区間を報告する方法については、すでにここで質問しました。標準偏差、標準誤差、または信頼区間が手段に適していることを知っています。これは、すべてのテストが適切にパラメトリックである場合に報告するものです。ただし、ノンパラメトリックテストでは、平均ではなく中央値を報告する必要がありますか?その場合、どのエラーを報告しますか?

これに関連するのは、ノンパラメトリックテストの結果をグラフィカルに表示する方法です。カテゴリ内には主に連続データまたは間隔データがあるため、通常は棒グラフを使用します。棒の上部が平均であり、エラーバーが95%のCIを示しています。NPテストの場合、引き続き棒グラフを使用できますが、棒の上部は中央値を表しますか?

あなたの提案をありがとう!


何かが計算されません。どうすれば、カテゴリデータを持つ平均値、中央値、またはCIを取得できますか?
rolando2

@ rolando2が明確ではありませんでした...申し訳ありませんが、連続データまたは間隔データがあるカテゴリがあります(明確にするために元の質問を編集しました)。
Mog

回答:


6

中央値の信頼区間を報告できます。Rではwilcox.test、引数とともに使用できますconf.int=TRUE。この小さな議論はしてありますジョン・バーザニーシンプルなノートここを参照してください

プロットについて:一連の平均を表すために棒グラフを使用するのはあまり好きではありません。CIの小さな線分だけをプロットしたいと思います。 棒グラフの改善

右側のプロットerrbar()は、Hmiscパッケージ[ CRANページ ] から作成されました。

中央値と関連する信頼区間に対して同じ種類のプロットを作成することも、ボックスプロットを使用することもできます(同じ量の空間で、分布全体を記述します)。


ヒントカールをありがとう!バーが嫌いな理由はありますか?それとも個人的な好みですか?
Mog

1
@Mog:バーはインク/スペースの無駄のようです。彼らはあなたにy軸に0を含めることを強制しますが、これはしばしば必要ではありません; 間隔の下半分が表示されないようにします。バーは悪化する可能性があります(例:無償の3D)。小さなデータセットでは、実際のデータポイントを表示することを好みます。
Karl
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.