記述統計を報告する意味は何ですか?


21

ロジスティック回帰を使用してデータの分析を実行しましたが、レポートに記述的な統計の部分を含める必要もあります。正直なところ、この点についてはわかりませんが、なぜそれが必要なのかを誰かが説明できるかもしれないと期待していました。

たとえば、独立した連続変数の1つのヒストグラムをプロットし、それが正規性を示す場合、または歪度を示す場合、どのようにレポートに値を追加しますか?

私のデータは、就職の従属変数trueまたはfalseで構成されており、独立変数は、中間期の成績、最終試験の成績、および男性または女性です。


IVのヒストグラムのプロットで値が表示されない場合は、それを行うべきではないかもしれませんが、あなたが提示している作品に何らかの価値があると考えている収集したデータはありますかレポート?
Ian_Fin 16

こんにちはイアン、私の問題に関する詳細を追加しました。私は統計にかなり慣れていないので、ロジスティック回帰を実行する前に、一般的なアプローチがあるのではないかと思っていました。
user3223190 16

また、データのさまざまなプロットを見て、場合によっては含めることをお勧めします。たとえば、性別ごとに色分けされ、「仕事に就いた」と「仕事に失敗しました」にシンボルコード化された最終成績対中間成績をプロットできます。
エミルMフリードマン

回答:


42

私の分野では、レポートの記述部分は、結果の一般化の背景を設定するため、非常に重要です。たとえば、ある研究者は、病院のサンプルでオートバイ事故後の外傷性脳損傷の予測因子を特定したいと考えています。彼女の従属変数はバイナリであり、一連の独立変数がありました。多変数ロジスティック回帰により、彼女は次の結果を得ることができました。

  • 調整されたヘルメット使用なしOR = 4.5(95%CI 3.6、5.5)ヘルメット使用と比較。
  • 他のすべての変数は最終モデルに含まれていませんでした。

明確にするために、モデリングに問題はありませんでした。記述統計が追加できる価値に注目します。

記述統計がないと、読者はこれらの調査結果を見通しることができません。どうして?記述統計を示します。

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

上記から、彼女のサンプルは中毒の年配の男性で構成されていることがわかります。この情報により、読者は、もしあれば、これらの結果が若い男性の負傷または中毒のないライダーまたは女性のライダーの負傷について何を言うことができるかを言うことができます。

記述統計を無視しないでください。


5
いい例です。それは本物ですか、それとも構成ですか?
アメーバは、モニカの復活を

5
ありがとう、@ amoeba。数値と統計は実数です。しかし、私はトピックを外傷性脳損傷に変えて、無実の人々を保護しました。

3
だから、ヘルメットなしでオートバイに乗っている酔っぱらい...誰があなたが外傷性の脳損傷で終わることができると思いましたか?
グング-モニカの復職

私は...時間とボブのあなたの叔父で素敵なオーストラリアの赤のガラスを楽しんで

25

記述統計を提供するポイントは、他のセンターまたは国の人々があなたの結果が彼らの状況に一般化するかどうかを評価できるようにあなたのサンプルを特徴付けることです。したがって、あなたの場合、性別、成績などを集計することは、ロジスティック回帰に有益な追加となります。人々があなたの仮定をチェックできるようにすることではありませんが、彼らもそうしようとするかもしれません。

==============編集して、健康で使用されるいくつかのガイドラインへのリンクを提供します

私がよく知っている健康分野には、報告に関する特定のガイドラインがあります。これらはEQUATORネットワークで一緒に収集されており、最新の詳細を確認する必要があります。

例として、関連するガイドラインがCONSORTである臨床試験を行う場合があります。ここおよび他の場所で利用可能なガイドラインを概説する文書は、表1の推奨事項15「各グループのベースライン人口統計および臨床特性を示す表」を読みました。

他の研究タイプにも同様の推奨事項があります。


mdeweyに感謝します。そのため、さまざまな記述プロットを行うとき、および正常性または歪曲性に気付いた場合は、単にコメントするだけです。したがって、基本的に記述統計は、実際に使用しているデータを読者に知らせるためにのみ使用されます。これは基本的に見えるかもしれません場合は本当に申し訳ありません
user3223190

それが私が最もよく知っている健康分野での働き方です。
mdewey

8
+1。最初は、「他のセンターまたは国」を「他の世紀」と誤解していました。
アメーバは、モニカの復活を

4

もう1つのことは、変数の動作を示すことです。たとえば、変数の1つが給料であり、ロジスティック回帰に彼の給料を入力したときに1人の億万長者にインタビューした場合、他のすべてを支配するため、給料を無視することを学びます。保持できる実際の情報の量。

一部の方法は他の方法よりも歪度と極値に敏感であり、ロジスティック回帰はむしろ敏感な側にあります。もちろん、最終的な証明はプリンにあり、取得した結果を生データと比較するか、各特徴を正規化して変換することができます。


1

説明的な部分は、データセットのリーダーを理解するのに役立ちます。応用econでは、分析の最初の潜在的な欠陥を示す可能性があるため、通常は強くお勧めします。

さまざまなソースからのデータを使用して、説明を爆破することができます。

1つのテーブルで十分です。添付したものはあまり直感的ではありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.