集約された調査データにおける加重相関の使用について


8

統合した2つの調査のデータを分析しています。

  • 2005-06年および2007-08年の学校職員調査

  • 2005-06年から2008-09年までの学生の調査

これらの両方のデータセットについて、3つの異なる学区からの観察(学生またはスタッフレベル)があり、それぞれがそれぞれの学区内の代表的なサンプルを毎年持っています。

分析のために、学生のデータを2つの2年間(2005年7月と2007年9月)に結合しました。次に、各データセットを「ドプライ」して、カットオフに従って質問に回答したスタッフまたは学生の割合を取得しました(たとえば、肯定的に答えた、「同意した」、または学生がアルコールを使用したとマークしたかどうかなど)。等。)。したがって、スタッフレベルと学生レベルのデータセットを一緒にマージすると、学校が分析の単位となり、2年間の期間に学校ごとに1つの観測しか得られません(学校に特定の期間のデータが欠落していなかった場合) )。

私の目標は、スタッフと学生の反応の関係を推定することです。これまでのところ、私の計画は、各学区のすべての変数(すべてパーセンテージを表す連続応答であるため)間のピアソン相関係数を取得することでした(これにより、このデータセット内の他の学区の一般化可能性の仮定が排除されるため)。 。これを行うには、とにかく2年間の地区データを平均して、学校ごとに1つの観測値のみを取得します。

質問:

  1. これは適切な分析計画ですか?私がより良い推論または力を提供できる他の方法を使用できますか?
  2. 私の計画が適切である場合、学校の登録に基づいて加重相関を取得する必要がありますか(相関係数に不釣り合いに寄与している大学校よりも小学校が多いため)。

私はこれについてデータ管理者に尋ねましたが、私のデータに重みを付ける必要性を決定する主な要因は、学校の規模が相関の程度に影響を与えるかどうか、そして私の解釈が学生レベルか学校レベルのどちらになるかであると述べました。私の解釈は学校レベルになると思います(たとえば、「この方法で答えるスタッフの割合がこの学校は、この方法で答える生徒のこの割合と相関しています...」)。

回答:


3

これは今では歴史だと思いますが、念のため...

1)はい、これは適切なようです。あなたの研究の質問は、「学校での教師の態度/行動は、その学校での生徒の態度/行動に関連していますか?」である必要があります。これがあなたの質問である場合、学校は適切な分析単位です(とにかく、個々の教師と生徒を一致させる方法はありません)。

分析の単位やサンプリング戦略の問題とは無関係に、ピアソンの相関係数の使用に関する警告を追加します。相関係数は非線形関係を取得できず、解釈を誤解させる可能性があり、いくつかの外れ値によって簡単に歪められ、それに基づく古典的な推論は正規性に依存します(比例データでは正確に保持されませんが、妥当な近似値)。少なくとも私は注意深くグラフィカルな方法を使用して、これが賢明なアプローチであり、2つの変数間の関係を推論するより良い方法がないことを確認します。

2)データに重み付けする必要はないと思います、私は確かにそれを試してみます(結果が変化しないことを願っています)。しかし、私はあなたによって重み付けします、登録サイズではなく、学校でのサンプルサイズで。その理由は、分析の単位や「母集団の重み付け」の必要性ではなく、推定についてです。有限のサンプルを使用して、各学校の教師と生徒の実際の回答の推定値のみを取得します。サンプル数が多い学校では、見積もりに自信が持てるので、相関関係や線形回帰のフィッティングに真剣に取り組んだ方が良いでしょう。


確認応答とアドバイスをありがとうございます。さまざまな理由(時間とリソースを含む)のため、このタイプの分析を使用せず、代わりに説明のみを示しました。2つの時点のみを使用して、傾向に関する相関関係の結論を出そうとすることに不快だったので、安全なルートを選びました。残念ながら、それは私のデータが私の研究目標に向かって言うべきことは多くないことを意味します。しかたがない。
アイリスツイ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.