統合した2つの調査のデータを分析しています。
2005-06年および2007-08年の学校職員調査
2005-06年から2008-09年までの学生の調査
これらの両方のデータセットについて、3つの異なる学区からの観察(学生またはスタッフレベル)があり、それぞれがそれぞれの学区内の代表的なサンプルを毎年持っています。
分析のために、学生のデータを2つの2年間(2005年7月と2007年9月)に結合しました。次に、各データセットを「ドプライ」して、カットオフに従って質問に回答したスタッフまたは学生の割合を取得しました(たとえば、肯定的に答えた、「同意した」、または学生がアルコールを使用したとマークしたかどうかなど)。等。)。したがって、スタッフレベルと学生レベルのデータセットを一緒にマージすると、学校が分析の単位となり、2年間の期間に学校ごとに1つの観測しか得られません(学校に特定の期間のデータが欠落していなかった場合) )。
私の目標は、スタッフと学生の反応の関係を推定することです。これまでのところ、私の計画は、各学区のすべての変数(すべてパーセンテージを表す連続応答であるため)間のピアソン相関係数を取得することでした(これにより、このデータセット内の他の学区の一般化可能性の仮定が排除されるため)。 。これを行うには、とにかく2年間の地区データを平均して、学校ごとに1つの観測値のみを取得します。
質問:
- これは適切な分析計画ですか?私がより良い推論または力を提供できる他の方法を使用できますか?
- 私の計画が適切である場合、学校の登録に基づいて加重相関を取得する必要がありますか(相関係数に不釣り合いに寄与している大学校よりも小学校が多いため)。
私はこれについてデータ管理者に尋ねましたが、私のデータに重みを付ける必要性を決定する主な要因は、学校の規模が相関の程度に影響を与えるかどうか、そして私の解釈が学生レベルか学校レベルのどちらになるかであると述べました。私の解釈は学校レベルになると思います(たとえば、「この方法で答えるスタッフの割合がこの学校は、この方法で答える生徒のこの割合と相関しています...」)。