私は科学を専攻していて、私の統計学の知識は表面的なものです。
問題
データセットを見つけ、統計コースの課題として自分の能力を最大限に活用して分析する必要がありました。これはもはや課題ではありません。分析がうまくいかなかった理由と代わりに何をすべきかを解釈するのに助けが必要です。
私はニュージーランドの雇用率のカテゴリーデータセットを使用して、2x2分割表に配置し、ピアソンのカイ2乗検定とフィッシャーの正確確率検定を使用して、性別が雇用と相関しているかどうかを検定しました。
答えたいこと
- この問題に対してカイ2乗検定とフィッシャーの正確確率検定を使用できない理由を理解し、代わりに何を使用すべきかを理解してください。「時間の関数としてのオッズ比」と思いますか?Rで完全にそれを行う方法に関する有用なリンクはありますか?
- 割り当ての最初の部分に関する「順次相関」コメントと、正確に何をすべきかを理解してください。
私を助ける方法#1(短い)
データは次のとおりです(国勢調査に基づく)。
Male Female
Employed 1201600 1060200
Unemployed 73300 75000
Rでカイ2乗検定とフィッシャーの正確確率検定を行いました。得られたp値から、nullがtrue(男性と女性)である場合に、このような仕事の分布(または1つ以上の極値)の確率がわかると想定しています。就職のチャンスは同じです)。私は非常に小さいp値を取得しました。フィッシャーのテストでは、オッズ比1.16が得られました。これは、相関関係があり、特に男性がニュージーランドで就職する可能性が16%高いことを意味します。
しかし、私の講師によると、私はこれらのテストを不適切に使用しました。理由はよくわかりませんでしたが、これらのテストは独立性を前提としていると彼は言っていたと思います。NZには一定量の求人があるため、サンプルは独立していないので...下に引用されている彼のフィードバックを見ることができます)。
私を助ける方法#2(長い)
時間に余裕があれば、課題全体をご覧いただければ幸いです。講師からのフィードバックも添えてお伝えしますので、よろしくお願いします!割り当ては数学者/統計学者にとって非常に簡単であり、そこには2つの質問しかありません。私がやっていることを知っていることを実証しようとしたところ、パディングでいっぱいになりました。ほとんどはスキップできます。
これが、私が成功しなかった割り当てを含むPDFファイルへのリンクです。statisticsassignment.pdf。
講師のフィードバック
図1は逐次相関を示しています。これが線形回帰が機能しない本当の理由です。フィッシャーのテストもカイ二乗も、2x2テーブルには適していません。これは、均一性をテストしたいが、独立性がないためnullを拒否しているためです(これは興味深いことではありません)。この2つの違いはここでは関係ありません(どちらの場合も漸近的に同一です)。時間の関数としてオッズ比をプロットすることもできます。