多くの肯定的で重要でない結果がある場合、「これらの結果のうち少なくともが肯定的」であることをテストできますか?


9

100人の異なる個人に対して同じ回帰を別々に実行したとしましょう。私の関心のある係数は正です(そして互いにかなり異なります)が、100の結果すべてで統計的に重要ではありません(すべてのp値= 0.11としましょう)。

これらのp値を組み合わせて、「これらの結果の少なくとも80が正である」とp = 0.11よりも有意性があると結論付ける方法はありますか?私のオンライン検索では、「これらの結果の少なくとも1つが陽性である」とフィッシャーまたは同様のテストで言う方法を示しただけですが、その結果を一般化することはできませんでした。「H0 = 100のすべての効果が0で同じである」に対して、「HA =少なくとも80の効果が陽性」に対してテストしたい。

私の目標は、平均して正の係数があると言うことではなく、係数を具体的に測定することでもありません。私の目標は、少なくとも80人がそれぞれの80に関係なく、また各個人が感じる影響の大きさに関係なく、個々に何らかのプラスの影響に直面したことを、有意義に示すことです。


2
「100人の個人に対して同じ回帰を別々に実行する」とはどういう意味ですか?-これは、100のデータセットがあり、それぞれに同じ応答変数と説明変数のセットに関する複数の観測があることを意味しますか?これがどのように機能するかはわかりません。たとえば、個人の身長と体重を比較したい場合、個人ごとに1つの観測値しかないので、回帰をどのように当てはめますか?おそらく、個人ごとに時系列がありますか?その場合は、とにかく高度な手法が必要です。検索用語を探している場合、それは長期的な分析の1つの形式です。
Peter Ellis

回答:


8

関心のあるランダム変数自体を使用して、100個すべての分析を単一の混合効果モデルとして実行する必要があります。こうすることで、全体の平均を含むこれらの係数の分布を推定できます。これにより、私が探しているような解釈が得られます。

なお、私がそうであるように、個人ごとに時系列がある場合は、残差の自己相関も修正する必要があります。


お時間をいただき、ありがとうございました。はっきりさせていただければ、時系列です。5年間で100人すべてのデータがあるとします。3年目に、100人すべてのダミー変数(関心のある独立変数)が同時に1に変わります。私はその変化が一人一人に与える正確な影響や平均的な影響については気にしません。むしろ、少なくとも80人がそれぞれ影響を受けたことを確認したいだけです。係数はすべての100で正ですが、それぞれは重要ではありません。係数の分布を測定することがそれを達成するかどうかはわかりません。
user28239 2013

1
それはあなたが持っていたと私が推測したものです。私の推奨するアプローチは正しいものだと思います。その後、モデルを使用して、予測やその他の必要な解釈を行うことができます。
Peter Ellis

4

最も単純やる事は、おそらく符号検定だろう。帰無仮説は、各結果が正または負である確率が等しい(公正なコインを弾くような)ことです。目標は、観測された結果が、この帰無仮説のもとでは拒否できるほど十分ではないかどうかを判断することです。

公正なコインの100枚の裏返りから80以上の表が出る確率はどれくらいですか?これは、二項分布を使用して計算できます。ではR、関連する関数が呼び出されpbinom、次のコード行を使用して(片側)p値を取得できます。

pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)

このテストによると、あなたの直感は正しいです。治療が効果がない場合、偶然に80の肯定的な結果が得られることはほとんどありません。

密接に関連するオプションは、ウィルコクソンの符号付き順位検定のようなものを使用することです。


より良いアプローチは、あなたが実際に効果の大きさを(ちょうどそれがゼロかどうかよりも大きくなる傾向があるかどうかを判断するのではなく)を推定したい場合は、おそらく階層(「混合」)モデルになります。

ここで、モデルは100人の個人の結果が分布からのものであり、その目標はその分布の平均が(信頼区間と共に)どこにあるかを確認することです。

混合モデルを使用すると、効果のサイズについてかなり多くのことを言うことができます。モデルをフィッティングした後、「データは真の平均と一致しますが、処理によって結果が平均3単位向上する傾向があると推定します効果のサイズは1.5から4.5ユニットの範囲です。また、個人間で多少のばらつきがあるため、特定の人が-0.5から+6.5ユニットの範囲で効果を見る可能性があります。

これは、非常に正確で有用なステートメントのセットです。「平均して、おそらく効果は正である」よりもはるかに優れているため、このアプローチは統計学者に好まれる傾向があります。しかし、そのすべての詳細が必要ない場合は、最初に述べたアプローチでも問題はありません。


0

多分私はそれを完全に間違っていますが、私には、あなたが繰り返し測定ANOVAを実行しようとしているように見えます。この「ダミー」を被験者内要因として定義するだけで、モデルが残りを行います。重要性自体はあまり有益ではありません。必須ですが十分ではありません。どのモデルでも、十分に多数の観測値があると重要になります。(部分的な)Eta-Squaredのような効果のサイズを取得して、効果の「大きさ」を知ることができます。私の2セント。


0

通常のANCOVA計算と同じくらい簡単かもしれませんが、データを分析する適切な方法は、物理的な状況に依存し、それらの詳細を提供していません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.