このタイプの質問に対する正しい分析は何ですか?(条件付きロジスティック回帰?)


8

次の実験を踏まえて、以下の質問に答えるための正しい統計的方法は何ですか?

参加者は写真が連続して表示され、各写真の後にオブジェクトまたは顔のどちらを見たかに応答する必要があります。各試行(画像のプレゼンテーション)では、表示された画像(210の個別の顔の1つまたは210の個別のオブジェクトの1つ)に、一定量のランダムノイズ(5%から98%の間)が重ねられます。各トライアルで提示される画像はかなり小さいため、各トライアルにも背景があります。背景は黒、大きなオブジェクト、または大きな顔のいずれかです。個々の画像が一致します。つまり、個々の画像は合計3回表示されます。1回は黒い背景で、1回は大きなオブジェクトを背景として、1回は大きな顔を背景として表示されます。個々の画像に重ねられるランダムノイズの量は、3つの異なる背景条件にわたって一定に保たれます。大きなオブジェクトの背景にあるオブジェクトは変化せず、提示された210個の個別オブジェクト画像の1つに含まれていません。同様に、大きな顔の背景の顔は変化せず、表示される210個の個別の顔写真の1つには含まれません。背景にノイズは追加されません。

私が回答したいのは、3つの異なる背景条件間で、顔、オブジェクト、または両方の知覚が大きく異なるかどうかです。 回答したい質問の詳細については、下の質問5を参照してください

つまり、最後に、次のようなデータテーブルがあります。

+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| 参加者| カテゴリー| Pic ID | 騒音レベル| 背景| レスポンス* |
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| 1 | 0 | 1 | 5%| 1 | 0 |
| 1 | 0 | 1 | 5%| 2 | 0 |
| 1 | 0 | 1 | 5%| 3 | 0 |
| | | | | | |
| 1 | 0 | 2 | 24%| 1 | 0 |
| 1 | 0 | 2 | 24%| 2 | 1 |
| 1 | 0 | 2 | 24%| 3 | 0 |
| | | | | | |
| 1 | 0 | 3 | 80%| 1 | 1 |
| 1 | 0 | 3 | 80%| 2 | 0 |
| 1 | 0 | 3 | 80%| 3 | 1 |
| | | | | | |
| .. | .. | .. | .. | .. | .. |
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| 1 | 1 | 211 | 12%| 1 | 1 |
| 1 | 1 | 211 | 12%| 2 | 1 |
| 1 | 1 | 211 | 12%| 3 | 1 |
| | | | | | |
| 1 | 1 | 212 | 20%| 1 | 1 |
| 1 | 1 | 212 | 20%| 2 | 0 |
| 1 | 1 | 212 | 20%| 3 | 1 |
| | | | | | |
| 1 | 1 | 213 | 75%| 1 | 0 |
| 1 | 1 | 213 | 75%| 2 | 0 |
| 1 | 1 | 213 | 75%| 3 | 1 |
| | | | | | |
| .. | .. | .. | .. | .. | .. |
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +

ここで、カテゴリは面(0)またはオブジェクト(1)であり、応答も面(0)またはオブジェクト(1)です。参加者の応答は従属変数です。根底にある連続体を持つ二分法。すべての参加者は3つの背景条件すべてで測定されるため、依存関係のある設計です。1つの個別の画像について、3つの背景条件でノイズを一定に保つため、どういうわけかペアリングまたはマッチングされます。

最初にバイセリアル相関を計算し、t統計に基づいてそれらを比較することを考えましたが、その後、データ構造によりよく適合すると思われるロジスティック回帰を見ました。しかし、一致したサンプルと依存するデザインをどうにかして分析に組み込む必要があると私はまだ感じています。それで私がそれを検索したとき、条件付きロジスティック回帰がポップアップしました。

問題は、条件付きロジスティック回帰では、従属変数に対してマッチングが行われることです。通常、従属変数の1と1つ以上の0サンプルを照合します。従属変数ではなく、独立変数で一致しました(各背景条件で同じノイズレベルの同じ写真)。したがって、このデータに条件付きロジスティック回帰を使用することはできないと思いますが、適合する他のものを見つけることができませんでした。

統計の経験が豊富な誰かが、3つの異なる背景条件の間で、顔、オブジェクト、または両方の知覚が大きく異なるかどうか、上記の質問に答える正しい方法は何かを私に説明できますか?

ご協力ありがとうございました。

【実験手順】

実験には合計1260回の試行があります。210個の個別の顔と210個の個別のオブジェクトで構成され、それぞれ3回表示されます(3つの異なる背景のそれぞれで1回)。トライアルの順序はランダム化され、420回のトライアルの最初、2番目、最後のブロックでは、各背景が正確に140回表示され、個々のオブジェクトと個々の顔が1回表示されます。個々の顔やオブジェクトのすべてではなく、ほとんどの場合、異なる量のノイズが追加されますが、個々の顔やオブジェクトのノイズは、表示される3つの異なる背景条件で一定に保たれます。

[質問と回答]

1. 参加者は何人ですか?参加者は合計5名です。

2. ノイズに限界はありますか?ノイズは0.5%刻みで[5%、98%]の範囲で離散化されます。ノイズはノイズベクトルからランダムに(置換なしで)描画され、画像に割り当てられます。このベクトルには、0.5%のステップで5%から98%の間のすべての可能な値を含まないが、それらの値の一部をスキップし、他のいくつかの値を最大3回含むノイズ分布(カテゴリごとに210エントリ)が含まれます(質問3の回答))。これは、各参加者が同じノイズレベルを経験することを保証します(ただし、実験の最初にノイズレベルが個々の画像にランダムに割り当てられるため、同じ画像の可能性は低いです)。 (セットアップの場合)参加者が約50%の時間で画像を認識できるしきい値に近いノイズレベルです。このしきい値は、黒い背景に表示された同じ写真を使用する他の参加者との予備調査で見つかりました。したがって、この実験ではデフォルトの背景が黒になります。

3. 2つ以上の画像に同じレベルのノイズが表示される可能性はありますか?はい、これは数回発生し、同じレベルのノイズの個別の写真を3つまで含みますが、3つまでです。

4. ノイズと応答の関連付けに関心がないことを確認できますか?この質問に答えるのは難しいです。写真が見えにくい、つまりノイズが多い場合は、さまざまな背景の影響が(存在する場合でも)最も顕著になると予想されます。ですから、分析でノイズを考慮したいと思いますが、ノイズと応答の関連について何かを私に伝えるために分析を必ずしも必要とするわけではありません。私は、できるだけ多くの力を使って、バックグラウンド条件間のあらゆる種類の違いを検出することにのみ興味があります。最初に、3つの異なる背景条件(それぞれのカテゴリ対ノイズレベルで応答する確率)ごとに2つの心理測定曲線を当てはめ、心理測定の当てはめのシフトを比較して、背景条件の違いを確認しました。しかしながら、ブートストラップ分析により、フィッティング手順の分散が大きすぎて、予想される範囲のシフトを検出できないことが明らかになりました。したがって、ノイズと応答の関連に関する情報は、他の種類の分析の能力も低下させる可能性があると思います。これが事実なら、私はそれを必要としません。

5. 「知覚」と「両方」とはどういう意味ですか。実際に何が知りたいですか?「[カテゴリ]の認識」とは、正確なパーセントではなく「[カテゴリ]の回答」を意味します。私が持っている(と私はことをテストしたいのですが)、そのある仮定 -backgroundで応答する参加者影響する しかし、オブジェクトを -backgroundなりませで応答する参加者に影響を与えるオブジェクト(この仮定は読者としておそらく意味をなさないでしょうが、それは私がテストする必要があるものです)。私が「両方」で意味しているのは、顔の背景が参加者に影響を与えて顔で応答し、オブジェクトの背景が参加者に影響を与えて応答するケースである場合、顔の背景のみが効果を持つという私の仮定知覚については誤りでしょう。異なるノイズレベルが含まれているのは、画像が見にくい/認識しにくい場合に、カテゴリの1つに対する認識に影響を与える可能性が高くなるためです。したがって、いずれかのカテゴリの知覚に背景依存の影響がある場合、たとえば5%から20%のノイズ範囲ではなく、より高いノイズ範囲で表示される可能性は低くなります。

さらに情報が必要な場合はお知らせください。


2
「すべての参加者は3つの背景条件すべてで測定されるとおっしゃっていましたが、参加者は何人ですか。
ロバートロング

2
それは合計数になるのですか、それとも追加しますか?現在の5つだけでデータを分析する必要がありますか?
ロバートロング

できれば、現在の5で分析したいと思います。特定の状況により、年に6人しか測定できません。理論的にはもっと測定できますが、時間がかかるので避けたいです。
Simeon、

2
ノイズに限界はありますか(100%のノイズは意味がありませんが、たとえば99%はどうでしょう)?ノイズと応答の関連付けに関心がないことを確認できますか?また、各画像は一意ですが、2つ以上の画像に同じレベルのノイズが表示される可能性があります(ノイズはランダムに割り当てられるため)。
ロバートロング

はい、ノイズには限界があります。しかし、このコメントには十分なスペースがないため、投稿に情報を追加します。本当にありがとうございました。
Simeon

回答:


4

最初:

「すべてのモデルが間違っていることを忘れないでください。実用的な問題は、それらが役に立たないためにはどれほど間違っている必要があるかということです。」

ボックス、GEP; Draper、NR(1987)、経験的モデル構築および応答曲面、John Wiley&Sons。

したがって、データをモデル化する唯一の正しい方法はありません。

研究の質問は、カテゴリーの認識における背景タイプの関連付けについて広く尋ねていますが、2つの異なる質問があります。

  1. background = 3(face)はresponse = 0(face)に関連付けられていますか(研究仮説:はい)
  2. background = 2(object)はresponse = 1(object)に関連付けられていますか(研究仮説:いいえ)

あなたのセットアップは階乗です。因子(CategoryNoiseおよびBackground)のレベルを変化させ、これらのさまざまな組み合わせに対する応答を測定します。特に関心があるのは、バックグラウンド(3レベルの因子)と応答(バイナリ変数)の関連付けです。そのため、ロジスティック回帰分析で問題が解決されるようです。

  • の推定値はbackground=2、質問に答えます。背景がオブジェクトである場合と、背景が黒である場合との対数オッズの違いは何ですか。これは、研究の質問2に答えます。研究の仮説と一致するように、この推定値は小さく、かつ/または統計的に有意でない必要があります。
  • の推定値はbackground=3、質問に答えます。背景が黒の場合と比較して、背景が顔の場合のオブジェクトでの応答の対数オッズの違いは何ですか。したがって、この推定のマイナスは、背景が黒の場合と比較した、背景が顔の場合のでの応答の対数オッズの違いです。これは、研究の質問1に答えます。研究の仮説と一致するように、この推定値は小さく、かつ/または統計的に有意でない必要があります。

しかし、それで話は終わりではありません...

明らかに、参加者に対して測定を繰り返しており、これを制御する必要があります。ある参加者の応答は、他の参加者の応答よりも同じ参加者の他の応答に似ているためです(つまり、各参加者)。これは、ランダムなインターセプトを含めることによって、ParticipantまたはParticipant固定効果として含めることによって制御できます。5は、変量効果として使用される因子のレベルの最小数と見なされます。研究にさらに参加者を追加するつもりなので、これが私の推奨です。どちらの方法でも繰り返し測定を制御できるため、両方のモデルを実行できます。両方を以下に示します。

また、各画像が3回測定される各画像で測定を繰り返しました。したがって、各画像内にも相関がある場合があります。420の異なる画像があるので、これを制御する固定効果として画像を含めるのは良い考えではないので、ランダムインターセプトが適切です。だから、私の出発モデルは、ランダムな切片と混合効果モデルであろうPicture_IDParticipant、のための固定効果とCategoryBackground及びNoise(数値としてコード化されたノイズを有します)。参加者は写真や写真内にネストされておらず、参加者内にもネストされていないため、これらはランダムな効果と交差しています。

R使用したlme4パッケージを、これは次のように指定することになります。

glmer(Response ~ Category + Background + Noise + (1|Participant) + (1|Picture_ID), data=dt, family=binomial(link=logit))

参加者が少ないため、代替モデルは次のとおりです。

glmer(Response ~ Category + Background + Noise + Participant + (1|Picture_ID), data=dt, family=binomial(link=logit))

分析は、以下を可能にするために拡張できます。

  • 固定効果間の相互作用

  • 応答とノイズの間の非線形の関連付け(ノイズの2次項および場合によってはより高次の項を含めることにより)

  • ノイズの関連付けは、参加者や画像間で変化します(ノイズのランダム係数を含めることにより)

上記は、目的の背景と黒の背景のコントラストに基づいています。つまり、顔と黒オブジェクトと黒です。場合物体VS顔が必要である。この因子を再コーディングまたは直接基準レベルを指定することによって処理することができます。場合ではない顔VS顔またはオブジェクト対ないオブジェクトが要求され、これは容易にダミー変数を作成することによって達成することができます。


ご回答どうもありがとうございました。私はRを使い始めたばかりなので、lme4パッケージを調べて例を完全に理解する必要がありますが、あなたが説明することは、私が探しているものと非常によく似ています。
Simeon、

0

条件付きロジスティック回帰によって、望ましい結果が得られると思います。

このデータを分析するときに、反復測定の規則を使用する必要性を正しく識別します。5つの回答者が、複数の条件での顔/オブジェクトの正しい/正しくない認識のバイナリ結果について評価されました。1人からの多数の応答により、反復測定アプローチの必要性が生じます。

回答者が顔またはオブジェクトのどちらを選択するかという意図が実際によく示されている場合は、同じ分析アプローチを使用できますが、回答者の選択は正しい/正しくない分類ではないと解釈することに注意してください。「両方」の3番目のカテゴリでは、多項ロジスティック回帰が必要になります。以下の正しい/誤った分類に興味があると思います。

「すべての参加者は3つの背景条件すべてで測定されるため、それは依存型設計です。1つの個別の画像では、3つの背景条件にわたってノイズを一定に保つため、何らかの形でペアリングまたはマッチングされます。」評価中の条件は、その値または品質に制限がありますが、分析を「調整」するものではありません。灰色の背景、45%ノイズのある顔写真の使用は、応答が記録されたときに存在する共変量の1つのベクトルにすぎません。灰色の背景、オブジェクト、45%のノイズは別のベクトルですが、白、顔、10%のノイズは別のベクトルです。回帰は、バックグラウンド(ダミーコード)、ノイズ、または追加の変数が正しい応答に関連付けられているかどうかを示します。他のすべての値を一定に保ちながら、任意の1つの値の正しい識別と変更の間の関連付け、多変数回帰の解釈です。したがって、条件付きロジスティック回帰を使用して、背景またはノイズの1単位の違いまたは顔/オブジェクトが表示されたかどうかの関連性の感覚を得ることができます。

Rでのモデルは次のようになります。

install.packages("survival")
require("survival")
clogit(correct ~ background + noise + pic_type + strata(person), data)

画像内の特定の顔やオブジェクトごとに、より複雑なモデルを検討することもできますが、背景の望ましい効果を検出する能力が薄れます。


2
問題は、参加者がオブジェクトまたは顔を正しく選択したかどうかではなく、(OPからの引用)「3つの異なる背景条件の間で、顔、オブジェクト、または両方の知覚が大幅に異なるかどうか」
Joe King

1
「知覚」の分析は、(1)顔またはオブジェクトの選択、または(2)提示されたものの正しい選択の2つのうちの1つとしてのみ理解できます。イベントスペースには、これら2つの可能性のみが含まれているようです。したがって、「両方」をどのように分析できるかわかりません。元のポスターは、どちらが望ましいかを検討する必要があります。私の答えは、結果について曖昧であると私が認識していることを反映しています。私はまだコメント機能を持っていないので、あいまいさを答えでカバーしました。
トッドD

私が知覚で何を意味するのかについて具体的ではなく、さまざまな条件の悪い例を選んだことをお詫びします。私は、未発表の研究の詳細を公表しないことと、(明らかに)分析に違いが生じない本物に十分近いことの間の狭い道を歩かなければなりません。私はうまくいかなかったようで、これが誰かの時間を無駄にしてしまったことをお詫び申し上げます。私はすべての未解決の質問を明確にすることを期待できる情報のブロックをもう1つ追加しました。この変更によってだまされたと感じる人がいたら、私に知らせて、私に何ができるか見てください。
Simeon

@シメオン私はまだあなたの研究の問題を完全に理解しているのかわかりません。ただし、(1)背景が顔の知覚に影響するかどうか、および(2)背景がオブジェクトの知覚に影響するかどうかの両方をテストする場合は、顔またはオブジェクトが表示されたかどうかでデータセットを分割できます。その後、1つの分析でオブジェクトを表示したときに、さまざまな背景のオブジェクト認識における背景の役割を評価できます。他の分析では、顔が表示されたときに、顔認識に対する背景の影響を評価します。これはあなたの意図に近づきますか?
トッドD

お返事ありがとうございます。データセットを分割するつもりはありませんが、参加者の反応を顔に偏らせる効果が顔の背景にノイズのあるオブジェクトを提示する試行でも発生する可能性があるためです。
Simeon、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.