簡単な方法の1つは次のとおりです。
2つの優先質問では、2つの回答者の回答の絶対差を取り、4つの代わりに2つの変数、たとえばz1とz2を与えます。
重要性の質問については、2つの回答を組み合わせたスコアを作成する場合があります。たとえば、応答が(1,1)の場合、1を指定すると、(1,2)または(2,1)は2を取得し、(1,3)または(3,1)は3、(2,3)または(3,2)は4を取得し、(3,3)は5を取得します。これを「重要度スコア」と呼びましょう。代わりに、max(response)を使用して、5ではなく3つのカテゴリーを指定することもできますが、5つのカテゴリーバージョンの方が良いと思います。
ここで、デフォルト値がすべてゼロの10個の変数x1-x10(具体的に)を作成します。最初の質問の重要度スコアが1の観測値= 1、x1 = z1。2番目の質問の重要度スコアも= 1、x2 = z2の場合。最初の質問の重要度スコアが2の観測値= 2、x3 = z1で、2番目の質問の重要度スコアが2の場合、x4 = z2というようになります。各観測値について、x1、x3、x5、x7、x9!= 0のいずれか1つ、x2、x4、x6、x8、x10についても同様です。
これをすべて実行したら、バイナリ変数の結果をターゲット変数として、x1-x10をリグレッサとしてロジスティック回帰を実行します。
これのより洗練されたバージョンでは、男性と女性の回答者の重要度を異なる方法で処理できるようにすることで、より重要度のスコアを作成する場合があります。たとえば、a(1,2)!= a(2,1)では、性別で回答を並べています。
このモデルの欠点の1つは、同じ人物の複数の観測値がある可能性があることです。つまり、大まかに言えば、「エラー」は観測値間で独立していないということです。ただし、サンプルに多くの人がいる場合、おそらく最初のパスではこれを無視するか、重複がないサンプルを作成します。
もう1つの不足は、重要度が高くなると、p(fail)の設定間の特定の差異の影響も大きくなることであり、これは(x1、x3、x5、x7、x9)の係数と(x2、x4、x6、x8、x10)の係数の間。((2,2)の重要度スコアと(1,3)の重要度スコアとの関係は私にはアプリオリに明確ではないため、おそらく完全な順序ではありません。)ただし、モデルではそれを課していません。私はおそらく最初はそれを無視し、結果に驚いたかどうかを確認します。
このアプローチの利点は、「重要性」と嗜好応答の違いの間の関係の関数形式について仮定を課さないことです。これは前の不足コメントと矛盾しますが、課されている関数形式の欠如は、係数間の予想される関係を考慮に入れていない関連の失敗よりもおそらく有益であると思います。