この種の問題に対する適切なアプローチは、Cox et al(2000)による論文The Bayesian Image Retrieval System、PicHunterのセクション4にあります。データは、結果の整数の集合である Nは試行回数です。あなたのケースでは、トライアルごとに3つの可能な結果があります。私ができるようになるAは私が取り残された顔のインデックスです。アイデアは、いくつかのモデルパラメーターを指定して結果の生成モデルを仮定し、最尤法でパラメーターを推定することです。顔(X 1、X 2、Xあ1、。。。、ANNあ私および参加者が(X 2、X 3)が最も類似しているとすると、結果は A = 1であり、確率は
p (A = 1 | X 1、X 2、X 3)∝ exp (− d (X 2、X 3)/ σ )
ここで d (X 2、X 3)(X1、X2、X3)(X2、X3)A = 1
p (A = 1 | X1、X2、X3) ∝ exp( − d(X2、X3)/ σ)
d(X2、X3)は、面2と3の間の距離です
は、「ノイズ」の量(つまり、参加者の一貫性の程度)のパラメータです。ユークリッド空間への埋め込みが必要なため、距離の測定は次のようになります:
d (x 、y )= √σθxは、顔の埋め込み(未知)である
X。このモデルのパラメーターは
θと
σであり、最尤法を使用してデータから推定できます。紙は、勾配上昇を使用して最大値を見つけました。
d(x,y)=∑k(θxk−θyk)2−−−−−−−−−−−−√
θxxθσ
紙は未知の埋め込みではなく、画像の既知の属性を使用して距離を計算したため、紙のモデルは少し異なりました。埋め込みを学ぶには、はるかに大きなデータセットが必要であり、各顔が複数回表示されています。
この基本モデルは、すべての試験が独立しており、すべての参加者が同じであることを前提としています。このアプローチのすばらしい利点は、モデルを簡単に装飾して、非独立性、参加者効果、または他の共変量を含めることができることです。