間に数学的な関係はありますか?
計算を重ねてみましたが、シンプルで面白いリンク(式)にたどり着けませんでした。あるかしら。
たとえば、角度は不均一なスケーリングでは保持されませんが、元の角度と不均一なスケーリング後の角度の関係はどうですか?ベクトルS1のセットとベクトルS2の別のセットの間のリンクについては何が言えるでしょうか。S2はS1を不均一にスケーリングすることによって得られます。
間に数学的な関係はありますか?
計算を重ねてみましたが、シンプルで面白いリンク(式)にたどり着けませんでした。あるかしら。
たとえば、角度は不均一なスケーリングでは保持されませんが、元の角度と不均一なスケーリング後の角度の関係はどうですか?ベクトルS1のセットとベクトルS2の別のセットの間のリンクについては何が言えるでしょうか。S2はS1を不均一にスケーリングすることによって得られます。
回答:
なぜなら非常に一般的であり、コサイン類似度の変化は、特定に依存ととのそれらの関係、明確な式は不可能です。ただし、コサインの類似性がどれだけ変化するかについては、実際に計算可能な限界があります。それらは、と間のコサイン類似度が指定された値、たとえば(はと間の角度ある場合、と間の角度を極値化することによって見つけることができます。答えは、角度A B M M A M B A B cos (2 ϕ )2 ϕ A B 2 ϕ M変換によって曲げられる可能性があります。
計算は面倒になる恐れがあります。表記のいくつかの賢い選択は、いくつかの予備的な簡略化とともに、労力を減らします。これは、ことが判明した二次元のソリューションは、我々が知る必要があるすべてを明らかにする。 これは扱いにくい問題であり、1つの実変数のみに依存します。これは、微積分手法を使用して簡単に解決できます。単純な幾何学的引数は、この解を任意の数の次元拡張します。nは
定義により、任意の2つのベクトルと間の角度の余弦は、それらを単位長に正規化し、それらの積をとることによって得られます。したがって、B
そして、書き込み、の画像との間の角度の余弦及び変換の下でありますA B M
M M M V ' D U自体ではなく、分析ではのみが重要であることに注意してください。したがって、問題を単純化するためにの特異値分解(SVD)を利用することがあります。これは、を直交行列、対角行列、および別の直交行列積(右から左)として表すことを思い出してください。
言い換えると、特権ベクトル(の列)の基礎があり、は、の対角エントリによって各個別に再スケーリングすることによって動作し(これを呼び出します))その後、回転(または回転防止)を結果に適用します。この最終的な回転によって長さや角度が変わることはないため、は影響しません。あなたは計算でこれを正式に見ることができます V M E 、I 、I 番目の D D I U Σ
したがって、を調べるために、をと同じ値を生成する他の行列に自由に置き換えることができます。サイズが小さくなるようにことで(そしてがまったくゼロではないと仮定して)、のな選択は次のです。M (1 )からe iは、dは私に M Mを
の対角要素は
具体的には、すべての角度に対するの効果(元の形式または変更された形式のいずれであっても)は、次の事実によって完全に決定されます。
ましょう。ベクトルの長さを変更してもそれらの間の角度は変更されないため、とは単位ベクトルであると想定できます。平面では、そのようなすべてのベクトルをとのなす角度で指定できるため、A B e 1
したがって
(下図参照)
適用は簡単ですと最初の座標を修正し、2番目の座標にを乗算します。したがって、からへの角度はA B λ 2 M A 、M B
は連続関数であるため、この角度の差は連続関数です。実際、それは区別可能です。これにより、導関数の零点を調べることにより、極値角度を見つけることができます。その導関数は簡単に計算できます。これは三角関数の比率です。ゼロはその分子のゼロ間でのみ発生する可能性があるため、分母を計算する手間を省きましょう。私達は手に入れましたθ F "(θ )
、、およびの特殊なケースは簡単に理解できます。これらは、ランクが低い場合に対応します(したがって、すべてのベクトルを線に押しつぶします)。ここで、は単位行列の倍数です。また、とは平行です(に関係なく、それらの間の角度は変更できません)。ケースは、条件によって除外され。λ 2 = 1 φ = 0 M M A B θ λ 2 = - 1 λ 2 ≥ 0
これらの特別な場合を除いて、ゼロは、つまりまたはます。これは、によって決定される線が角度二等分することを意味します。と間の角度の極値は値の間にある必要があることがわかったので、それらを計算してみましょう。θ = 0 θ = π / 2 E 1 A B M A 、M BのF (θ )
対応するコサインは
そして
多くの場合、が直角を歪める方法を理解することで十分です。この場合、、になります。これは、前の数式に挿入できます。
が小さくなるほど、これらの角度が極端になり、歪みが大きくなることに注意してください。
この図は、角度で分離されたベクトルと 4つの構成を示しています。下の単位円とその楕円形のイメージは、参照用に陰影が付けられています(のアクションがになるように一様に再スケーリングされています)。図の見出しは、と中点であるの値を示します。によって変換されたときにこのようなと最も近いものは、左側にあるような構成です。それらが最も離れている可能性があるのは、した右側の構成です。2つの中間的な可能性が示されています。
が各次元を係数だけ拡張することによってどのように作用するかを見てきました。これにより、単位球が楕円に変形されます。その主軸を決定します。楕円体に、これらの軸に沿って、原点からの距離です。したがって、ある最小である最短距離楕円と最大のもの、原点から(任意の方向に)、ある遠い距離楕円の原点から(任意の方向で)。
より高次元のでは、とは2次元の部分空間の一部です。 は、この部分空間の単位円を、楕円体とおよびを含む平面との交点にマッピングします。この交点は円の線形歪みであり、楕円です。明らかに、この楕円までの最遠距離はあり、最短距離は以上です。
前のセクションの終わりで観察したように、最も極端な可能性は、対応する比率が可能な限り小さい2つのを含む平面にとが配置されている場合です。これは、平面で発生します。 その場合の解決策はすでにあります。
余弦類似性を持つ2つのベクトルにを適用することによって達成可能な余弦類似性の極値は、および与えられます。これらは、ベクトルを最大に伸ばす方向(方向など)に等しい角度でとを配置し、ベクトルを最小に伸ばす方向にそれらを分離することによって達成されます(方向など)。など)方向。
これらの極値は、のSVDに関して計算できます。
あなたはおそらく興味があります:
(またはPCAと呼ぶ人)を対角化できます。これは変換下での類似性がを主成分に射影ことによって動作することを示し、その後この新しい空間の類似度を計算します。これをもう少し具体化するために、主成分を固有値を持つとします。その後
あなたに与える:
ここでスケーリングが行われていることに注意してください。は伸縮しています。場合単位ベクトルとなら毎いる、次に回転に対応し、あなたが得る:ありますローテーション下では内積は不変であると言うのと同じです。一般に、がコンフォーマル変換である場合、角度は同じままです。この場合、が反転可能であり、の極分解がでを満たす、つまります。 A 、B λ I = 1 M SIM(M A 、M B