マーサーの定理は逆に機能しますか?


11

同僚には関数あり、私たちの目的ではそれはブラックボックスです。この関数は、2つのオブジェクトの類似度を測定します。ss(a,b)

は次のプロパティがあることは確かです。s

  1. 類似性スコアは、0から1までの実数です。
  2. 自己同一のオブジェクトのみのスコアが1です。したがって、意味しその逆も同様です。s(a,b)=1a=b
  3. ことが保証されています。s(a,b)=s(b,a)

ここで彼は、入力として距離を必要とし、距離の公理を満たす入力に依存するアルゴリズムを使用したいと考えています。

私の考えは(それがユークリッドノルムまたは他の距離かもしれない)、私達はちょうど代数で並べ替えることができ、すなわち、彼らはいくつかの距離とRBFカーネルの結果であるかのように、我々は類似性スコアを扱うことができることだったと仮定類似度スコアは、を参照していることいくつかの(不明な)座標系のポイントのペアのRBFカーネル。

s(xi,xj)=exp(d(mi,mj)2r)rlogs(xi,xj)=d(mi,mj)

ここで、は不明なベクトルで、は対象のオブジェクトで、は距離です。mαRnxαd

距離公理を尊重するという点で、明白な特性がうまくいきます。結果は負でない必要があり、距離は同一のオブジェクトに対してのみ0です。しかし、このかなり一般的な一連の状況が、三角形の不平等が尊重されることを暗示するのに十分であることは明らかではありません。

一方、これはちょっとクレイジーに聞こえます。

「そこに存在しないされて、私の質問は、だから、、その結果用上のこれらのプロパティ与えられたいくつかの距離メトリック、その何である?」ff(s(a,b))=d(a,b)dsf

場合上のこれらの一般的な状況では存在しない、そのための要件の追加セットがあり存在しますか?fsf


3
距離の公理を満たすペアワイズ距離のセットが与えられた場合でも、これらの距離を実現する点を持つユークリッド空間があるとは限りません。このような埋め込みは常に可能とは限りません。たとえば、math.stackexchange.com / questions / 1000006を参照してください。d(a,b)
アメーバはモニカを復活させます

これは非常に興味深いスレッドです!共有していただきありがとうございます。自分を特定の距離に制限するつもりはありませんでした。(反対方向に移動するため、ユークリッド距離以外の距離でRBFカーネルを使用する可能性があります。)
Sycoraxは

だからあなたの質問は、をに変換して、が三角形の不等式を満たすようにする方法についてです?この距離の行列がユークリッド空間に埋め込まれるかどうかは、あなたには関係ありません。正しい?私の直感は、任意に対しては不可能だということです。s(a,b)d(a,b)=f(s(a,b))ds
アメーバは、モニカを

正解です。これは、少なくともに対する追加の制限なしでは不可能ではないかと思います。s
Sycoraxによると、モニカは

f:f(x)=Ix>0常に離散メトリック(en.wikipedia.org/wiki/Discrete_space)につながりますが、これはおそらく意図されていないため、いくつかの条件を追加する必要があります(?)
Juho Kokkala

回答:


6

マーサーの定理は逆に機能しますか?

すべての場合ではありません。

ウィキペディア:「数学、特に機能分析では、マーサーの定理は、製品関数の収束シーケンスの合計としての正方形の対称正定関数の表現です。この定理は、(Mercer 1909)で提示されたものの1つです。 James Mercerの研究の最も注目すべき結果です。これは、積分方程式の理論における重要な理論的ツールです。確率過程のヒルベルト空間理論で使用されます。たとえば、Karhunen–Loèveの定理です。また、特性化にも使用されます。対称的な正定値カーネル。

これは、ヒルベルト空間の多対1マッピング」です。- 全体的な単純化は、それをハッシュまたはチェックサムとして記述し、ファイルに対してテストしてIDかどうかを判断することです。

より技術的な説明:崩壊定理

「数学では、分解定理は測度理論と確率理論の結果です。問題の測度空間の測度ゼロサブセットへの測度の非自明な「制限」の考え方を厳密に定義します。これは、条件付き確率測度の存在。ある意味では、「分解」は製品測度の構築とは逆のプロセスです。

参照:「Fubini–Tonelliの定理」、「ヒンジ損失」、「損失関数」、および「類似性の尺度として使用した場合のカーネルの有効」(2007年6月)、Nathan Srebroによる要約:

" 要約。最近、BalcanとBlumは、正の半定値カーネルではなく、一般的な類似性関数に基づく学習理論を提案しました。カーネルベースの学習に基づく学習保証と、 BalcanとBlumによって開かれたままにされた類似性関数としてのカーネル。類似性関数として使用した場合のカーネル関数の優れた限界を大幅に改善し、結果をより実用的なヒンジ損失にも拡張します。さらに、この限界はタイトであることを示しているため、従来のカーネルベースのマージンの概念と新しい類似性ベースの概念の間に実際に実際のギャップがあることがわかります。

同僚には関数あり、私たちの目的ではそれはブラックボックスです。s

参照:カーネルと類似性(R)

これはブラックボックスであるため、カーネルベースの場合、どのカーネルが使用されているかはわかりません。また、どのカーネルであるかがわかれば、カーネルの実装の詳細もわかりません。参照:kernlabのrbfKernelの方程式は標準とは異なりますか?

一方、これはちょっとクレイジーに聞こえます。

限られた状況下では、迅速かつ効果的です。ハンマーのように、ハンマーを一緒に運ぶと、人々はあなたをクレイジーと呼びますか?

" カーネルメソッドの名前の由来はカーネル関数の使用にあります。これにより、空間内のデータの座標を計算することなく、画像間の内積を計算するだけで、高次元の暗黙的特徴空間で操作できます。特徴空間内のすべてのデータのペアのこの操作は、座標の明示的な計算より計算コストが低いことがよくあります。このアプローチは「カーネルトリック」と呼ばれます。シーケンスデータ、グラフ、テキスト、画像用のカーネル関数が導入されています。ベクターだけでなく。

レッスン:あなたは(時々)あなたが支払うものを手に入れます。

「そこに存在している私の質問は、だから、、その結果用上のこれらのプロパティ与えられたいくつかの距離メトリック、その何である?」ff(s(a,b))=d(a,b)dsf

多くは、リンク上で、「参照の人気のカーネル関数」、RBF「:、ここでの1(高価な)例フーリエ変換の間の類似性は、時系列の変換のための尤度比距離尺度ヤナーチェク、Bagnallとパウエルによって、(2005)」。

場合上のこれらの一般的な状況では存在しない、そのための要件の追加セットがあり存在しますか?fsf

異なる空間と方法は、特定の問題の比較(および分解)をより的確に対象とすることができます。ヒルベルト空間だけのための多くの方法があります。

はい、リストは大きいです。上記のリンクを参照してください。(一例として):カーネルヒルベルト空間を再現しています


-1

しかし、このかなり一般的な一連の状況が、三角形の不平等が尊重されることを暗示するのに十分であることは明らかではありません。

実際、それだけでは十分ではありません。作業しましょう。3つの点、、、および場合、であるため、三角形の不等式は失敗します。d(a,b)=1s(a,b)x,y,zd(x,y)=13d(y,z)=13d(x,z)=1d(x,z)>d(x,y)+d(y,z)


1
これがどのように証明されるかはわかりません。
アメーバはモニカを復活させます

@amoebaが三角形の不等式を満たす必要がないことを証明する方法がわかりませんか?d
コディオロジスト

2
これは、しても機能しないことを示していると思いますが、これは、(奇妙な)私は私の記事で概要を説明します。f(α)=1α
Sycoraxは、モニカを

1
問題は、リストされたプロパティががメトリックであるようなの存在に十分であるかどうか、特にそのようながマッピングあるRBFカーネルで表現できるかどうかです。この回答は、リストされたプロパティが、が任意のメトリックであるために十分であるかどうかを尋ねているようです。sfdfmsdf
Juho Kokkala

1
@Kodiologist、しかし私が理解している限り、編集履歴の非常に最初のバージョンでさえ、未知のマッピング持つRBFに関する部分が含まれているため、での作業の関連性がわかりません。そして、あなたの以前のコメントに関して、私が質問を読んだとき、 sが sにどのようにマッピングされるかについて何も「知っている」べきではありません-反例は、そのようなマッピングが反例に対して構築できないことを示す必要があります-。m1s(a,b)xαmαs
Juho Kokkala
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.