導入と表記:
(私の実験によれば)終了するように見える私のアルゴリズムの新しくてシンプルなバージョンがここにあります、そして今私はそれを証明したいと思います。
表記ましょを参照して、P次元データ点(ベクトル)。A、B、Cの3つのセットがあります。A | = n、| B | = m、| C | = l:
A = { x i | 私は= 1 、。。、n } B = { x j | j = n + 1xi∈Rpp|A|=n|B|=m|C|=l
A={xi|i=1,..,n}
C = { x u | U = N + M + 1 、。。、n + m + l }B={xj|j=n+1,..,n+m}
C={xu|u=n+m+1,..,n+m+l}
所与、聞かせて、D A 、X iはからの平均ユークリッド距離を示すX IのにKの点に最も近いAを、及びD C X I示すからの平均ユークリッド距離X Iのにk個の点に最も近いC。k∈N∗dAxixikAdCxixikC
アルゴリズム:
ABBCACB
- A′={xi∈A∣dAxi>dCxi}
- A=A∖A′B=B∪A′
- B′={xi∈B∣dAxi<dCxi
- B=B∖B′A=A∪B′
- ABBA|A|≤k|B|≤k
アルゴリズムは次の2つの場合に終了します。
- |A||B|k
- A′=B′=∅
質問:
∑x∈AdCx+∑x∈BdAx∑x∈AdAx+∑x∈BdCx∑x∈AdAx+∑x∈BdBx∑x∈AdBx+∑x∈BdAx
ノート:
- kxSkxSxk=1
- A,B,C∀xi∈B,xj∈Axb∈Cxixa∈Cxjdistance(xi,xb)<distance(xj,xa)BCA
- ABABA′B