20

ニューヨークタイムズのこのグラフィックのデザインには興味をそそられました。アメリカの各州は格子状の正方形で表されています。正方形を手動で配置したのか、実際には隣接する状態の位置を表すために（ある定義の下で）正方形の最適な配置を見つけたのか疑問に思いました。

コードは、状態（または他の任意の2次元形状）を表すために正方形を最適に配置するという課題の小さな部分を担います。具体的には、形状のすべての地理的中心または重心がすでにあると仮定します。便利な形式であり、このようなダイアグラムでのデータの最適な表現は、形状の重心からそれらを表す正方形の中心までの合計距離が最小であり、それぞれに最大で1つの正方形があること可能な位置。

コードは、任意の便利な形式で0.0〜100.0（両端を含む）の浮動小数点XおよびY座標の一意のペアのリストを取得し、データを表すために最適に配置されたグリッド内の単位正方形の非負整数座標を出力します、順序を保存します。複数の正方形の配置が最適な場合、最適な配置のいずれかを出力できます。1〜100組の座標が与えられます。

これはコードゴルフで、最短のコードが勝ちます。

例：

入力： [(0.0, 0.0), (1.0, 1.0), (0.0, 1.0), (1.0, 0.0)]

これは簡単です。グリッドの正方形の中心は0.0、1.0、2.0などにあるため、これらの形状はすでにこのパターンの正方形の中心に完全に配置されています。

21
03

したがって、出力は正確にこれらの座標である必要がありますが、整数として、選択した形式で：

[(0, 0), (1, 1), (0, 1), (1, 0)]

入力： [(2.0, 2.1), (2.0, 2.2), (2.1, 2.0), (2.0, 1.9), (1.9, 2.0)]

この場合、すべての形状は（2、2）の正方形の中心に近くなりますが、2つの正方形を同じ位置に配置することはできないため、押し出す必要があります。図形の重心からそれを表す正方形の中心までの距離を最小化すると、次のパターンが得られます。

 1
402
 3

したがって、出力はになります[(2, 2), (2, 3), (3, 2), (2, 1), (1, 2)]。

テストケース：

[(0.0, 0.0), (1.0, 1.0), (0.0, 1.0), (1.0, 0.0)] -> [(0, 0), (1, 1), (0, 1), (1, 0)]
[(2.0, 2.1), (2.0, 2.2), (2.1, 2.0), (2.0, 1.9), (1.9, 2.0)] -> [(2, 2), (2, 3), (3, 2), (2, 1), (1, 2)]
[(94.838, 63.634), (97.533, 1.047), (71.954, 18.17), (74.493, 30.886), (19.453, 20.396), (54.752, 56.791), (79.753, 68.383), (15.794, 25.801), (81.689, 95.885), (27.528, 71.253)] -> [(95, 64), (98, 1), (72, 18), (74, 31), (19, 20), (55, 57), (80, 68), (16, 26), (82, 96), (28, 71)]
[(0.0, 0.0), (0.1, 0.0), (0.2, 0.0), (0.0, 0.1), (0.1, 0.1), (0.2, 0.1), (0.0, 0.2), (0.1, 0.2), (0.2, 0.2)] -> [(0, 0), (1, 0), (2, 0), (0, 1), (1, 1), (2, 1), (0, 2), (1, 2), (2, 2)]
[(1.0, 0.0), (1.0, 0.1), (1.0, 0.2), (1.0, 0.3)] -> [(1, 0), (0, 0), (2, 0), (1, 1)] or [(1, 0), (2, 0), (0, 0), (1, 1)]
[(3.75, 3.75), (4.25, 4.25)] -> [(3, 4), (4, 4)] or [(4, 3), (4, 4)] or [(4, 4), (4, 5)] or [(4, 4), (5, 4)]

形状の重心からそれぞれの場合にそれらを表す正方形の中心までの合計距離（エラーを見つけたら教えてください！）：

ただ楽しみのために：

これは、入力形式での連続した米国の地理的中心を、おおよそTimesが使用したスケールで表したものです。

[(15.2284, 3.1114), (5.3367, 3.7096), (13.0228, 3.9575), (2.2198, 4.8797), (7.7802, 5.5992), (20.9091, 6.6488), (19.798, 5.5958), (19.1941, 5.564), (17.023, 1.4513), (16.6233, 3.0576), (4.1566, 7.7415), (14.3214, 6.0164), (15.4873, 5.9575), (12.6016, 6.8301), (10.648, 5.398), (15.8792, 5.0144), (13.2019, 2.4276), (22.3025, 8.1481), (19.2836, 5.622), (21.2767, 6.9038), (15.8354, 7.7384), (12.2782, 8.5124), (14.1328, 3.094), (13.0172, 5.3427), (6.142, 8.8211), (10.0813, 6.6157), (3.3493, 5.7322), (21.3673, 7.4722), (20.1307, 6.0763), (7.5549, 3.7626), (19.7895, 7.1817), (18.2458, 4.2232), (9.813, 8.98), (16.8825, 6.1145), (11.0023, 4.2364), (1.7753, 7.5734), (18.8806, 6.3514), (21.3775, 6.6705), (17.6417, 3.5668), (9.9087, 7.7778), (15.4598, 4.3442), (10.2685, 2.5916), (5.3326, 5.7223), (20.9335, 7.6275), (18.4588, 5.0092), (1.8198, 8.9529), (17.7508, 5.4564), (14.0024, 7.8497), (6.9789, 7.1984)]

これらを取得するには、私は上の第二のリストから座標を取り、このページおよび使用0.4 * (125.0 - longitude)当社のX座標とのために0.4 * (latitude - 25.0)私達のY座標のために。プロットは次のようになります。

上記の座標を使用してコードからの出力を入力として使用し、実際の正方形を含むダイアグラムを作成した最初の人は、後悔します！

— ルカ
ソース

あなたの2番目の例の最後のポイントはそう(1, 2)ではないと思います(1, 1)。

— ティムペデリック

良いキャッチ、ありがとう！

— ルーク

また、各テストケースのすべての距離の合計を投稿してください。これは確かに重要な問題であり、代替ソリューションも実際に最適であるかどうかを検証できます。

— フレイ

PS：指定されたマップが実際に最適化問題の有効な結果であることを実際にテストしましたか？直感的にはそうは思わないからです。

— -flawr

合計距離を追加できます。タイムズが使用したマップは、ほぼ確実に最適ではありません。

— ルーク

3

Mathematica、473バイト

f@p_:=(s=Flatten@Round@p;v=Array[{x@#,y@#}&,n=Length@p];
  Do[w=Flatten[{g@#,h@#}&/@(b=Flatten@Position[p,x_/;Norm[x-p[[i]]]<=2,{1}])];f=Total[Norm/@(p-v)]+Total[If[#1==#2,1*^4,0]&@@@v~Subsets~{2}]/.Flatten[{x@#->g@#,y@#->h@#}&@@@w]/.Thread[Flatten@v->s];
    c=w∈Integers&&And@@MapThread[Max[#-2,0]<=#2<=Min[#+2,100]&,{Flatten@p[[b]],w}];s=Flatten@ReplacePart[s~Partition~2,Thread[b->Partition[w/.Last@Quiet@NMinimize[{f,c},w,MaxIterations->300],2]]]
    ,{i,n}]~Do~{2};s~Partition~2)

ゴルフの前に：

f[p_]:=(n=Length@p;s=Flatten@Round@p;v=Array[{x[#],y[#]}&,n];
  Do[
    v2=Flatten[{x2[#],y2[#]}&/@(b=Flatten@Position[p,x_/;Norm[x-p[[i]]]<=2,{1}])];
    f2=Total[Norm/@(p-v)]+Total[If[#1==#2,1*^4,0]&@@@Subsets[v,{2}]]/.Flatten[{x[#]->x2[#],y[#]->y2[#]}&@@@v2]/.Thread[Flatten@v->s];
    c2=v2∈Integers&&And@@MapThread[Max[#-2,0]<=#2<=Min[#+2,100]&,{Flatten@p[[b]],v2}];
    s=Flatten@ReplacePart[s~Partition~2,Thread[b->Partition[v2/.Last@Quiet@NMinimize[{f2,c2},v2,MaxIterations->300],2]]];
    ,{i,n}]~Do~{2};
  s~Partition~2)

説明：

この最適化の問題をMathematicaで記述することは難しくありません。p長さの点のリストが与えられるとn、

変数があるx[i]とy[i]：v=Array[{x[#],y[#]}&,n]、
最小化する関数は変位の合計です：f=Total[Norm/@(p-v)]、
制約は次のとおりc=Flatten[v]∈Integers&&And@@(Or@@Thread[#1!=#2]&@@@Subsets[v,{2}])です。

そして、NMinimize[{f,cons},v,MaxIterations->Infinity]結果が得られます。しかし、残念ながら、そのような単純なスキームは収束するには複雑すぎるようです。

複雑さの問題を回避するために、2つの手法が採用されています。

大きな「相互作用」はIf[#1==#2,1*^4,0]&、ポイント間の衝突を避けるために使用されます。
すべての変数を同時に最適化する代わりに、隣接するすべてのポイントを順番に最適化します。

最初の推測から、ポイントを丸めることから始めます。最適化が1つずつ行われると、衝突が解決されることが期待され、最適化された配置が確立されます。

最終的な解決策は、最適ではないにしても、少なくとも良好です。（信じます:P）

結果：

Just for funの結果を以下に示します。濃い緑色の点が入力、灰色の四角が出力、黒い線が変位を示します。

変位の合計は19.4595です。そして解決策は

{{15,3},{5,4},{13,4},{2,5},{8,6},{21,6},{20,5},{19,5},{17,1},{17,3},{4,8},{14,6},{15,6},{13,7},{11,5},{16,5},{13,2},{22,8},{19,6},{21,7},{16,8},{12,9},{14,3},{13,5},{6,9},{10,7},{3,6},{22,7},{20,6},{8,4},{20,7},{18,4},{10,9},{17,6},{11,4},{2,8},{19,7},{22,6},{18,3},{10,8},{15,4},{10,3},{5,6},{21,8},{18,5},{2,9},{18,6},{14,8},{7,7}}

— njpipeorgan
ソース

ハ！最後のような図を作ることを考えていました。よくやった。

— ティムペデリック

よくできました。直感的に、米国の地図に対するあなたの解決策は私にとって最適に見えます。

— ルーク

2

Python 3、877バイト

これは正しい実装ではありません。2番目の「さらなるテストケース」で失敗し、合計距離が13.5325のソリューションが生成されますが、提供されるソリューションは13.2433だけで済みます。問題をさらに複雑にしているのは、私のゴルフの実装が最初に書いた未実装のものと一致しないという事実です...

しかし、他に誰も答えていないので、これはあまりにも興味深い挑戦であり、すり抜けることができません。また、米国のデータから生成された画像があるので、それがあります。

アルゴリズムは次のようなものです。

すべてのポイントを最も近い整数座標（以降「正方形」と呼びます）にプッシュします。
最大数のポイントを持つ正方形を見つけます。
ステップ2で既に処理された正方形を除く、この点の9正方形近傍へのこれらのポイントの最低コストの再分布を見つけます。
- 再分配は、十分な正方形を提供しない場合を除き、正方形ごとに1ポイントに制限されます（それでも、この正方形には1ポイントしか残りません）。
正方形に複数のポイントがなくなるまで、手順2から繰り返します。
元のポイントのそれぞれを順番に見つけ、それらの正方形を順番に出力します。

このアルゴリズムのどの部分についても最適性の証明はまったくありませんが、「かなり良い」結果が得られるという強い疑いがあります。私はそれが、私が大学時代に「発見的アルゴリズム」と呼んでいたものだと思います...！

l=len
I,G,M=-1,101,150
d=lambda x,y,X,Y:abs(x-X+1j*(y-Y))
N=(0,0),(I,0),(0,I),(1,0),(0,1),(I,I),(1,I),(1,1),(I,I)
n=lambda p,e:[(x,y)for(x,y)in(map(sum,zip(*i))for i in zip([p]*9,N))if(x,y)not in e and I<x<G and I<y<G]
def f(p):
 g={};F=[];O=[I]*l(p)
 for P in p:
  z=*map(round,P),
  if z in g:g[z]+=[P]
  else:g[z]=[P]
 while l(g)<l(p):
  L,*P=0,
  for G in g:
   if l(g[G])>l(P):L,P=G,g[G]
  o=n(L,F);h=l(o)<l(P);c=[[d(*q,*r)for r in o]for q in P];r={}
  while l(r)<l(c):
   A=B=C=M;R=S=0
   while R<l(c):
    if R not in r:
     z=min(c[R])
     if z<A:B,A=R,z;C=c[R].index(A)
    R+=1
   while S<l(c):
    if S==B:
     v=0
     while v<l(c[S]):
      if v!=C:c[S][v]=M
      v+=1
    elif C<1or not h:c[S][C]=M
    S+=1
   r[B]=C
  for q in r:
   x,y=P[q],o[r[q]]
   if y==L or y not in g:g[y]=[x]
   else:g[y]+=[x]
  F+=[L]
 for G in g:
  O[p.index(g[G][0])]=G
 return O

また、USAデータで実行した結果（結果をSVGに変換するユーティリティ関数のおかげ）：

これは、改変されていないコードが生成したコードよりもわずかに悪いです。唯一目に見える違いは、一番右上の正方形が、より良い正方形の左にある正方形であるということです。

— ティム・ペデリック
ソース

背中が軽くなります！これをTimesのダイアグラムのように見えるようにするには、経度のスケーリングに取り組む必要があるようです。

— ルーク

好奇心から、あなたはあなたのアメリカの地図のために総距離を得るのですか？

— トムカーペンター

私はおそらく自分自身にその質問をするべきだった...それはちょうど私のゴルフの実装が思ったより悪いことを私に示したからだ。私のオリジナルの未使用バージョンは20.9164で取得しましたが、私が投稿したバージョンでは20.9987になりました。*ため息*

— ティムペデリック

1

MATLAB、316 343 326バイト

これは進行中の作業です。高速ではありませんが、短いです。ほとんどのテストケースに合格したようです。現在、マップの楽しい入力のためだけのものが実行されていますが、それはまだ10分後に行っているので...

function p=s(a)
c=ceil(a');a=a(:,1)+j*a(:,2);[~,p]=r(a,c,[],Inf);p=[real(p),imag(p)];end
function [o,p]=r(a,c,p,o)
if ~numel(c)
o=sum(abs(p-a));else
x=c(1)+(-1:1);y=c(2)+(-1:1);P=p;
for X=1:3
for Y=1:3
Q=x(X)+j*y(Y);if(x(X)>=0)&(y(Y)>=0)&all(Q~=P)
[O,Q]=r(a,c(:,2:end),[P;Q],o);
if(O<o) o=O;p=Q;disp(o);end
end;end;end;end;end

そして、やや読みやすい形式で：

function p=squaremap(a)
%Input format: [2.0, 2.1;2.0, 2.2;2.1, 2.0;2.0, 1.9;1.9, 2.0]

    c=ceil(a'); %Convert each point to the next highest integer centre
    a=a(:,1)+j*a(:,2); %Convert each 2D point into a complex number
    [~,p]=r(a,c,[],Inf); %Recurse!
    p=[real(p),imag(p)];
end

function [o,p]=r(a,c,p,o)
    if ~numel(c) %If we are as deep as we can go
        o=sum(abs(p-a)); %See what our overall distance is
    else
        x=c(1)+(-1:1);y=c(2)+(-1:1); %For each point we try 9 points, essentially a 3x3 square
        P=p;
        for X=1:3;
            for Y=1:3
                %For each point
                Q=x(X)+j*y(Y); %Covert to a complex number
                if(x(X)>=0)&(y(Y)>=0)&all(Q~=P) %If the point is not negative and has not already been used this iteration
                    [O,Q]=r(a,c(:,2:end),[P;Q],o); %Otherwise iterate further
                    if(O<o) o=O;p=Q;end %Keep updating the smallest path and list of points we have found
                end
            end
        end
    end
end

入力形式は、次のようなMATLAB配列であることが期待されています。

[2.0, 2.1;2.0, 2.2;2.1, 2.0;2.0, 1.9;1.9, 2.0]

これは質問の形式にかなり近いため、多少の余裕があります。

出力は入力と同じ形式で、指定されたインデックスが入力と出力の両方の同じポイントに対応する配列です。

うーん、8時間、まだマップ1で実行中...このソリューションは最適なものを見つけることが保証されていますが、ブルートフォースで実行されるため、非常に長い時間がかかります。

私ははるかに高速な別のソリューションを考え出しましたが、他の答えのように、テストケースの1つで最も最適なものを見つけることができません。興味深いことに、他のソリューション（投稿されていない）で取得したマップを以下に示します。20.72の合計距離を達成します。

— トム・カーペンター
ソース

四角いペグを四角い穴に入れる

Mathematica、473バイト

Python 3、877バイト

MATLAB、316 343 326バイト