最小公約数

基本的に、問題は次のとおりです。正の数のセットの場合、の任意の要素の約数ではない最小数、つまり見つけます。 $S$ $d$ $S$ $\forall x \in S,\ d \nmid x$

表す $n = |S|$ および $C = \max(S)$ 。関数 $F(x) =$ 除算しない最小素数を考えます。ことが簡単にわかり。また、セット場合、要素を分割しない最小素数とします。上限があります $x$ $F(x) \leq \log x$ $S$ $F(S) =$ $S$

F (S) \leq F (lcm (S)) \leq F (C^{n}) \leq n \log C .

$F(S) \leq F(\operatorname{lcm}(S)) \leq F(C^n) \leq n \log C.$

したがって、 $1$ からまでのすべての数値を列挙し $n \log C$ 、要素を除算しないかどうかをチェックする単純な総当たりアルゴリズム $S$ は多項式であり、時間の複雑さは $O(n^2 \log C)$ です。

問題を解決するもう1つの方法は、すべての要素のすべての因子を計算 $S$ し、それらをブルートフォースアルゴリズムで使用して、 $x$ が $O(1)$ 時間で答えかどうかをチェックすることです。このアルゴリズムは時間の複雑さ $O(n \cdot \min (\sqrt{C}, n \log C) + n \log C)$ 持ち、 $O(n \log C)$ メモリを使用します。より大きい保存因数 $n \log C$ 。 $n$ と小さい、 $C$ パフォーマンスが向上します。

詳細には、アルゴリズムは2つの部分で構成されています。

セット構成 $\hat{S}$ のすべての要素のすべての要素からなる $S$ 、すなわち
$\forall x \in S \forall f \leq n \cdot \log C, (f ∣ x \to f \in \hat{S})$ $\forall x \in S\ \forall f \le n \cdot \log C, \ (f \mid x \rightarrow f \in \hat{S})$ これは、 $O(n \cdot \min (\sqrt{C}, n \log C))$ 時間と $O(n \log C)$ メモリで実行できます。（これはどこから来るのですか？任意の要素について、 $S$ までのすべての数値またはまでのすべての素数のいずれか小さい方の試算因数分解を使用して因数分解でき。したがって、各要素時間時間で因数分解できます。） $\sqrt{C}$ $n \log C$ $S$ $O(\min (\sqrt{C}, n \log C))$
最小数を見つけます。が時間で実行できるかどうかを確認する場合、このステップには時間が必要です。 $d \notin \hat{S}$ $O(|\hat{S}|) = O(n \log C)$ $x \in \hat{S}$ $O(1)$

興味のある質問が2つあります。

問題を解決するためのより高速なアルゴリズムはありますか？
与えられたとに対して、最大の最小公約数である非除数を持つ集合をどのように構築できますか？ $n$ $C$ $S$

algorithms number-theory

— SkyterX
ソース

1.「事前計算」とは、総当たりアルゴリズムを開始する前を意味します。ファクタリングの2.複雑さは確かに準指数である、のdefiniton参照の。

C

$C$

— SkyterX 2015年

ポイント2の@DWでは、因数分解の複雑さは数値を表すビット文字列の長さで指数関数未満ですが、SkyterXはそれが、つまり、サイズの平方根に比例すると正しく述べています数字。

O (\sqrt{C})

$O(\sqrt{C})$

— Lieuwe Vinkhuijzen 2015年

@LieuweVinkhuijzen、それは私には正しくないようです。GNFSを使用した因数分解の複雑さはになり、。en.wikipedia.org/wiki/…を参照してください。

O (\exp {1.9 (\log C)^{1 / 3} (\log \log C)^{2 / 3}})

$O(\exp\{1.9 (\log C)^{1/3} (\log \log C)^{2/3}\})$

O (\sqrt{C})

$O(\sqrt{C})$

— DW

2番目の方法の方が「と小さい」の方が優れているという記述は、正しくありません。場合にのみ、パフォーマンスが向上し。したがって、2番目の方法のパフォーマンスを向上させるには、を大きくする必要があります（小さくはない）。

n

$n$

C

$C$

n ≫ \sqrt{C} / \log (C)

$n \gg \sqrt{C}/\log(C)$

n

$n$

— DW

@DWそうです、私はGNFSの複雑さを知りませんでした。

— Lieuwe Vinkhuijzen 2015年

回答:

整数分解のためのより良いアルゴリズムを使用することにより、2番目のアルゴリズムを改善することが可能です。

ここに関連する整数因数分解の2つのアルゴリズムがあります。

GNFSは、実行時間整数を因数分解できます。 $\le C$ $O(L_C[0.33,1.92])$
ECMは、実行時間因子（存在する場合）を見つけることができます。すべての要因を見つけるには、倍の時間がかかり ECMの実行時間と比べて比較的小さい）。 $\le n \log C$ $O(L_{n \log C}[0.5,1.41])$ $O(\log C / \log(n \log C))$

ここでです。 $L_n[\alpha,c] = \exp\{c (\log n)^\alpha (\log \log n)^{1-\alpha}\}$

これは、実行時間に対してかなりひどく見える表現ですが、重要な事実は、これはあなたが述べた方法よりも速いということです。特に、はよりも漸近的に小さくなり。つまり、GNFSはすべての可能な要素試すよりもはるかに高速です。また、漸近よりもはるかに小さい、すなわち、ECMは、はるかに速く、すべての可能な要因試みるよりも。 $L_C[0.33,1.92]$ $\sqrt{C}$ $\le \sqrt{C}$ $L_{n \log C}[0.5,1.41]$ $n \log C$ $\le n \log C$

したがって、このメソッドの合計実行時間はおおよそであり、これは漸近的にあなたの最初の方法で、2番目の方法よりも漸近的に優れています。もっと上手くやれるかどうかわかりません。 $\tilde{O}(n \min(L_C[0.33,1.92], L_{n \log C}[0.5,1.41]))$

— DW
ソース

この問題の高速アルゴリズムには、入力セットある種の因数分解を含める必要があると思います。これらの因数分解アルゴリズムを確認しますが、適切にテストするという問題がまだあります。これは、最大の回答でセットを構築することについて述べた2番目の問題を引き起こします。

S

$S$

S

$S$

— SkyterX 2015年

ECMは、指定した時間に1つの要素を見つけます。数値のすべての因子が≤n log Cの場合、アルゴリズムを最大でlog C / log（n log C）回繰り返す必要があります。

— gnasher729 2016年

最も一般的ではない非除数はN log Cと同じくらい大きくなる可能性がありますが、N個の数値がランダムに分布している場合、最も一般的でない非除数はおそらくNよりもはるかに小さく、おそらくNよりもはるかに小さくなります。素数は、その数の約数です。

各素数pについて、インデックスがありますこれは、そのインデックスまでのすべての数がpによる可分性について調べられたことを意味し、除算可能であったそれらすべての数のリストを持っています。 $k_p$

次に、d = 2、3、4、...の場合、dで割り切れる数値を見つけるか、何もないことを示します。dの最大素因数pをとります。次に、pで割り切れるすべての数値を、dでも割り切れるのかどうかをチェックします。何も見つからない場合は、p > で割り切れるインデックス>数値をさらにチェックし、とpで割り切れる数のリストを更新して、各数がdで割り切れるかどうかをチェックします。 $k_p$ $k_p$

pで割り切れる数があるかどうかをチェックするために、平均p数をチェックします。後で2pで割り切れる数があるかどうかを確認すると、50％の確率で1つの数（pで割り切れる数）だけをチェックする必要があり、50％の確率で平均2p以上の数をチェックします。3pで割り切れる数を見つけるのは非常に高速であり、以下同様です。Nの数しかないため、pで割り切れる数についてNを超える数をチェックすることはありません。

これが約分割可能性チェックでうまくいくことを願っています。 $N^2 / log N$

PS。乱数の結果はどのくらい大きいでしょうか？

N個の乱数があるとします。N個の数値の1つがdで割り切れる確率は1-（1-1 / d）^ Nです。1≤d≤kの各数値が乱数の1の因数である確率は、これらの確率を乗算することで計算されると想定します（Ok、これらの確率はおそらく完全に独立しているわけではないため、少し危険です）。

その仮定では、N = 1000の場合、1..244の数値のいずれかが数値を除算しない可能性が50％あり、10億分の1が507までのすべての数値がいずれかの数値を除算する可能性があります。N = 10,000の場合、50％の確率で、1..1726の数値のいずれかが任意の数値を除算せず、10億分の1が2979までのすべての数値がいずれかの数値を除算する可能性があります。

N個のランダム入力の場合、結果のサイズはN / ln Nよりも少し大きいと思います。N / ln N *（ln ln N）^ 2のようなものかもしれません。理由は次のとおりです。

N個の乱数のうち少なくとも1つが乱数dで割り切れる確率はです。dがN前後の場合、（1-1は約1-exp（-1）≈0.6321です。それは単一の除数です。いくつかの数値d≈NのそれぞれがN個の数値の少なくとも1つの約数である可能性は非常に小さいため、最大のdはNよりも大幅に小さくなります。 $1 - (1 - 1/d)^N$ $1 - (1 - 1/d)^N$

d << Nの場合、です。 $1 - (1 - 1/d)^N ≈ 1 - exp (-N / d)$

d≈N / ln Nの場合、です。 $1 - exp (-N / d) ≈ 1 - exp (- ln N) = 1 - 1/N$

約N / ln Nの値dに対してこれらの確率を追加しますが、ほとんどのdでは結果が大幅に大きくなるため、最大のdはN / ln Nよりもある程度大きくなりますが、Nよりも大幅に小さくなります。

PS。dで割り切れる数を見つける：

dの最大の素因数pを選び、次に、pで割り切れることがすでにわかっている数を最初に調べます。d = kpと言います。次に、この特定のdをチェックしながら、平均してpで割り切れるkの数だけをチェックし、pで割り切れるすべてのdについて、全体でpで割り切れるかどうか、最大N個の値をチェックします。実際には、ほとんどの素数pについてN未満の値をチェックする可能性が高いです。これは、すべてのN値をチェックした後、アルゴリズムが終了する可能性が最も高いためです。したがって、結果がRの場合、N未満の値がR未満の各素数で除算されることを期待します。R≤Nと仮定すると、これは約N ^ 2 / log Nチェックです。

PS。いくつかのテストを実行する

N = 1,000,000の乱数> 0でこのアルゴリズムを数回実行しました。最も一般的でない非除数は68,000〜128,000で、実行の大部分は100,000〜120,000でした。分割数は5億2千万から1億8千万で、（N / ln N）^ 2よりもはるかに少ないです。大多数のケースでは、1億から1億5000万の部門が使用されました。

— gnasher729
ソース