Schönhage–Strassenアルゴリズムではどのように内側のリングが選択されますか？

私はSchönhage–Strassen整数乗算アルゴリズムを実装しようとしましたが、再帰的なステップで障害にぶつかりました。

Iは、値有する $x$ と $n$ ビットを、私は計算したい。私はもともとアイデアが選ぶことだと思ったように、分割にと各片ビットモジュロ作業中に、SSAの畳み込みを適用する、値ごとにビットの容量を持つリング。次に、ピースを元に戻します。ただし、たたみ込みの出力にはビットより少し多い（つまり、 $x^2 \pmod {2^n+1}$ $k$ $4^k \geq 2n$ $x$ $2^k$ $2^{k-1}$ $2^{2^k}+1$ $2^k$ $2n$ $>2^k$ 出力値あたりのビット数。これは、各出力値がいくつかの積の合計であるため、リングの容量よりも大きいため、これは機能しません。私は2倍のパディングを追加する必要がありました。

パディングのその2の余分な要素は、複雑さを台無しにします。それは私の再帰的なステップを高すぎます。 $F(n) = n \lg n + \sqrt{n} F(2 \sqrt{n}) = \Theta(n \; \lg n \; \lg \lg n)$ アルゴリズムの代わりに、 $F(n) = n \lg n + \sqrt{n} F(4 \sqrt{n}) = \Theta(n \lg^2 n)$ アルゴリズム。

私はウィキペディアからリンクされているいくつかの参考文献を読みましたが、それらはすべて、この問題がどのように解決されるかについての詳細に光沢がないようです。たとえば、2の累乗ではないに対して $2^{p 2^k} + 1$ を法として処理することにより、余分なパディングオーバーヘッドを回避できますが、非累乗のみの場合、後でうまくいきません。 of-2要素が残り、ピースの数を2倍にしないとCooley-Tukeyを適用できません。また、は法とする乗法逆行列を持たない場合があります。したがって、導入されている2の強制要因はまだあります。 $p$ $p$ $2^p+1$

漸近的な複雑さを吹き飛ばすことなく、再帰的なステップで使用するリングを選択するにはどうすればよいですか？

または、擬似コード形式で：

multiply_in_ring(a, b, n):
  ...
  // vvv                          vvv //
  // vvv HOW DOES THIS PART WORK? vvv //
  // vvv                          vvv //
  let inner_ring = convolution_ring_for_values_of_size(n);
  // ^^^                          ^^^ //
  // ^^^ HOW DOES THIS PART WORK? ^^^ //
  // ^^^                          ^^^ //

  let input_bits_per_piece = ceil(n / inner_ring.order);
  let piecesA = a.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);
  let piecesB = b.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);

  let piecesC = inner_ring.negacyclic_convolution(piecesA, piecesB);
  ...

ds.algorithms

— クレイグ・ギドニー
ソース

複数のサイトに同じ質問を投稿しないでください。各コミュニティは、だれもが時間を無駄にすることなく、正直に答える必要があります。2つのコピーのうち1つを削除することをお勧めします。

— DW

@DW完了。csが1週間何の答えも返さなかった後、私はクロスポストしました。明らかに答えをリンクバックするつもりでした。

— Craig Gidney

わかります。今後表示される場合は、投稿にモデレーターの注意を向けてフラグを付け、移行を依頼することができます。CSTheoryに移動することができます。ご理解のほどよろしくお願いいたします。

— DW

の形式のモジュロ数を処理するアルゴリズムのバージョンがあります：。複雑な係数を持つ多項式の数値の乗算と除算のための漸近的に高速なアルゴリズム。EUROCAM '82：ヨーロッパのコンピュータ代数会議、Lect。ノートコンプサイエンス。144、3-15。iai.uni-bonn.de/~schoe/publi39.dvi

2^{ν 2^{n}}

$2^{\nu2^n}$

— MarkusBläser16年

IIRCは、今削除されたCSの質問に対して部分的な自己回答がありました。それを失うのは残念だ。ここに含めてもらえますか（質問に回答済みのマークが付けられないように）。

— Peter Taylor

この答えは、Markusがコメントでリンクした論文「数値係数と多項式の複素係数の除算のための漸近的に高速なアルゴリズム」から引用されています。

法としてビットの数値を二乗したいとします。ここではあなたが何をすべきかです： $n$ $2^n + 1$

およびを満たすおよびを見つけます。 $p$ $s$ $n = (p-1) 2^s$ $s \leq p \leq 2s$
ビットを分割するピースの数と、ピースサイズの対応するパラメーターを選択します。 $2^m$ $n$

$\begin{aligned} m & = ⌊ s / 2 ⌋ + 1 \\ s_{2} & = ⌈ s / 2 ⌉ + 1 \\ p_{2} & = ⌈ p / 2 ⌉ + 1 \end{aligned}$ $\begin{align} m &= \lfloor s/2 \rfloor + 1 \\s_2 &= \lceil s/2 \rceil + 1 \\ p_2 &= \lceil p/2 \rceil + 1 \end{align}$
とは引き続き不変量を満たしていることに注意してください。また、が満たされているため、入力はキャリー用のスペースに適合しています。 $s_2$ $p_2$ $s_2 \leq p_2 \leq 2 s_2$ $2^m 2^{s_2} p_2 \geq 2n + m + 1$
通常どおり、FFTベースのネガサイクリック畳み込みを部分と残りの部分に対して実行します。

つまり、これが包括的な考え方です。対数パディング係数です。次に、複雑度分析について説明します。FFTがかかりますやるべき仕事を、そして上の私たちだ再帰サイズの断片、今、私たちは漸化式WRTで非常にラフな計算を行うことができます： $p$ $n m$ $2^m$ $(p_2-1) 2^{s_2}$ $s$

\begin{aligned} F (s) & (\leq) (p - 1) 2^{s} m + 2^{m} F (⌈ s / 2 ⌉ + 1) \\ (\leq) 2 s 2^{s} (⌊ s / 2 ⌋ + 1) + 2^{⌊ s / 2 ⌋ + 1} F (⌈ s / 2 ⌉ + 1) \\ (\leq) s^{2} 2^{s} + 2 \cdot 2^{s / 2} F (s / 2 + 1) \\ (\leq) s^{2} 2^{s} + 4 (s / 2)^{2} 2^{s} + 16 (s / 4)^{2} 2^{s} + . . . \\ (\leq) 2^{s} s^{2} \lg (s) \\ (\leq) \frac{n}{\lg n} {(\lg \frac{n}{\lg n})}^{2} \lg \lg \frac{n}{\lg n} \\ (\leq) \frac{n}{\lg n} (\lg^{2} n) \lg \lg n \\ (\leq) n (\lg n) \lg \lg n \end{aligned}

$\begin{align} F(s) &(\leq)\; (p-1)2^sm + 2^m F(\lceil s/2\rceil+1) \\ &(\leq)\; 2s2^s (\lfloor s/2\rfloor+1) + 2^{\lfloor s/2\rfloor+1} F(\lceil s/2\rceil+1) \\ &(\leq)\; s^2 2^s + 2 \cdot 2^{s/2} F(s/2+1) \\ &(\leq)\; s^2 2^s + 4 (s/2)^2 2^s + 16(s/4)^2 2^s + ... \\ &(\leq)\; 2^s s^2 \lg(s) \\ &(\leq)\; \frac{n}{\lg n} \left(\lg \frac{n}{\lg n}\right)^2 \lg \lg \frac{n}{\lg n} \\ &(\leq)\; \frac{n}{\lg n} (\lg^2 n) \lg \lg n \\ &(\leq)\; n \;(\lg n) \lg \lg n \end{align}$

私はそれらのステップでかなりのことを騙しましたが、それはほぼ正しいようです。

「トリック」は、基本コストがではなくになることのようです。質問で不平を言っていたように、再帰レベルごとに2による乗算はまだ2つありますが、今ではの半減が2被除数を支払い、すべてうまくいきます。次に、最後に、最初にに対して対数的に大きくすることにより、余分な係数（実際には係数）をキャンセルし。 $s^2$ $s$ $s$ $s$ $\log n$ $p$ $s$

— クレイグ・ギドニー
ソース