OEIS A005434を計算する


10

タスクは、OEIS A005434をできるだけ迅速に計算することです。

S長さのバイナリ文字列を考えnます。からインデックスを作成すると1、からまでの順序ですべてに対して完全にS[1..i+1]一致するかどうかを判断できます。例えば、S[n-i..n]i0n-1

S = 01010

与える

[Y, N, Y, N, Y].

これは、ある0試合001一致しない場合10010一致は0100101一致していない1010 し、最終的に01010自分自身にマッチします。

長さの考えられるすべての異なるビット文字列を繰り返し処理するときに取得するsとsのf(n)個別の配列の数になるように定義します。YN2^nSn

観察者は、この質問が私の最近別の質問の簡単な変形であることに気付くでしょう。しかし、私は巧妙なトリックがこれをはるかに速く簡単にすることを期待しています。

仕事

n開始を増やすに1は、コードで出力する必要がありますn, f(n)

回答例

n = 1..24正解は次のとおりです。

1, 2, 3, 4, 6, 8, 10, 13, 17, 21, 27, 30, 37, 47, 57, 62, 75, 87, 102, 116, 135, 155, 180, 194

得点

あなたのコードは順番n = 1にそれぞれに対して答えを与えることから繰り返されるべきnです。実行全体の時間を計り、2分後に殺します。

あなたのスコアはあなたnがその時間に得る最高です。

引き分けの場合、最初の答えが優先されます。

コードはどこでテストされますか?

(Windows 7ホスト上の)LubuntuゲストVMのVirtualboxでコードを実行します。

私のラップトップは8GBのRAMとIntel i7 5600U@2.6 GHz(Broadwell)CPUを2コアと4スレッドで搭載しています。命令セットには、SSE4.2、AVX、AVX2、FMA3、およびTSXが含まれています。

言語ごとの主要なエントリ

  • Rust bu Anders Kaseorg ではn = 599
  • N = 30C汚れによる。cygwinでネイティブに実行すると、パラレルバージョンは32になります。

-O3で実行したmath.uni-bielefeld.de/~sillke/SEQUENCES/autocorrelation-range.c(OEISページからリンク)は、私のマシンで<.02秒で最大100を計算できます
vroomfondel

@rogaos親愛なる。質問を削除する必要がありますが、すでに回答があります。

それはまだクールな問題だと思いますが、代わりに最大1000までですか またはゴルフの答えを十分に速いプログラムに
尋ねる

1
@rogaosハード制限を完全に削除しました。

回答:


4

さび、n≈660

use std::collections::HashMap;
use std::iter::once;
use std::rc::Rc;

type Memo = HashMap<(u32, u32, Rc<Vec<u32>>), u64>;

fn f(memo: &mut Memo, mut n: u32, p: u32, mut s: Rc<Vec<u32>>) -> u64 {
    debug_assert!(p != 0);
    let d = n / p;
    debug_assert!(d >= 1);
    let r = n - p * if d >= 2 { d - 1 } else { 1 };

    let k = s.binary_search(&(n - r + 1)).unwrap_or_else(|i| i);
    for &i in &s[..k] {
        if i % p != 0 {
            return 0;
        }
    }

    if d >= 3 {
        let o = n - (p + r);
        n = p + r;
        s = Rc::new(s[k..].iter().map(|i| i - o).collect());
    } else if n == p {
        return 1;
    } else if k != 0 {
        s = Rc::new(s[k..].to_vec());
    }

    let query = (n, p, s);
    if let Some(&c) = memo.get(&query) {
        return c;
    }
    let (n, p, s) = query;

    let t = Rc::new(s.iter().map(|i| i - p).collect::<Vec<_>>());
    let c = if d < 2 {
        (1..r + 1).map(|q| f(memo, r, q, t.clone())).sum()
    } else if r == p {
        (1..p + 1)
            .filter(|&q| p % q != 0 || q == p)
            .map(|q| f(memo, r, q, t.clone()))
            .sum()
    } else {
        let t = match t.binary_search(&p) {
            Ok(_) => t,
            Err(k) => {
                Rc::new(t[..k]
                            .iter()
                            .cloned()
                            .chain(once(p))
                            .chain(t[k..].iter().cloned())
                            .collect::<Vec<_>>())
            }
        };
        (1..t.first().unwrap() + 1)
            .filter(|&q| p % q != 0 || q == p)
            .map(|q| f(memo, r, q, t.clone()))
            .sum()
    };
    memo.insert((n, p, s), c);
    c
}

fn main() {
    let mut memo = HashMap::new();
    let s = Rc::new(Vec::new());
    for n in 1.. {
        println!("{} {}",
                 n,
                 (1..n + 1)
                     .map(|p| f(&mut memo, n, p, s.clone()))
                     .sum::<u64>());
    }
}

オンラインでお試しください!

使い方

これは、レオギバスの「文字列の周期(1981)で与えられた再帰述語preのメモ化された実装です。この関数f(memo, n, p, s)は、長さnが最小周期pとの相関数、およびセット内の各周期を検出しますs


他の関連する問題のより速い解決策があるかどうか疑問に思わせます。非常に印象的!

興味深いことに、これは完全にメモリ制限です。最高500までスピードアップし、RAMが不足すると突然スローダウンします。

2

単純なブルートフォース検索で、チャレンジを開始します。

#include <stdio.h>
#include <stdint.h>
#include <string.h>

typedef uint16_t u16;
typedef uint64_t u64;

static u64 map[1<<16];

int main(void)
{
    for (u64 n = 1;; ++n) {
        u64 result = 1;
        u64 mask = (1ul << n) - 1;
        memset(map, 0, sizeof(map));

        #pragma omp parallel
        #pragma omp for
        for (u64 x = 1ul << (n - 1); x < 1ul << n; ++x) {

            u64 r = 0;
            for (u64 i = 1; i < n; ++i)
                r |= (u64) (x >> i == (x & (mask >> i))) << i;
            if (!r)
                continue;

            u16 h = (u16) (r ^ r >> 13 ^ r >> 27);
            while (map[h] && map[h] != r)
                ++h;

            if (!map[h]) {
                #pragma omp critical
                if (!map[h]) {
                    map[h] = r;
                    ++result;
                }
            }
        }

        printf("%ld\n", result);
    }
}

でコンパイルしclang -fopenmp -Weverything -O3 -march=nativeます。私のマシンでは、2分でn = 34に達します。

編集:並列処理を簡単にするために、いくつかのOMPディレクティブを振りかけました。


@Lembik削除の根拠のSEの外に良い答えの存在はありますか?誰か(おそらくコメンター)がこのアルゴリズムを回答として提出して、その回答を受け入れるのを待ってはいけませんか?
Grimmy 2017年

あなたは非常に良い点を作ります

悲しいことに、CPUに合計2つのコアがあるため、virtualboxで並列コードを実際にテストすることはできません。

私はcygwinの中でそれを実行し、それが32になった
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.