いくつかのビットを削除してカウントする


26

2^n長さのすべての異なるバイナリ文字列を考慮しn、仮定しn > 2ます。b < n/2各バイナリ文字列からビットを正確に削除して、n-b残りの長さの文字列を残すことができます。残っている個別の文字列の数は、削除するビットによって異なります。残りの異なる文字列をできる限り少なくすることが目的であると仮定すると、この課題は、の関数として残すことができる文字数を計算するコードを記述することですn

例、n=3およびb = 1。2つの文字列11とのみを残すことができます00

ためn=9b = 1,2,3,4、私たちは持っています70,18,6,2

ためn=8b = 1,2,3、私たちは持っています40,10,4

ためn=7b = 1,2,3、私たちは持っています20,6,2

ためn=6b = 1,2、私たちは持っています12,4

ためn=5b = 1,2、私たちは持っています6,2

この質問は、元々、MOに関する別の形式で2014年に私によって提起されました。

入出力

コードは整数nを取り込んで、b開始b = 0から増加する各値に対して単一の整数を出力する必要があります。

スコア

あなたのスコアは、私のLinuxベースのPCで1分以内にnすべてのコードが完了する最大のものb < n/2です。タイブレークの場合b、コードが獲得できる最大の値は、共同で最大の値をn獲得します。、あまりにもその基準にタイブレークの場合の最大値のための最速のコードnbを決定します。時間が1〜2秒以内であれば、最初に投稿された回答が優先されます。

言語とライブラリ

任意の言語のライブラリを使用できます。私はあなたのコードを実行しなければならないので、それが無料で(ビールのように)Linuxで動作する場合に役立ちます。


b > 0追加の入力要件として想定していますか?またはだろうn=3b=0単純に出力2^n結果として?
ケビンクルーイッセン

@KevinCruijssen 2^n実際に出力されるはずです。
アヌーシュ

また、入力はsingle nとsingleであると言いますbが、スコアはnコードがb < n/21分以内にすべて完了する最大のものです。nその場合、単一の入力を持ち、すべての結果を出力する方が良い0 <= b < n/2でしょうか?または、2つのプログラム/関数を提供する必要があります。1つは2つの入力nb受け取りn、もう1つは入力のみを受け取り、範囲内のすべての結果を出力します0 <= b < n/2か?
ケビンCruijssen

2
まあ、私はすでにあなたの挑戦を支持していたので、再びそれを行うことはできません。:)私はこれを効率的に計算する方法がわかりませんが(効率的なOアルゴリズムは私がいつも苦手にしていたものでした。そしてIT大学で数回やり直さなければならなかった数少ない科目の1つです)、非常に興味深い挑戦です。人々が思いついた答えに興味があります。
ケビンCruijssen

2
実用的な例はありますか?正確さだけでなく、速度の比較に関しても、開始するのに適した場所です。
maxb

回答:


6

Python 2.7 / Gurobi n = 9

このソリューションは、ブール混合整数問題(MIP)に対するGurobiのILPソルバーの非常に単純な使用法です。

唯一のトリックは、問題のサイズを半分にするために、1の補数の対称性を取り出すことです。

Gurobi LLCの期間限定の「無料」ライセンスを使用すると、2000個の制約に制限されますが、10 del 1を解くことは、とにかく私のラップトップでは60秒の時間制限を大きく超えます。

from gurobipy import *
from itertools import combinations

def mincover(n,d):
    bs = pow(2,n-1-d)
    m = Model()
    m.Params.outputFlag = 0
    b = {}
    for i in range(bs):
      b[i] = m.addVar(vtype=GRB.BINARY, name="b%d" % i)
    m.update()
    for row in range(pow(2,n-1)):
      x = {}
      for i in combinations(range(n), n-d):
        v = 0
        for j in range(n-d):
          if row & pow(2,i[j]):
            v += pow(2,j)
        if v >= bs:
          v = 2*bs-1-v
        x[v] = 1
      m.addConstr(quicksum(b[i] for i in x.keys()) >= 1)
    m.setObjective(quicksum(b[i] for i in range(bs) ), GRB.MINIMIZE)
    m.optimize()
    return int(round(2*m.objVal,0))

for n in range(4,10):
    for d in range((n//2)+1):
        print n, d, mincover(n,d)

UPDATE + CORR:10,2は最適なソリューションサイズ31です(例参照)。Gurobiはサイズ30の対称ソリューションが存在しないことを示します(実行不可能な問題を返します)。整数のパターン0 7 13 14 25 28 35 36 49 56 63 64 95 106 118 128 147 159 170 182 195 196 200 207 225 231 240 243 249 252 255または0 7 13 14 19 25 28 35 36 49 56 63 64 95 106 118 128 159 170 182 195 196 200 207 225 231 240 243 249 252 255


「最速の無限の報奨金」の記録を破りましたか?
user202729

ここには賞金はありませんが、どういう意味ですか?
jayprich

@ user202729はい。設定が低すぎます。n = 10に設定する必要がありました:)
Anush

n = 9で実際に解くのは簡単なことではありません。OPが既存のライブラリを使用する理由です(私のような手書きのソリューションよりも優れているはずです)。
user202729

1
@ChristianSieversに感謝します。MOは、10,2には非対称オプティマしかないと主張しているので、反論も検証もできません。n = 9まで機能する対称性の仮定のショートカットを削除すると、Gurobiは必要な時間でn = 9まで解決できることがわかりました。
-jayprich

3

C ++、n = 6

いくつかの小さな最適化によるブルートフォース。

#include<cassert>
#include<iostream>
#include<vector>

// ===========
/** Helper struct to print binary representation.
`std::cout<<bin(str,len)` prints (str:len) == the bitstring 
represented by last (len) bits of (str).
*/
struct bin{
    int str,len;
    bin(int str,int len):str(str),len(len){}
};
std::ostream& operator<<(std::ostream& str,bin a){
    if(a.len)
        return str<<bin(a.str>>1,a.len-1)<<char('0'+(a.str&1));
    else if(a.str)
        return str<<"...";
    else
        return str;
}
// ===========

/// A patten of (len) bits of ones.
int constexpr pat1(int len){
    return (1<<len)-1;
}

// TODO benchmark: make (res) global variable?

/**Append all distinct (subseqs+(sfx:sfxlen)) of (str:len) 
with length (sublen) to (res).
*/
void subseqs_(
    int str,int len,int sublen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    // std::cout<<"subseqs_ : str = "<<bin(str,len)<<", "
    // "sublen = "<<sublen<<", sfx = "<<bin(sfx,sfxlen)<<'\n';

    assert(len>=0);

    if(sublen==0){ // todo remove some branches can improve perf?
        res.push_back(sfx);
        return;
    }else if(sublen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }else if(sublen>len){
        return;
    }

    if(str==0){
        res.push_back(sfx);
        return;
    }

    int nTrail0=0;
    for(int ncut;str&&nTrail0<sublen;

        ++nTrail0,
        ncut=__builtin_ctz(~str)+1, // cut away a bit'0' of str
        // plus some '1' bits
        str>>=ncut,
        len-=ncut
    ){
        ncut=__builtin_ctz(str)+1; // cut away a bit'1' of str
        subseqs_(str>>ncut,len-ncut,sublen-nTrail0-1,
            sfx|1<<(sfxlen+nTrail0),sfxlen+nTrail0+1,
            res
        ); // (sublen+sfxlen) is const. TODO global var?
    }

    if(nTrail0+len>=sublen) // this cannot happen if len<0
        res.push_back(sfx);
}

std::vector<int> subseqs(int str,int len,int sublen){
    assert(sublen<=len);
    std::vector<int> res;
    if(__builtin_popcount(str)*2>len){ // too many '1's, flip [todo benchmark]
        subseqs_(pat1(len)^str,len,sublen,0,0,res);
        int const p1sublen=pat1(sublen);
        for(int& r:res)r^=p1sublen;
    }else{
        subseqs_(str,len,sublen,0,0,res);
    }
    return res;
}

// ==========

/** Append all distinct (supersequences+(sfx:sfxlen)) of (str:len)
with length (suplen) to (res).
Define (a) to be a "supersequence" of (b) iff (b) is a subsequence of (a).
*/
void supseqs_(
    int str,int len,int suplen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    assert(suplen>=len);

    if(suplen==0){
        res.push_back(sfx);
        return;
    }else if(suplen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }

    int nTrail0; // of (str)
    if(str==0){
        res.push_back(sfx);
        // it's possible that the supersequence is '0000..00'
        nTrail0=len;
    }else{
        // str != 0 -> str contains a '1' bit ->
        // supersequence cannot be '0000..00'
        nTrail0=__builtin_ctz(str);
    }
    // todo try `nTrail0=__builtin_ctz(str|1<<len)`, eliminates a branch
    // and conditional statement

    for(int nsupTrail0=0;nsupTrail0<nTrail0;++nsupTrail0){
        // (nsupTrail0+1) last bits of supersequence matches with 
        // nsupTrail0 last bits of str.
        supseqs_(str>>nsupTrail0,len-nsupTrail0,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    int const strMatch=str?nTrail0+1:len; 
    // either '1000..00' or (in case str is '0000..00') the whole (str)

    for(int nsupTrail0=suplen+strMatch-len;nsupTrail0-->nTrail0;){
        // because (len-strMatch)<=(suplen-1-nsupTrail0),
        // (nsupTrail0<suplen+strMatch-len).

        // (nsupTrail0+1) last bits of supersequence matches with
        // (strMatch) last bits of str.
        supseqs_(str>>strMatch,len-strMatch,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    // todo try pulling constants out of loops
}

// ==========

int n,b;
std::vector<char> done;
unsigned min_undone=0;

int result;
void backtrack(int nchoice){
    assert(!done[min_undone]);
    ++nchoice;
    std::vector<int> supers_s;
    for(int s:subseqs(min_undone,n,n-b)){
        // obviously (s) is not chosen. Try choosing (s)
        supers_s.clear();
        supseqs_(s,n-b,n,0,0,supers_s);
        for(unsigned i=0;i<supers_s.size();){
            int& x=supers_s[i];
            if(!done[x]){
                done[x]=true;
                ++i;
            }else{
                x=supers_s.back();
                supers_s.pop_back();
            }
        }

        unsigned old_min_undone=min_undone;
        while(true){
            if(min_undone==done.size()){
                // found !!!!
                result=std::min(result,nchoice);
                goto label1;
            }
            if(not done[min_undone])
                break;
            ++min_undone;
        }
        if(nchoice==result){
            // backtrack more will only give worse result
            goto label1;
        }

        // note that nchoice is already incremented
        backtrack(nchoice);

        label1: // undoes the effect of (above)
        for(int x:supers_s)
            done[x]=false;
        min_undone=old_min_undone;
    }
}

int main(){
    std::cin>>n>>b;

    done.resize(1<<n,0);
    result=1<<(n-b); // the actual result must be less than that

    backtrack(0);
    std::cout<<result<<'\n';
}

ローカルで実行:

[user202729@archlinux golf]$ g++ -std=c++17 -O2 delbits.cpp -o delbits
[user202729@archlinux golf]$ time for i in $(seq 1 3); do ./delbits <<< "6 $i"; done
12
4
2

real    0m0.567s
user    0m0.562s
sys     0m0.003s
[user202729@archlinux golf]$ time ./delbits <<< '7 1'
^C

real    4m7.928s
user    4m7.388s
sys     0m0.173s
[user202729@archlinux golf]$ time for i in $(seq 2 3); do ./delbits <<< "7 $i"; done
6
2

real    0m0.040s
user    0m0.031s
sys     0m0.009s

1
それが私のものよりも速い場合、主に他の人が自分のコードを投稿することを奨励する
user202729

お願いします...(注:これはカバーセット問題のインスタンスです。)
user202729

1
私はそれに取り組んでいます。賢いやり方を思い付くことができません。他に誰も答えを投稿しない場合は、これまでのところn = 4程度までしかできないものを配置します。
-mypetlion
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.