テキストのブロックを完全に正当化およびハイフネーションする


26
Given  a width  and  a block  of
text containing possible hyphen-
ation points,  format it  fully-
justified (in monospace).

完全に両端揃えは、左右に揃えられ、各行が収まるまで単語間の間隔を広げることで実現されます。

関連:

入力

任意の形式で入力できます。あなたが与えられます:

  • ターゲットの幅(文字数)、範囲5〜100(両端を含む)。
  • ハイフネーションされた可能性のある単語を含むテキストブロック。これは、スペースで区切られた文字列、単語の配列、または単語の断片の配列の配列(または必要な他のデータ表現)である可能性があります。

一般的な入力は次のとおりです。

Width: 25
Text:  There's no bu-si-ne-ss lik-e s-h-o-w busine-ss, n-o bus-iness I know.

ここで、ハイフンは可能なハイフネーションポイントを示し、スペースは単語の境界を示します。テキストの可能な代替表現:

[["There's"], ["no"], ["bu", "si", "ne", "ss"], ["lik", "e"], (etc.)]

出力

単語の間にスペースが追加された入力テキスト、列幅の改行、および列幅に完全に揃えるために選択されたハイフネーションポイント。関数の場合、改行区切りを使用する代わりに、文字列の配列(各行に1つ)を返すことができます。

上記の入力の可能な出力は次のとおりです。

There's no  business like
show  business,  no  bus-
iness I know.

最後の "bus-iness"を除くすべてのハイフンが削除されていることに注意してください。これは、単語が次の行に折り返されることを示すために保持されます。

ルール

  • 各行内で、単語間のスペースの数は1を超えることはできませんが、余分なスペースを挿入する場所はユーザー次第です。

    hello hi foo     bar    <-- not permitted (1,1,5)
    hello  hi foo    bar    <-- not permitted (2,1,4)
    hello  hi  foo   bar    <-- OK (2,2,3)
    hello  hi   foo  bar    <-- OK (2,3,2)
    hello   hi  foo  bar    <-- OK (3,2,2)
    
  • スペースで開始または終了できる行はありません(スペースで終了できる最後の行を除く)。

  • 最後の行は、各単語の間に単一のスペースを含む左揃えにする必要があります。必要に応じて、任意の空白/改行を続けることができますが、これは必須ではありません。

  • 単語は、AZ、az、0-9、および単純な句読点(.,'()&)で構成されます

  • 単語の断片がターゲットの幅より長くなることはないと想定でき、常にルールに従って行を埋めることができます(つまり、各行に少なくとも2つの単語の断片、または行を埋める1つの単語の断片があります)完全に)

  • 次の例のように、前の行の単語の文字数を最大化するハイフネーションポイントを選択する必要があります(つまり、単語は行ごとに貪欲に消費される必要があります)。

    This is an input stri-ng with hyph-en-at-ion poi-nts.
    
    This     is     an     input    stri-      <-- not permitted
    ng with hyphenation points.
    
    This  is an  input string  with hyph-      <-- not permitted
    enation points.
    
    This is an input  string with hyphen-      <-- OK
    ation points.
    
  • バイト単位の最短コードが勝つ

Width: 20
Text:  The q-uick brown fox ju-mp-s ove-r t-h-e lazy dog.

The quick  brown fox
jumps over the  lazy
dog.

Width: 32
Text: Given a width and a block of text cont-ain-ing pos-sible hyphen-ation points, for-mat it ful-ly-just-ified (in mono-space).

Given  a width  and  a block  of
text containing possible hyphen-
ation points,  format it  fully-
justified (in monospace).

Width: 80
Text:  Pro-gram-ming Puz-zles & Code Golf is a ques-tion and ans-wer site for pro-gram-ming puz-zle enth-usi-asts and code golf-ers. It's built and run by you as part of the St-ack Exch-ange net-work of Q&A sites. With your help, we're work-ing to-g-et-her to build a lib-rary of pro-gram-ming puz-zles and their sol-ut-ions.

Programming Puzzles &  Code Golf  is a question and answer  site for programming
puzzle enthusiasts  and code golfers.  It's built and run  by you as part of the
Stack Exchange network  of Q&A sites. With your help,  we're working together to
build a library of programming puzzles and their solutions.

Width: 20
Text:  Pro-gram-ming Puz-zles & Code Golf is a ques-tion and ans-wer site for pro-gram-ming puz-zle enth-usi-asts and code golf-ers. It's built and run by you as part of the St-ack Exch-ange net-work of Q&A sites. With your help, we're work-ing to-g-et-her to build a lib-rary of pro-gram-ming puz-zles and their sol-ut-ions.

Programming  Puzzles
&  Code  Golf  is  a
question and  answer
site for programming
puzzle   enthusiasts
and  code   golfers.
It's  built  and run
by  you  as  part of
the  Stack  Exchange
network    of    Q&A
sites.   With   your
help,  we're working
together to  build a
library of  program-
ming   puzzles   and
their solutions.

Width: 5
Text:  a b c d e f g h i j k l mm nn oo p-p qq rr ss t u vv ww x yy z

a b c
d e f
g h i
j k l
mm nn
oo pp
qq rr
ss  t
u  vv
ww  x
yy z

Width: 10
Text:  It's the bl-ack be-ast of Araghhhhh-hhh-h-hhh-h-h-h-hh!

It's   the
black  be-
ast     of
Araghhhhh-
hhhhhhhhh-
hhh!

はい、最後に別の(テキストベースの)タイポグラフィの課題:-)
ETHproductions

1
@Adámは組み込みに賛成です。コードの制限はなく、最短のコードが優先されます。もちろん、それは退屈な答えになるかもしれません!ライブラリに関しては、ライブラリが自由に利用可能であり、回答を「言語+ライブラリ」としてマークする限り可能です。また、ライブラリバージョンは、この課題より前に作成する必要があります。
デイブ

1
行がハイフンまたは単一の文字、たとえばanybod-y幅7で終了する可能性がある場合、出力を選択できますanybodyanybod-\ny
-darrylyeo

1
@JonathanAllanはい。申し訳ありませんが、私はそれを修正します
デイブ

3
@darrylyeoいいえ、その場合は完全な単語を出力する必要があります。各行に可能な限り多くの単語文字を含める必要があるためです。
デイブ

回答:


7

JavaScript(ES6)、218バイト

w=>s=>s.map((c,i)=>c.map((p,j)=>(k+p)[l="length"]-w-(b=!i|j>0)+(j<c[l]-1)<0?k+=b?p:" "+p:(Array(w-k[l]-b).fill(h=k.split` `).map((_,i)=>h[i%(h[l]-1)]+=" "),o.push(h.join` `+(b?"-":"")),k=p)),o=[],k="")&&o.join`
`+`
`+k

カリー化構文(f(width)(text))で引数を取り、テキスト入力はチャレンジで説明されている二重配列形式です。文字列はを介してその形式に変換されます.split` `.map(a=>a.split`-`))。また、改行はテンプレート文字列内のリテラル改行です。

ゴルフされていない、再配置された

width=>string=> {
    out=[];
    line="";
    string.map((word,i)=> {
        word.map((part,j)=> {

            noSpaceBefore = i==0 || j>0;
            if ((line+part).length - width - noSpaceBefore + (j<word.length-1) < 0) {
                line += noSpaceBefore ? part : " "+part;
            }
            else {
                words=line.split` `;
                Array(width - line.length - noSpaceBefore).fill()
                    .map((_,i) => words[i % (words.length-1)] += " ");
                out.push(words.join(" ") + (noSpaceBefore? "-" : ""));
                line=part;
            }
        });
    });
    return out.join("\n") + "\n"+line
}

ここでのアイデアは、文字列全体の各部分をステップスルーし、一度に1行ずつ各行を構築することです。行が完了すると、余分なスペースがすべて配置されるまで、単語の間隔が左から右に増加します。

テストスニペット

f=
w=>s=>s.map((c,i)=>c.map((p,j)=>(k+p)[l="length"]-w-(b=!i|j>0)+(j<c[l]-1)<0?k+=b?p:" "+p:(Array(w-k[l]-b).fill(h=k.split` `).map((_,i)=>h[i%(h[l]-1)]+=" "),o.push(h.join` `+(b?"-":"")),k=p)),o=[],k="")&&o.join`
`+`
`+k
<style>*{font-family:Consolas,monospace;}</style>
<div oninput="O.innerHTML=f(+W.value)(S.value.split` `.map(a=>a.split`-`))">
Width: <input type="number" size="3" min="5" max="100" id="W">
Tests: <select id="T" style="width:20em" oninput="let x=T.value.indexOf(','),s=T.value;W.value=s.slice(0,x);S.value=s.slice(x+2)"><option></option><option>20, The q-uick brown fox ju-mp-s ove-r t-h-e lazy dog.</option><option>32, Given a width and a block of text cont-ain-ing pos-sible hyphen-ation points, for-mat it ful-ly-just-ified (in mono-space).</option><option>80, Pro-gram-ming Puz-zles & Code Golf is a ques-tion and ans-wer site for pro-gram-ming puz-zle enth-usi-asts and code golf-ers. It's built and run by you as part of the St-ack Exch-ange net-work of Q&A sites. With your help, we're work-ing to-g-et-her to build a lib-rary of pro-gram-ming puz-zles and their sol-ut-ions.</option><option>20, Pro-gram-ming Puz-zles & Code Golf is a ques-tion and ans-wer site for pro-gram-ming puz-zle enth-usi-asts and code golf-ers. It's built and run by you as part of the St-ack Exch-ange net-work of Q&A sites. With your help, we're work-ing to-g-et-her to build a lib-rary of pro-gram-ming puz-zles and their sol-ut-ions.</option><option>5, a b c d e f g h i j k l mm nn oo p-p qq rr ss t u vv ww x yy z</option><option>10, It's the bl-ack be-ast of Araghhhhh-hhh-h-hhh-h-h-h-hh</option></select><br>
Text: &nbsp;<textarea id="S" cols="55" rows="4"></textarea>
</div>
<pre id="O" style="border: 1px solid black;display:inline-block;"></pre>


8

GNU sed -r、621バイト

入力を2行として受け取ります。最初は単項数としての幅、2番目は文字列です。

私はこれがもっともっとゴルフされるかもしれないと確信していますが、私はすでにそれにあまりにも多くの時間を捨てすぎています。

x;N
G
s/\n/!@/
:
/@\n/bZ
s/-!(.*)@ /\1 !@/
s/!(.*[- ])(@.*1)$/\1!\2/
s/@(.)(.*)1$/\1@\2/
s/-!(.*-)(@.*)\n$/\1!\2\n1/
s/(\n!@) /\1/
s/-!(.* )(@.*)\n$/\1!\2\n1/
s/-!(.*-)(@.*1)$/\1!\21/
s/!(.*)-@([^ ]) /\1\2!@ /
t
s/ !@(.*)\n$/\n!@\1#/
s/!(.*-)@(.*)\n$/\1\n!@\2#/
s/!(.*)(@ | @)(.*)\n$/\1\n!@\3#/
s/-!(.*[^-])@([^ ]) (.*)\n$/\1\2\n!@\3#/
s/!(.+)@([^ ].*)\n$/\n!@\1\2#/
/#|!@.*\n$/{s/#|\n$//;G;b}
:Z
s/-?!|@.*//g
s/ \n/\n/g
s/^/%/
:B
G
/%.*\n.+\n/!bQ
:C
s/%([^\n])(.*)1$/\1%\2/
tC
s/([^\n]+)%\n/%\1\n/
:D
s/%([^ \n]* )(.*)1$/\1 %\2/
tD
s/(^|\n)([^\n]+)%(.*1)$/\1%\2\3/
tD
s/%([^\n]*)\n(.*)\n$/\1\n%\2/
tB
:Q
s/%(.*)\n1*$/\1/

オンラインでお試しください!

説明

プログラムは2つのフェーズで機能します。1。分割、2。正当化。以下では、入力が次のとおりであると仮定します。

111111111111
I re-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.

セットアップ

最初に入力を読み取り、最初の行(単項数としての幅)をホールドスペース(x)に移動し、次の行(N)を追加してから、ホールドスペースからの幅のコピー(G)をパターンスペースに追加します。以来N有力で私たちを残し\n、我々はと交換!@私たちは、フェーズ1でのカーソルとして使用しますこれは、。

x;N
G
s/\n/!@/

これで、ホールドスペースの内容は1111111111111(以降変更されません)、パターンスペースは(sedの「明確に印刷」lコマンドの形式)です。

!@I re-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n111111111111$

フェーズ1

フェーズ1では、メイン@カーソルが一度に1文字ずつ進み、各文字に対して1パターンスペースの最後の「カウンター」からa が削除されます。言い換えれば、@foo\n111$f@oo\n11$fo@o\n1$、など

!背後にカーソルトレイル@カウンタは、行の途中で0に達した場合に場所をマーキングカーソルは、我々が破損する可能性があります。いくつかのラウンドは次のようになります。

!@I re-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n111111111111$
!I@ re-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n11111111111$
!I @re-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n1111111111$

ここに認識されるパターンがあります:@カーソルが直後に続くスペースです。カウンターが0より大きいため、ブレークマーカーを進め、メインカーソルを進め続けます。

I !@re-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n1111111111$
I !r@e-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n111111111$
I !re@-mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n11111111$
I !re-@mem-ber a time of cha-os, ru-ined dreams, this was-ted land.\n1111111$

別のパターンは次のとおりです。-@、まだカウンターに7があるので、ブレークカーソルを再度進めて前進し続けます。

I re-!mem-@ber a time of cha-os, ru-ined dreams, this was-ted land.\n111$

別のパターンを次に示します。ブレークカーソルの直前のハイフンとメインカーソルの前のハイフン。最初のハイフンを削除し、ブレークカーソルを進め、文字を削除したので、カウンターに1を追加します。

I remem-!@ber a time of cha-os, ru-ined dreams, this was-ted land.\n1111$

メインカーソルを前進させ続けます。

I remem-!ber@ a time of cha-os, ru-ined dreams, this was-ted land.\n1$

前と同様ですが、今回はメインカーソルがハイフンではなくスペースに先行します。ハイフンを削除しますが、メインカーソルも進めているため、カウンターをインクリメントもデクリメントもしません。

I remember !@a time of cha-os, ru-ined dreams, this was-ted land.\n1$
I remember !a@ time of cha-os, ru-ined dreams, this was-ted land.\n$

最後に、カウンターがゼロになりました。メインカーソルの後の文字はスペースなので、改行を挿入し、その直後に両方のカーソルを置きます。その後、カウンター(G)を補充して、再度開始します。

I remember a\n!@ time of cha-os, ru-ined dreams, this was-ted land.\n111111111111$

@カーソルが文字列の最後に達するまで、フェーズ1が続行し、カーソルを進めてさまざまなパターンに一致します。

# Phase 1
:
  # End of string; branch to :Z (end of phase 1)
  /@\n/bZ

  # Match -!.*@_
  s/-!(.*)@ /\1 !@/

  # Match [-_]@ and >0
  s/!(.*[- ])(@.*1)$/\1!\2/

  # Advance cursor
  s/@(.)(.*)1$/\1@\2/

  # Match -!.*-@ and 0; add 1
  s/-!(.*-)(@.*)\n$/\1!\2\n1/

  # Match \n!@_
  s/(\n!@) /\1/

  # Match -!.*_@ and 0; add 1
  s/-!(.* )(@.*)\n$/\1!\2\n1/

  # Match -!.*-@ and >0; add 1
  s/-!(.*-)(@.*1)$/\1!\21/

  # Match -@[^_]_
  s/!(.*)-@([^ ]) /\1\2!@ /

  # If there were any matches, branch to `:`
  t

  # Match _!@ and 0
  s/ !@(.*)\n$/\n!@\1#/

  # Match -@ and 0
  s/!(.*-)@(.*)\n$/\1\n!@\2#/

  # Match @_|_@ and 0
  s/!(.*)(@ | @)(.*)\n$/\1\n!@\3#/

  # Match -!.*[^-]@[^_]_ and 0
  s/-!(.*[^-])@([^ ]) (.*)\n$/\1\2\n!@\3#/

  # Match !.+@[^_] and 0
  s/!(.+)@([^ ].*)\n$/\n!@\1\2#/

  # Match marked line (#) or !@ and 0
  /#|!@.*\n$/{
    # Remove mark; append width and branch to `:`
    s/#|\n$//
    G
    b
  }

:Z

# Cleanup
s/-?!|@.*//g
s/ \n/\n/g

フェーズ1の終わりに、パターンスペースは次のようになります。

I remember a\ntime of cha-\nos, ruined\ndreams, this\nwasted land.

または:

I remember a
time of cha-
os, ruined
dreams, this
wasted land.

フェーズ2

フェーズ2 %では、カーソルとして使用し、次のように同様の方法でカウンターを使用します。

%I remember a\ntime of cha-\nos, ruined\ndreams, this\nwasted land.\n111111111111$

最初に、カーソルを進め、カウンターから1を削除して、最初の行の文字をカウントします。

I remember a%\ntime of cha-\nos, ruined\ndreams, this\nwasted land.\n$

カウンターは0なので、この行では何もしません。2行目もカウンターと同じ文字数なので、3行目にスキップしましょう。

I remember a\ntime of cha-\nos, ruined%\ndreams, this\nwasted land.\n11$

カウンターは0より大きいため、カーソルを行の先頭に戻します。次に、スペースの最初の実行を見つけ、スペースを追加して、カウンターをデクリメントします。

I remember a\ntime of cha-\nos, % ruined\ndreams, this\nwasted land.\n1$

カウンターが0より大きい。カーソルはすでに行の最後の(唯一の)スペースにあるので、行の先頭に戻って再度実行します。

I remember a\ntime of cha-\nos,  % ruined\ndreams, this\nwasted land.\n$

カウンタは0になったため、カーソルを次の行の先頭に移動します。最後を除くすべての行に対してこれを繰り返します。これでフェーズ2の終わりとプログラムの終わりです!最終結果は次のとおりです。

I remember a
time of cha-
os,   ruined
dreams, this
wasted land.
# Phase 2
# Insert cursor
s/^/%/
:B
  # Append counter from hold space
  G
  # This is the last line; branch to :Q (end of phase 1)
  /%.*\n.+\n/!bQ

  :C
    # Count characters
    s/%([^\n])(.*)1$/\1%\2/
    tC

  # Move cursor to beginning of line
  s/([^\n]+)%\n/%\1\n/

  :D
    # Add one to each space on the line as long as counter is >0
    s/%([^ \n]* )(.*)1$/\1 %\2/
    tD

    # Counter is still >0; go back to beginning of line
    s/(^|\n)([^\n]+)%(.*1)$/\1%\2\3/
    tD

    # Counter is 0; move cursor to next line and branch to :B
    s/%([^\n]*)\n(.*)\n$/\1\n%\2/
    tB

:Q

# Remove cursor, any remaining 1s
s/%(.*)\n1*$/\1/

これはすごいことですが、を使用して実行するgsed (GNU sed) 4.4とgetになりgsed: -e expression #1, char 16: ":" lacks a labelます。呼び出し方法についてのメモを追加できますか?(私は使用していますprintf "%s\n%s" "$1" "$2" | gsed -r '<code here>';
デイブ

@Dave GNU sed 4.2で動作します。要点は次のとおりです。gist.github.com / jrunning / 91a7584d95fe10ef6b036d1c82bd385c TiOのsedページは-rフラグを尊重していないように見えるため、上記のTiOリンクはbashページに移動します。
ヨルダン

ああ、私はTiOリンクに気付いていませんでした。それは私のためになります。+1があります!ただし、最後の例(「黒獣」の例)には2つの小さなミスがあります。最後から2番目の行を1文字短く印刷し、最後の例!を逃し!ます(可能な特殊文字のリストから逃したので、それに対してそれを保持しません)。
デイブ

5

JavaScript(ES6)、147バイト

入力をとして受け取ります(width)(text)

w=>F=(s,p=S=' ')=>(g=([c,...b],o='',h=c=='-')=>c?o[w-1]?c==S&&o+`
`+F(b):o[w+~h]?o+c+`
`+F(b):c>S?g(b,h?o:o+c):g(b,o+p)||g(b,o+p+c):o)(s)||F(s,p+S)

オンラインでお試しください!

コメント済み

w =>                              // w = requested width
  F = (                           // F is a recursive function taking:
    s,                            //   s = either the input string (first iteration) or an
                                  //       array of remaining characters (next iterations)
    p =                           //   p = current space padding
    S = ' '                       //   S = space character
  ) => (                          //
    g = (                         // g is a recursive function taking:
      [c,                         //   c   = next character
          ...b],                  //   b[] = array of remaining characters
      o = '',                     //   o   = output for the current line
      h = c == '-'                //   h   = flag set if c is a hyphen
    ) =>                          //
      c ?                         // if c is defined:
        o[w - 1] ?                //   if the line is full:
          c == S &&               //     fail if c is not a space
          o + `\n` + F(b)         //     otherwise, append o + a linefeed and process the
                                  //     next line
        :                         //   else:
          o[w + ~h] ?             //     if this is the last character and c is a hyphen:
            o + c + `\n` + F(b)   //       append o + c + a linefeed and process the next
                                  //       line
          :                       //     else, we process the next character:
            c > S ?               //       if c is not a space:
              g(b, h ? o : o + c) //         append c if it's not a hyphen
            :                     //       else:
              g(b, o + p) ||      //         append either the current space padding
              g(b, o + p + c)     //         or the current padding and one extra space
      :                           // else:
        o                         //   success: return o
  )(s)                            // initial call to g() with s
  || F(s, p + S)                  // in case of failure, try again with a larger padding



1

Python 2、343バイト

W,T=input()
T+=' '
L,l=[],len
while T:
 p,r=0,''
 for i in range(l(T)):
  s=T[:i].replace('-','')
  if'-'==T[i]:s+='-'
  if T[i]in' -'and W-l(s)>=0:p,r=i,s
 R=r.split()
 if R:
  d,k=W-l(''.join(R)),0
  for j in range(d):
   R[k]+=' '
   k+=1
   if k==l(R)-1:k=0
  L+=[''.join(R)]
  T=T[p+1:]
print'\n'.join(L[:-1])
print' '.join(L[-1].split())

オンラインでお試しください!

The  input  is a block of text
containing possibly hyphenated
words.  For  each space/hyphen
position  p  the code computes
l(p)  the  length  of the line
induced  by  slipping the text
to this space/hyphen. Then the
code choses the position p for
which  the  length l(p) is the
closest  to  the given width W
(and  l(p)<=W).  If l(p)<W the
code  adds spaces  fairly  in-
between  the  words to achieve
the length W.

入力は任意の形式にすることができますが、STDINまたはパラメーターから入力する必要があります。I / Oのデフォルトを参照してください。通常、事前に割り当てられた変数からの「入力」は許可されません。
mbomb007

あなたは実行してバイトを保存することができますprint'\n'.join(L[:-1])代わりにfor e in L[:-1]:print e
mbomb007

@ mbomb007 OKはい、I / Oを尊重するために必要な変更を行います
mdahmoune
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.