2進数に従って単語のリストを作成する


12

私は次のようなマトリックスを持っています:

入力

A   B   C   D   E   F   G   H   I 
0   0   0   0   1   0   0   0   1
0   0   0   1   0   0   0   0   0  
0   0   0   1   0   0   0   0   0  
1   0   0   0   0   0   0   0   0  
1   0   1   0   0   0   1   0   0  
1   0   0   1   0   0   0   1   0  
1   0   0   0   1   1   1   0   0  

そして、値1に対応する文字のリストを行ごとに抽出したいと思います。

出力

E,I 
D
D
A
A,C,G  
A,D,H  
A,E,F,G  

ヘッダーを分割し、単語と数字を一致させようとしましたが、失敗しました。

回答:


12

awk

NR == 1 { for(column=1; column <= NF; column++) values[column]=$column; }
NR > 1 { output=""
        for(column=1; column <= NF; column++)
                if($column) output=output ? output "," values[column] : values[column]
        print output }

6
使用することもできますNR == 1 { split($0,values) }
-Sundeep

2行目をスキップしています。next後続の行で反対の条件をテストする必要がないように、最初の行の最後にを置くことを検討してください。
エド・モートン

1
元の入力テキストに余分な空白行が含まれているように見えます。それはその後編集されたので、に変更NR > 2してくださいNR > 1
ジェフシャラー

1
「ゴルフ」のヒント、サンディープをありがとう!明示的「for」ループは、視覚的/論理的に本体の「for」ループと並ぶため、好むと思います。
ジェフシャラー

1
@ fusion.slope、単一引用符で囲まれた引数でコード全体をに渡すかawk、コードをファイルに貼り付けて実行しますawk -f that.script.file input-file
Jeff Schaller

6

もう一つ perl

$ perl -lane 'if($. == 1){ @h=@F }
              else{@i = grep {$F[$_]==1} (0..$#F); print join ",",@h[@i]}
             ' ip.txt
E,I
D
D
A
A,C,G
A,D,H
A,E,F,G
  • -a入力行を空白で分割するオプション、@F配列で利用可能
  • if($. == 1){ @h=@F } 最初の行の場合、ヘッダーを保存します
  • @i = grep {$F[$_]==1} (0..$#F) エントリが次の場合はインデックスを保存します 1
  • print join ",",@h[@i],セパレータとして使用して、ヘッダー配列からそれらのインデックスのみを出力します

4

それでも楽しみのために、 zshバージョン:

{
   read -A a  &&
   while read -A b; do
     echo ${(j<,>)${(s<>)${(j<>)a:^b}//(?0|1)}}
   done
} < file
  • ${a:^b} 2つの配列を圧縮して、A 0 B 0 C 0 D 0 E 1 F 0 G 0 H 0 I 1を取得します
  • ${(j<>)...} 間に何もない状態で要素を結合し、A0B0C0D0E1F0G0H0I1になる
  • ${...//(?0|1)}私たちは、ストリップ?01、それはEIになるように、それから:
  • ${(s<>)...} 文字ごとに1つの要素の配列を取得するために何も分割しない:EI
  • ${(j<,>)...},-> E、Iでそれらに参加します。

これは単純なバッシュです。
fusion.slope

1
@ fusion.slope、いいえ、それはzsh、とは異なるシェルですbash(そして、もっと強力で、私に尋ねると、はるかに優れたデザインです)。bashは、ここに記載されている機能ではなく、zsh機能のごく一部(など)のみを借用しています。ほとんどの機能は、から借用されています。{1..4}<<<**/*bashksh
ステファンシャゼラス

3

別のawkソリューション:

awk 'NR==1{ split($0,a); next }   # capture and print `header` fields
     { for (i=1;i<=NF;i++)         # iterating through value fields `[0 1 ...]`
           if ($i) { printf "%s",(f?","a[i]:a[i]); f=1 } 
       f=0; print "" 
     }' file

出力:

E,I
D
D
A
A,C,G
A,D,H
A,E,F,G

2

Perlのソリューションは次のとおりです。

use strict;

my @header = split /\s+/, <>;
<>; ## Skip blank line
while (<>) {
    my @flags = split /\s+/;
    my @letters = ();
    for my $i (0 .. scalar @flags - 1) {
        push @letters, $header[$i] if $flags[$i];
    }

    print join(',', @letters), "\n";
}

ヘッダー列を配列に読み込んでから、データ行ごとに、一致するデータ列がtrueと評価された場合に列名を出力配列にコピーします。次に、列名がコンマ区切りで印刷されます。


2

sedそれの楽しみのために1:

sed '
  s/ //g
  1{h;d;}
  G;s/^/\
/
  :1
    s/\n0\(.*\n\)./\
\1/
    s/\n1\(.*\n\)\(.\)/\2\
\1/
  t1
  s/\n.*//
  s/./&,/g;s/,$//'

GNU sedを使用すると、次のようにしてもう少し読みやすくすることができます。

sed -E '
  s/ //g # strip the spaces

  1{h;d} # hold the first line

  G;s/^/\n/ # append the held line and prepend an empty line so the
            # pattern space becomes <NL>010101010<NL>ABCDEFGHI we will
            # build the translated version in the part before the first NL
            # eating one character at a time off the start of the
            # 010101010 and ABCDEFGHI parts in a loop:
  :1
    s/\n0(.*\n)./\n\1/     # ...<NL>0...<NL>CDEFGHI becomes
                           # ...<NL>...<NL>DEFGHI (0 gone along with C)

    s/\n1(.*\n)(.)/\2\n\1/ # ...<NL>1...<NL>CDEFGHI becomes
                           # ...C<NL>...<NL>DEFGHI (1 gone but C moved to 
                           #                        the translated part)
  t1 # loop as long as any of those s commands succeed

  s/\n.*// # in the end we have "ADG<NL><NL>", strip those NLs

  s/./,&/2g # insert a , before the 2nd and following characters'

各行に常に同じ桁数があると仮定した、少し短いバージョン:

sed -E '
  s/ //g
  1{H;d}
  G
  :1
    s/^0(.*\n)./\1/
    s/^1(.*\n)(.*\n)(.)/\1\3\2/
  t1
  s/\n//g
  s/./,&/2g'

上記と同じですが、いくつかの最適化を可能にする翻訳済み部分とインデックス部分を交換しています。


あなたが説明できるなら、コミュニティにとって良いでしょう。事前に感謝
-fusion.slope

1
@ fusion.slope、編集を参照してください。
ステファンシャゼラス

t1コマンドでループを作成してください!
fusion.slope

1

python3

python3 -c '
import sys
header = next(sys.stdin).rstrip().split()
for line in sys.stdin:
  print(*(h*int(f) for (h, f) in zip(header, line.rstrip().split()) if int(f)), sep=",")

  ' <file
E,I
D
D
A
A,C,G
A,D,H
A,E,F,G

0

純粋なbashソリューション:

read -a h
while read -a r
do (
    for i in ${!r[@]}
    do 
        (( r[i] == 1 )) && y[i]=${h[i]}
    done
    IFS=,
    echo "${y[*]}")
done

3
これがどのように問題を解決するか説明してください。
スコット

これは読者の練習問題として残されています。bashの基本的な知識LESS="+/^ {3}Array" man bashがあると、bash配列に必要なすべての情報が得られるはずです。回答を自由に編集して、役立つ説明を追加できます。
デビッドオンガロ

-1
 void Main(string[] args)
        {
            int[,] numbers = new int[,]
            {
            {0, 0, 0, 0, 1, 0, 0, 0, 1},
            {0, 0, 0, 1, 0, 0, 0, 0, 0},
            {0, 0, 0, 1, 0, 0, 0, 0, 0},
            {1, 0, 0, 0, 0, 0, 0, 0, 0},
            {1, 0, 1, 0, 0, 0, 1, 0, 0},
            {1, 0, 0, 1, 0, 0, 0, 1, 0},
            {1, 0, 0, 0, 1, 1, 1, 0, 0}
            };
            string letters = "ABCDEFGHI";
            for (int row = 0; row < 7; row++)
            {
                for (int col = 0; col < 9; col++)
                {
                    if (numbers[row, col] == 1)
                        Console.Write(letters[col]);
                }
                Console.WriteLine();
            }
        }

3
これが何をするのか、どのように機能するのかを説明してください。
スコット

言語もお願いします。
fusion.slope
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.