内省的プログラミング:ソースと出力を分析するコード


13

文字の総数と、ソースおよび出力内の各文字の頻度を出力するプログラムを作成します。例に示されている形式に従う必要があります。

あなたのコードが

abb1

その出力は

My source has 4 characters.
1 is "a"
2 are "b"
1 is "1"
Besides unquoted numbers, my output has 383 characters.
34 are "
"
79 are " "
63 are """
2 are "'"
2 are ","
4 are "."
2 are "1"
2 are "B"
2 are "I"
2 are "M"
39 are "a"
4 are "b"
6 are "c"
4 are "d"
38 are "e"
3 are "g"
5 are "h"
4 are "i"
4 are "m"
3 are "n"
8 are "o"
3 are "p"
2 are "q"
38 are "r"
12 are "s"
8 are "t"
7 are "u"
3 are "y"
It's good to be a program.

(出力はstdoutに送信する必要があります。)

たとえば、出力に大文字のmが2つ含まれていることに注意してください。1 Myつと1つ2 are "M"。これは、出力がそれ自体と矛盾しないように、すべての文字に当てはまる必要があります。

引用符で囲まれていない数値は、出力で無視され、満足できない周波数セットを回避します。たとえば、1 is "1"両方の1がカウントされる場合、は正しくありません。が表示されるはずですが2 are "1"、その後は1つしかありません。

フォーマットの明確化

  • 「is」は、単一文字の出現に使用する必要があります。

  • 複数の文字の出現には「are」を使用する必要があります。

  • 「is」は不要なので、出力文字のリストに表示されることはありません。1 is 'Z'Z自体を参照するため、行全体を削除できます。

  • 3つのフルセンテンスフレーズは、文字頻度リストを間に挟んで順番に表示する必要があります(例に示すとおり)。したがって、出力はで始まり、My source...で終わり...be a program.ます。出力の最後に改行がないことに注意してください。

  • 文字頻度リスト自体の順序は任意です。

  • 改行は1文字としてカウントされます(\ r \ nの場合)。

フォーマットチェッカー

次のPythonスクリプトは、コードとその出力を文字列として受け取り、出力に矛盾がないことを表明します。何かが間違っている場合、有用なエラーメッセージを提供します。http://ideone.com/6H0lduでオンラインで実行するには、フォークして、CODEおよびOUTPUT文字列を置き換えてから実行します。(エラーがないと仮定して)偽陽性または陰性を与えることはありません。

#Change the CODE and OUTPUT strings to test your program

CODE = r'''abb1'''

OUTPUT = r'''My source has 4 characters.
1 is "a"
2 are "b"
1 is "1"
Besides unquoted numbers, my output has 383 characters.
34 are "
"
79 are " "
63 are """
2 are "'"
2 are ","
4 are "."
2 are "1"
2 are "B"
2 are "I"
2 are "M"
39 are "a"
4 are "b"
6 are "c"
4 are "d"
38 are "e"
3 are "g"
5 are "h"
4 are "i"
4 are "m"
3 are "n"
8 are "o"
3 are "p"
2 are "q"
38 are "r"
12 are "s"
8 are "t"
7 are "u"
3 are "y"
It's good to be a program.'''

#######################################################

import re

amountPattern = r'(\d+) (is|are) "(.)"\n'

class IntrospectionException(Exception):
    pass

def getClaimedAmounts(string, errorOnIs):
    groups = re.findall(amountPattern, string, re.DOTALL)

    for amount, verb, char in groups:
        if verb == 'is':
            if errorOnIs:
                raise IntrospectionException('\'1 is "%s"\' is unnecessary' % char)
            elif amount != '1':
                raise IntrospectionException('At "%s", %s must use "are"' % (char, amount))
        elif verb == 'are' and amount == '1':
            raise IntrospectionException('At "%s", 1 must use "is"' % char)

    amounts = {}
    for amount, verb, char in groups:
        if char in amounts:
            raise IntrospectionException('Duplicate "%s" found' % char)
        amounts[char] = int(amount)
    return amounts

def getActualAmounts(string):
    amounts = {}
    for char in string:
        if char in amounts:
            amounts[char] += 1
        else:
            amounts[char] = 1
    return amounts

def compareAmounts(claimed, actual):
    for char in actual:
        if char not in claimed:
            raise IntrospectionException('The amounts list is missing "%s"' % char)
    for char in actual: #loop separately so missing character errors are all found first
        if claimed[char] != actual[char]:
            raise IntrospectionException('The amount of "%s" characters is %d, not %d' % (char, actual[char], claimed[char]))
    if claimed != actual:
        raise IntrospectionException('The amounts are somehow incorrect')

def isCorrect(code, output):
    p1 = r'^My source has (\d+) characters\.\n'
    p2 = r'Besides unquoted numbers, my output has (\d+) characters\.\n'
    p3 = r"It's good to be a program\.$"
    p4 = '%s(%s)*%s(%s)*%s' % (p1, amountPattern, p2, amountPattern, p3)

    for p in [p1, p2, p3, p4]:
        if re.search(p, output, re.DOTALL) == None:
            raise IntrospectionException('Did not match the regex "%s"' % p)

    claimedCodeSize = int(re.search(p1, output).groups()[0])
    actualCodeSize = len(code)
    if claimedCodeSize != actualCodeSize:
        raise IntrospectionException('The code length is %d, not %d' % (actualCodeSize, claimedCodeSize))

    filteredOutput = re.sub(r'([^"])\d+([^"])', r'\1\2', output)

    claimedOutputSize = int(re.search(p2, output).groups()[0])
    actualOutputSize = len(filteredOutput)
    if claimedOutputSize != actualOutputSize:
        raise IntrospectionException('The output length (excluding unquoted numbers) is %d, not %d' % (actualOutputSize, claimedOutputSize))

    splitIndex = re.search(p2, output).start()

    claimedCodeAmounts = getClaimedAmounts(output[:splitIndex], False)
    actualCodeAmounts = getActualAmounts(code)
    compareAmounts(claimedCodeAmounts, actualCodeAmounts)

    claimedOutputAmounts = getClaimedAmounts(output[splitIndex:], True)
    actualOutputAmounts = getActualAmounts(filteredOutput)
    compareAmounts(claimedOutputAmounts, actualOutputAmounts)

def checkCorrectness():
    try:
        isCorrect(CODE, OUTPUT)
        print 'Everything is correct!'
    except IntrospectionException as e:
        print 'Failed: %s.' % e

checkCorrectness()

得点

これはコードゴルフです。最少のキャラクターの提出が勝ちです。提出物は、有効になるために形式チェッカーに合格する必要があります。標準の抜け穴が適用されますが、独自のソースコードを読んだり、出力をハードコーディングしたりできます


独自のソースファイルの読み取りは許可されていますか?
Ventero

@MrLore他のエラーもあるかもしれませんが、トリプルクォート( '' ')がバックスラッシュで物事をエスケープしていることに気付きました。これは問題に関連している可能性があります。今修正しています。
カルビンの趣味14

@Ventero間違いなく!
カルビンの趣味14

@MrLore正規表現は、いくつかの誤検知を許可します、はい。三重引用符内のバックスラッシュの問題を修正するには、生の文字列(r'''CODE''')を使用します。
Ventero 14

1
@MrLoreエスケープされていないドットを修正しました。気づいてくれてありがとう!
カルビンの趣味14

回答:


2

CJam-189

{`"_~"+:T;"Besides unquoted numbers, my output has &It's good to be a program.&My source has & characters.
"'&/~_]:X2=T,X3=3i({T_&:B{TI/,(" are ":AM`I*N}fIXK=]o
XBA`N+f+2*+s:T,X3=}fK'q];}_~

http://cjam.aditsu.net/で試してください

出力:

My source has 189 characters.
3 are "{"
3 are "`"
6 are """
4 are "_"
3 are "~"
4 are "+"
5 are ":"
5 are "T"
2 are ";"
3 are "B"
8 are "e"
9 are "s"
2 are "i"
3 are "d"
17 are " "
6 are "u"
2 are "n"
2 are "q"
8 are "o"
6 are "t"
3 are "m"
2 are "b"
7 are "r"
4 are ","
2 are "y"
2 are "p"
3 are "h"
7 are "a"
5 are "&"
4 are "I"
3 are "'"
2 are "g"
2 are "."
2 are "M"
3 are "c"
2 are "
"
2 are "/"
3 are "]"
5 are "X"
2 are "2"
4 are "="
3 are "3"
2 are "("
2 are "A"
2 are "*"
2 are "N"
3 are "}"
3 are "f"
2 are "K"
Besides unquoted numbers, my output has 988 characters.
3 are "B"
108 are "e"
11 are "s"
3 are "i"
5 are "d"
214 are " "
8 are "u"
4 are "n"
3 are "q"
9 are "o"
9 are "t"
5 are "m"
4 are "b"
108 are "r"
3 are ","
4 are "y"
4 are "p"
6 are "h"
108 are "a"
3 are "I"
3 are "'"
4 are "g"
5 are "."
3 are "M"
7 are "c"
102 are "
"
2 are "{"
198 are """
2 are "`"
2 are "_"
2 are "~"
2 are "+"
2 are ":"
2 are "T"
2 are ";"
2 are "&"
2 are "/"
2 are "]"
2 are "X"
2 are "2"
2 are "="
2 are "3"
2 are "("
2 are "A"
2 are "*"
2 are "N"
2 are "}"
2 are "f"
2 are "K"
It's good to be a program.

11

ルビー、269(311、367)文字

この課題には3つの異なる解決策があります。それらはそれぞれ異なるトリックのセットを使用します:

「適切な」ソリューション、367文字:

最長の解決策は、多少なりとも概念の証明に過ぎず、トリックを使用せずにこの課題を解決することが可能であり、ほぼ完全にゴルフされていません。これは真のクインです(つまり、ファイルから読み取る代わりに独自のソースコードを生成します)。実際に印刷するすべての数値(コード長、出力長、文字の出現)を計算します。クインの動作方法により、すべてのコードは1行で文字列リテラル内になければなりません。

eval r="S='eval r=%p'%r;O=-~$.;q=\"My source has \#{S.size}\"+(X=' characters.\n')+S.chars.uniq.map{|c|[k=S.count(c),k>O ? :are: :is,?\"+c+?\"]*' '}*$/+'\nBesides unquoted numbers, my output has ';r=(w=q+X+s=\"It's good to be a program.\").scan(D=/\\D/).uniq;$><<q<<(w+v=r.map{|c|j=' are \"\n\"';(-~(w+j*r.size).count(c)).to_s+(j[~O]=c;j)}*$/+$/).scan(D).size<<X+v+s"

部分的にハードコーディングされた出力、311文字:

次の最短の解決策は2つのトリックを使用しますが、それでも真の馬鹿です。そうすれば、私は印刷する必要があるかどうかを決定する必要がないisか、are出力の最初の半分に。また、合計出力サイズの計算が少し簡単になります(実際には必要ありませんが)。-合計出力サイズはハードコードされています。これは、ソースコード内の個別の文字の数(および一般的な場合、それらの文字の数が1回だけ発生する)にのみ依存するため、事前に簡単に計算できます。

StackExchangeがコードブロックに表示しない2つの非常に重要な改行がコードの前にあることに注意してください。そのため、これらの改行の場合、コードの一部ではない追加の行を前に追加しました。

#


eval R="I=$/+$/+'eval R=%p'%R;?\\4>w='%d are \"%s\"';B=\"My source has \#{I.size}\#{X=\" characters.\n\"}\#{z=(m=I.chars.uniq).map{|x|w%[I.count(x),x]}*$/}\nBesides unquoted numbers, my output has 1114\"+X;$><<B+m.map{|c|w%[(B+z+$M=\"\nIt's good to be a program.\").gsub!(/\\d++(?!\")/,'').count(c),c]}*$/+$M"

最短ソリューション、269文字:

最短のソリューションは、さらに独自のソース長をハードコーディングします。ソースコードの一部である/まだない変数名を使用することにより、ソースコード内のすべての文字(ハードコードされた長さの数字を含む!)が少なくとも2回現れる「固定点」を見つけることができます。

また、このソリューションでは、コードファイルを生成するのではなく、コードファイルから独自のソースコードを読み取るだけで、文字をさらに節約できます。これにより、コードが文字列リテラル内にある必要がなくなるので、これにより、コードがはるかに「読みやすく」なります(ただし、で読みやすいコードが必要です)。

U='%d are "%s"'
O=IO.read$0
?\126>B="My source has 269#{X=" characters.
"}#{z=(m=O.chars.uniq).map{|c|U%[O.count(c),c]}*$/}
Besides unquoted numbers, my output has 1096"+X
$><<B+m.map{|c|U%[(B+z+$M="
It's good to be a program.").gsub!(/\d++(?!")/,"").count(c),c]}*$/+$M

また、テストスクリプトを少し変更して、コードをチェックするために必要なコピーアンドペーストを減らしました。定義を交換することにより、CODEおよびOUTPUT付き

import subprocess

CODE = open("packed.rb").read()
OUTPUT = subprocess.check_output(["ruby", "packed.rb"])

print CODE
print len(CODE)

スクリプトは自動的にコードを実行し、その出力を読み取り、コードファイルからソースコードを取得します。


最短コードで生成された出力は次のとおりです。

My source has 269 characters.
3 are "U"
7 are "="
3 are "'"
4 are "%"
6 are "d"
17 are " "
11 are "a"
9 are "r"
9 are "e"
11 are """
11 are "s"
6 are "
"
4 are "O"
2 are "I"
10 are "."
6 are "$"
2 are "0"
2 are "?"
2 are "\"
2 are "1"
2 are "2"
3 are "6"
2 are ">"
4 are "B"
3 are "M"
2 are "y"
9 are "o"
10 are "u"
12 are "c"
4 are "h"
2 are "9"
2 are "#"
4 are "{"
2 are "X"
8 are "t"
4 are "}"
2 are "z"
6 are "("
7 are "m"
5 are "n"
2 are "i"
2 are "q"
6 are ")"
4 are "p"
4 are "|"
2 are "["
4 are ","
2 are "]"
2 are "*"
4 are "/"
3 are "b"
7 are "+"
2 are "<"
3 are "g"
2 are "!"
Besides unquoted numbers, my output has 1096 characters.
2 are "U"
2 are "="
3 are "'"
2 are "%"
5 are "d"
238 are " "
120 are "a"
120 are "r"
120 are "e"
222 are """
11 are "s"
114 are "
"
2 are "O"
3 are "I"
5 are "."
2 are "$"
2 are "0"
2 are "?"
2 are "\"
2 are "1"
2 are "2"
2 are "6"
2 are ">"
3 are "B"
3 are "M"
4 are "y"
9 are "o"
8 are "u"
7 are "c"
6 are "h"
2 are "9"
2 are "#"
2 are "{"
2 are "X"
9 are "t"
2 are "}"
2 are "z"
2 are "("
5 are "m"
4 are "n"
3 are "i"
3 are "q"
2 are ")"
4 are "p"
2 are "|"
2 are "["
3 are ","
2 are "]"
2 are "*"
2 are "/"
4 are "b"
2 are "+"
2 are "<"
4 are "g"
2 are "!"
It's good to be a program.

コードと出力の最終的なコピーを投稿して、簡単にテストできるようにできますか?コードはそれ自体を出力してはならず、出力は改行ではなくピリオドで終了する必要があります。
カルビンの趣味14

@ Calvin'sHobbies最初のコードブロックは、実際のコードです。ただし、最後の改行で出力が印刷されるため、それを修正するために数分かかります(これは仕様で間違いなく言及する必要があります)。
Ventero 14

確かに、仕様を更新しました。
カルビンの趣味14

@ Calvin'sHobbies完了 最初のコードブロックは、2番目のコードブロックによって生成される実際のコードです(そのため、コードの作成中に文字列のエスケープやすべてを処理する必要はありません)。
Ventero 14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.