文字列にゼロを埋め込む方法は?


回答:


2394

文字列:

>>> n = '4'
>>> print(n.zfill(3))
004

そして数字について:

>>> n = 4
>>> print(f'{n:03}') # Preferred method, python >= 3.6
004
>>> print('%03d' % n)
004
>>> print(format(n, '03')) # python >= 2.6
004
>>> print('{0:03d}'.format(n))  # python >= 2.6 + python 3
004
>>> print('{foo:03d}'.format(foo=n))  # python >= 2.6 + python 3
004
>>> print('{:03d}'.format(n))  # python >= 2.7 + python3
004

文字列フォーマットのドキュメント


3
タイプ「float」のオブジェクトの不明なフォーマットコード「d」。
Cees Timmerman

7
コメントpython >= 2.6が間違っています。この構文は、では機能しませんpython >= 3。に変更することもできますがpython < 3、代わりに常に括弧を使用し、コメントを完全に省略することをお勧めします(推奨される使用法を奨励します)?
Jason R. Coombs

4
書式文字列に番号を付ける必要はありません。'{:03d} {:03d}'.format(1, 2)暗黙的に値を順番に割り当てます。
ドラゴン

1
@ JasonR.Coombs:Python 3の関数printである必要があるときに、ステートメントを意味していると思いますprintか?私は括弧で編集しました。印刷されるのは1つだけなので、Py2とPy3で同じように機能します。
ShadowRanger


353

文字列オブジェクトのrjustメソッドを使用するだけです。

この例では、10文字の文字列を作成し、必要に応じてパディングします。

>>> t = 'test'
>>> t.rjust(10, '0')
>>> '000000test'

123

さらにzfill、一般的な文字列フォーマットを使用できます。

print(f'{number:05d}') # (since Python 3.6), or
print('{:05d}'.format(number)) # or
print('{0:05d}'.format(number)) # or (explicit 0th positional arg. selection)
print('{n:05d}'.format(n=number)) # or (explicit `n` keyword arg. selection)
print(format(number, '05d'))

文字列のフォーマットf-stringsのドキュメント。


3
PEP 3101は、%が非推奨であるとは述べていません。
zwirbeltier 2014年

@zwirbeltier PEP 3101は、フォーマットの使用方法を説明しています。
Konrad Rudolph

4
「編集」にはまだ「...このフォーマット方法は廃止予定です...」と記載されています。
zwirbeltier 2014年

1
@zwirbeltierはい、非推奨です。しかし、これはPEPで直接述べられていません。しかし、ドキュメントはformat代わりに使用するように言っており、人々は一般的にこれを廃止する意図として解釈します。
Konrad Rudolph

1
@LarsHこれを見つけてくれてありがとう。そのため、それらは予定より大幅に遅れています(Python 3.1は将来ではなく、遠い過去です)。それでも、Pythonの開発スケジュールが新しい任意の方向に変更されるたびに厳密に更新されなかっただけで、答えが誤解を招くとはまだ思いません。とにかく、これは私に無関係で古いものを私の答えから取り除く機会を私に与えました。
Konrad Rudolph

63

f-stringsを使用するPython 3.6+の場合:

>>> i = 1
>>> f"{i:0>2}"  # Works for both numbers and strings.
'01'
>>> f"{i:02}"  # Works only for numbers.
'01'

Python 2からPython 3.5の場合:

>>> "{:0>2}".format("1")  # Works for both numbers and strings.
'01'
>>> "{:02}".format(1)  # Works only for numbers.
'01'


39

str(n).zfill(width)で動作しますstring、S int、S、floatよ...とPython 2でXと3 X互換性:

>>> n = 3
>>> str(n).zfill(5)
'00003'
>>> n = '3'
>>> str(n).zfill(5)
'00003'
>>> n = '3.0'
>>> str(n).zfill(5)
'003.0'

23

ここに来た人たちのために、簡単な答えではなく理解してください。私は特に時間列に対してこれらを行います:

hour = 4
minute = 3
"{:0>2}:{:0>2}".format(hour,minute)
# prints 04:03

"{:0>3}:{:0>5}".format(hour,minute)
# prints '004:00003'

"{:0<3}:{:0<5}".format(hour,minute)
# prints '400:30000'

"{:$<3}:{:#<5}".format(hour,minute)
# prints '4$$:3####'

「0」は「2」のパディング文字で置き換えるものを示します。デフォルトは空白です。

">"記号は、文字列の左側にあるすべての2 "0"文字を割り当てます

":"はformat_specを表します


23

数値文字列を左側にゼロで埋める最もパイソン的な方法は何ですか?つまり、数値文字列は特定の長さを持っていますか?

str.zfill これを行うことを特に意図しています:

>>> '1'.zfill(4)
'0001'

これは特に、要求に応じて数値文字列を処理することを目的としており、+または-を文字列の先頭に移動します。

>>> '+1'.zfill(4)
'+001'
>>> '-1'.zfill(4)
'-001'

ここにヘルプがありstr.zfillます:

>>> help(str.zfill)
Help on method_descriptor:

zfill(...)
    S.zfill(width) -> str

    Pad a numeric string S with zeros on the left, to fill a field
    of the specified width. The string S is never truncated.

パフォーマンス

これは、代替方法の中で最もパフォーマンスが高いものでもあります。

>>> min(timeit.repeat(lambda: '1'.zfill(4)))
0.18824880896136165
>>> min(timeit.repeat(lambda: '1'.rjust(4, '0')))
0.2104538488201797
>>> min(timeit.repeat(lambda: f'{1:04}'))
0.32585487607866526
>>> min(timeit.repeat(lambda: '{:04}'.format(1)))
0.34988890308886766

%メソッドのリンゴとリンゴを最もよく比較するには(実際には遅いことに注意してください)、そうでない場合は事前計算されます。

>>> min(timeit.repeat(lambda: '1'.zfill(0 or 4)))
0.19728074967861176
>>> min(timeit.repeat(lambda: '%04d' % (0 or 1)))
0.2347015216946602

実装

少し掘り下げて、私はzfillメソッドの実装を以下に見つけましたObjects/stringlib/transmogrify.h

static PyObject *
stringlib_zfill(PyObject *self, PyObject *args)
{
    Py_ssize_t fill;
    PyObject *s;
    char *p;
    Py_ssize_t width;

    if (!PyArg_ParseTuple(args, "n:zfill", &width))
        return NULL;

    if (STRINGLIB_LEN(self) >= width) {
        return return_self(self);
    }

    fill = width - STRINGLIB_LEN(self);

    s = pad(self, fill, 0, '0');

    if (s == NULL)
        return NULL;

    p = STRINGLIB_STR(s);
    if (p[fill] == '+' || p[fill] == '-') {
        /* move sign to beginning of string */
        p[0] = p[fill];
        p[fill] = '0';
    }

    return s;
}

このCコードを見ていきましょう。

最初に引数を位置的に解析します。つまり、キーワード引数を許可しません。

>>> '1'.zfill(width=4)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: zfill() takes no keyword arguments

次に、同じ長さかそれ以上かどうかをチェックします。その場合、文字列を返します。

>>> '1'.zfill(0)
'1'

zfill呼び出しpad(このpad機能もによって呼び出されljustrjustcenter同様)。これは基本的に内容を新しい文字列にコピーし、パディングを埋めます。

static inline PyObject *
pad(PyObject *self, Py_ssize_t left, Py_ssize_t right, char fill)
{
    PyObject *u;

    if (left < 0)
        left = 0;
    if (right < 0)
        right = 0;

    if (left == 0 && right == 0) {
        return return_self(self);
    }

    u = STRINGLIB_NEW(NULL, left + STRINGLIB_LEN(self) + right);
    if (u) {
        if (left)
            memset(STRINGLIB_STR(u), fill, left);
        memcpy(STRINGLIB_STR(u) + left,
               STRINGLIB_STR(self),
               STRINGLIB_LEN(self));
        if (right)
            memset(STRINGLIB_STR(u) + left + STRINGLIB_LEN(self),
                   fill, right);
    }

    return u;
}

呼び出した後padzfill動きがどのもともと、先行する+か、-文字列の先頭に。

元の文字列が実際に数値である必要はないことに注意してください。

>>> '+foo'.zfill(10)
'+000000foo'
>>> '-foo'.zfill(10)
'-000000foo'

パフォーマンスのために、python2とpython3のユースケースを含めて、f文字列の方が優れているケースはありますか?また、zfillは一般的ではないので、ドキュメントへのリンクがあるとあなたの回答に役立つと思います
elad silver

@eladsilverは、と心の中で行動を保ち、あなたの目的に依存+して-、そして私は、ドキュメントへのリンクを追加しました!
アーロンホール

17
width = 10
x = 5
print "%0*d" % (width, x)
> 0000000005

エキサイティングな詳細については、印刷ドキュメントをご覧ください。

Python 3.xの更新(7.5年後)

最後の行は次のようになります。

print("%0*d" % (width, x))

つまりprint()、ステートメントではなく関数になりました。printf()IMNSHOの方が読みやすく、1980年1月からその表記法を使用しているため、私はまだオールドスクールスタイルを好むことに注意してください。何か...古い犬....何か...新しいトリック


1980年以来...あなたは60歳のプログラマーですか... "%0*d" % (width, x)Python でどのように解釈されるかについてもっと説明してもらえますか?
Lee

15

Pythonを使用する場合>= 3.6、最もクリーンな方法は、文字列フォーマットでf-stringsを使用することです。

>>> s = f"{1:08}"  # inline with int
>>> s
'00000001'
>>> s = f"{'1':0>8}"  # inline with str
>>> s
'00000001'
>>> n = 1
>>> s = f"{n:08}"  # int variable
>>> s
'00000001'
>>> c = "1"
>>> s = f"{c:0>8}"  # str variable
>>> s
'00000001'

int記号のみが正しく処理されるため、でフォーマットすることをお勧めします。

>>> f"{-1:08}"
'-0000001'

>>> f"{1:+08}"
'+0000001'

>>> f"{'-1':0>8}"
'000000-1'

新しい構文の例をありがとう。充填文字「x」は次のようになります:v = "A18"; s = f '{v:x> 8}' + "|"; またはs = v.ljust(8、 "x")+ "|";
チャーリー木匠

@Charlie木匠それは私への質問でしたか、それとも単なる声明でしたか?
ruohola

ただの声明。いくつかの使用法をテストしました。
チャーリー木匠

4

整数として保存された郵便番号の場合:

>>> a = 6340
>>> b = 90210
>>> print '%05d' % a
06340
>>> print '%05d' % b
90210

1
あなたは正しいです、そして私はとにかくzfillであなたの提案をより良くしています

3

迅速なタイミング比較:

setup = '''
from random import randint
def test_1():
    num = randint(0,1000000)
    return str(num).zfill(7)
def test_2():
    num = randint(0,1000000)
    return format(num, '07')
def test_3():
    num = randint(0,1000000)
    return '{0:07d}'.format(num)
def test_4():
    num = randint(0,1000000)
    return format(num, '07d')
def test_5():
    num = randint(0,1000000)
    return '{:07d}'.format(num)
def test_6():
    num = randint(0,1000000)
    return '{x:07d}'.format(x=num)
def test_7():
    num = randint(0,1000000)
    return str(num).rjust(7, '0')
'''
import timeit
print timeit.Timer("test_1()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_2()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_3()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_4()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_5()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_6()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_7()", setup=setup).repeat(3, 900000)


> [2.281613943830961, 2.2719342631547077, 2.261691106209631]
> [2.311480238815406, 2.318420542148333, 2.3552384305184493]
> [2.3824197456864304, 2.3457239951596485, 2.3353268829498646]
> [2.312442972404032, 2.318053102249902, 2.3054072168069872]
> [2.3482314132374853, 2.3403386400002475, 2.330108825844775]
> [2.424549090688892, 2.4346475296851438, 2.429691196530058]
> [2.3259756401716487, 2.333549212826732, 2.32049893822186]

私はさまざまな繰り返しのさまざまなテストを行いました。違いはそれほど大きくはありませんが、すべてのテストで、zfillソリューションが最速でした。


1

別のアプローチは、長さをチェックする条件でリスト内包表記を使用することです。以下はデモです:

# input list of strings that we want to prepend zeros
In [71]: list_of_str = ["101010", "10101010", "11110", "0000"]

# prepend zeros to make each string to length 8, if length of string is less than 8
In [83]: ["0"*(8-len(s)) + s if len(s) < desired_len else s for s in list_of_str]
Out[83]: ['00101010', '10101010', '00011110', '00000000']

0

大丈夫です:

 h = 2
 m = 7
 s = 3
 print("%02d:%02d:%02d" % (h, m, s))

出力は次のようになります: "02:07:03"


-2

「0」を繰り返し、先頭に追加してstr(n)、右端の幅のスライスを取得することもできます。素早い汚れた表情。

def pad_left(n, width, pad="0"):
    return ((pad * width) + str(n))[-width:]

1
ただし、これは正の数に対してのみ機能します。ネガも必要な場合は、少し複雑になります。しかし、この表現は、そのようなことを気にしないのであれば、すばやく汚れた作業に適しています。
Jラカール2013年

なぜこれが反対投票なのか、私にはまったくわかりません。それが原因である場合、それは十分に公平な負の数では機能しませんが、ゼロで埋める圧倒的な理由はID番号のためです。負のID番号を使用している場合、より大きな問題があると思います...パッドが「00000-1234」の形式であることを期待していますか?または '-000001234'?正直なところ、この答えが機能する質問を考えると、それは単純で、クリーンで、拡張可能です。それはzfillではないかもしれませんが、それが質問に答えるなら、それは賛成されるべきです。
TastySlowCooker
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.