文字列から数字を削除する[終了]


120

文字列から数字を削除するにはどうすればよいですか?


19
ありreresult = re.sub(r'[0-9]+', '', s)
WiktorStribiżewSep

正規表現では、\を追加する必要があります。また、それは私が考える10進数であることができるので。like result = re.sub(r '[0-9 \。] +'、 ''、s)
GurhanCagin

1
"\d"正規表現ではと同じな"[0-9]"ので、result = re.sub(r"\d+", "", s)代わりに行うことができます。速度は、使用されている特定の文字列におそらく依存しますが、私にとっては、re.sub約2倍の時間がかかりましたstr.translate(プリコンパイルされたパターンを使用しない場合は少し長くなります)。
Nathan

回答:


185

これはあなたの状況でうまくいきますか?

>>> s = '12abcd405'
>>> result = ''.join([i for i in s if not i.isdigit()])
>>> result
'abcd'

これはリスト内包表記を利用しており、ここで行われていることはこの構造に似ています。

no_digits = []
# Iterate through the string, adding non-numbers to the no_digits list
for i in s:
    if not i.isdigit():
        no_digits.append(i)

# Now join all elements of the list with '', 
# which puts all of the characters together.
result = ''.join(no_digits)

@AshwiniChaudharyと@KirkStrauserが指摘するように、実際には1行で角かっこを使用する必要はなく、かっこ内の部分はジェネレータ式になります(リスト内包より効率的)。これがあなたの割り当ての要件に合わない場合でも、それは最終的に読むべきものです:):

>>> s = '12abcd405'
>>> result = ''.join(i for i in s if not i.isdigit())
>>> result
'abcd'

@seanJohnsonすごい!私はこのサイトの他の誰かからそれを学んだので、サイクルは完全です:)
RocketDonkey

@RocketDonkey no need of[]
Ashwini Chaudhary

3
Python 2.7以降では、リスト内包を大括弧で囲む必要はありません。あなたはそれらを省くことができ、それはジェネレータ式になります。
Kirk Strauser

修正済み-@ AshwiniChaudhary / @ KirkStrauserに感謝します。
RocketDonkey

@RocketDonkeyもいくつかの説明を追加します。コードを表示するだけでは、私が推測するOPに役立ちません。
Ashwini Chaudhary

97

そして、それをミックスに投入するために、str.translateループ/正規表現よりもはるかに速く機能することがよくあります:

Python 2の場合:

from string import digits

s = 'abc123def456ghi789zero0'
res = s.translate(None, digits)
# 'abcdefghizero'

Python 3の場合:

from string import digits

s = 'abc123def456ghi789zero0'
remove_digits = str.maketrans('', '', digits)
res = s.translate(remove_digits)
# 'abcdefghizero'

13
このアプローチはPython3では機能しません。代わりに実行してください 'abc123def456ghi789zero0'.translate({ord(k): None for k in digits})
。– valignatev

3
Python2に最適なソリューション。
Harsh Wardhan 2016年

Unicode文字列では機能しません
Harry M

20

先生がフィルターの使用を許可しているかどうかはわかりませんが...

filter(lambda x: x.isalpha(), "a1a2a3s3d4f5fg6h")

戻り値-

'aaasdffgh'

ループよりもはるかに効率的...

例:

for i in range(10):
  a.replace(str(i),'')

1
代わりにこれを返します:<filter object at 0x03475FD0>
lone_coder

5

これはどうですか:

out_string = filter(lambda c: not c.isdigit(), in_string)

4
出力は<filter object at 0x7f749e1745c0>です。Python3.6
TitanFighter

@TitanFighterフィルターから返されたオブジェクトをlist(filter(...))にラップすることにより、ジェネレーターをリストオブジェクトに強制できます
ahlusar1989

5

ほんの少し(他の人はこれらのいくつかを提案しました)

方法1:

''.join(i for i in myStr if not i.isdigit())

方法2:

def removeDigits(s):
    answer = []
    for char in s:
        if not char.isdigit():
            answer.append(char)
    return ''.join(char)

方法3:

''.join(filter(lambda x: not x.isdigit(), mystr))

方法4:

nums = set(map(int, range(10)))
''.join(i for i in mystr if i not in nums)

方法5:

''.join(i for i in mystr if ord(i) not in range(48, 58))

2
これらの効率の比較を示すことは価値があります。
nu everest

2

stがフォーマットされていない文字列であると言って、実行します

st_nodigits=''.join(i for i in st if i.isalpha())

上記のように。しかし、あなたが非常にシンプルなものが必要だと私は思うので、sは文字列で、st_resは数字のない文字列であるとすると、ここにコードがあります

l = ['0','1','2','3','4','5','6','7','8','9']
st_res=""
for ch in s:
 if ch not in l:
  st_res+=ch

1

正規表現を使用してこれを実現したいのですが、リスト、ループ、関数などしか使用できないためです。

これが私が思いついたものです:

stringWithNumbers="I have 10 bananas for my 5 monkeys!"
stringWithoutNumbers=''.join(c if c not in map(str,range(0,10)) else "" for c in stringWithNumbers)
print(stringWithoutNumbers) #I have  bananas for my  monkeys!

1

私があなたの質問を正しく理解している場合、1つの方法は文字列を文字で分解し、それが文字列であるか数値であるかをループを使用してその文字列の各文字をチェックし、次に文字列が変数に保存してからループを1回行うことです終了したら、それをユーザーに表示します


forループは文字列のすべての文字を自動的に反復するため、文字列を文字に分割する必要はありません。
Ashwini Chaudhary
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.