リスト内の文字列値を検索して置換する


153

私はこのリストを手に入れました:

words = ['how', 'much', 'is[br]', 'the', 'fish[br]', 'no', 'really']

私が欲しいのは、に[br]似た素晴らしい値に置き換え<br />て、新しいリストを取得することです。

words = ['how', 'much', 'is<br />', 'the', 'fish<br />', 'no', 'really']

回答:


274
words = [w.replace('[br]', '<br />') for w in words]

これらはリスト内包表記と呼ばれます。


5
このリスト内包表記法とマップ法(@Anthony Kongによる投稿)を比較すると、このリスト法はおよそ2倍高速でした。また、同じコールに複数の交換品を挿入することもできましたresname = [name.replace('DA', 'ADE').replace('DC', 'CYT').replace('DG', 'GUA').replace('DT', 'THY') for name in ncp.resname()]

1
@sberry私は空で['word STRING', 'word_count BIGINT', 'corpus STRING', 'corpus_date BIGINT']置き換えようとしているリストがあり'ますが、これは機能しません。これを使用してこれをどのように置き換えることができますか?
Sandeep Singh

アイテムの1つがフロート/整数の場合はどうなりますか?
Patriots299

32

たとえば、次のように使用できます。

words = [word.replace('[br]','<br />') for word in words]

2
@macetw実際の最初の答え。
CodeIt

タイムスタンプを見ると、両方が同時に応答しているようです。おそらくこれは秒の数分の1だけ遅れているのかもしれません...
maksbd19

31

リストの理解の他に、マップを試すことができます

>>> map(lambda x: str.replace(x, "[br]", "<br/>"), words)
['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']

15

さまざまなアプローチのパフォーマンスについて疑問がある場合のために、ここにいくつかのタイミングを示します。

In [1]: words = [str(i) for i in range(10000)]

In [2]: %timeit replaced = [w.replace('1', '<1>') for w in words]
100 loops, best of 3: 2.98 ms per loop

In [3]: %timeit replaced = map(lambda x: str.replace(x, '1', '<1>'), words)
100 loops, best of 3: 5.09 ms per loop

In [4]: %timeit replaced = map(lambda x: x.replace('1', '<1>'), words)
100 loops, best of 3: 4.39 ms per loop

In [5]: import re

In [6]: r = re.compile('1')

In [7]: %timeit replaced = [r.sub('<1>', w) for w in words]
100 loops, best of 3: 6.15 ms per loop

このような単純なパターンを見るとわかるように、受け入れられたリスト内包表記が最も高速ですが、次の点に注意してください。

In [8]: %timeit replaced = [w.replace('1', '<1>').replace('324', '<324>').replace('567', '<567>') for w in words]
100 loops, best of 3: 8.25 ms per loop

In [9]: r = re.compile('(1|324|567)')

In [10]: %timeit replaced = [r.sub('<\1>', w) for w in words]
100 loops, best of 3: 7.87 ms per loop

これは、より複雑な置換の場合、事前コンパイルされた正規表現(など9-10)が(はるかに)高速になることを示しています。それは本当にあなたの問題と正規表現の最短部分に依存します。


3

forループの例(リスト内包表記を好む)

a, b = '[br]', '<br />'
for i, v in enumerate(words):
    if a in v:
        words[i] = v.replace(a, b)
print(words)
# ['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.