回答:
sepパラメータなしでstr.splitの動作を利用する:
>>> s = " \t foo \n bar "
>>> "".join(s.split())
'foobar'
すべての空白ではなくスペースを削除したい場合:
>>> s.replace(" ", "")
'\tfoo\nbar'
効率は主要な目標ではありませんが、明確なコードを書くことが重要ですが、最初のタイミングは次のとおりです。
$ python -m timeit '"".join(" \t foo \n bar ".split())'
1000000 loops, best of 3: 1.38 usec per loop
$ python -m timeit -s 'import re' 're.sub(r"\s+", "", " \t foo \n bar ")'
100000 loops, best of 3: 15.6 usec per loop
正規表現はキャッシュされるため、想像するほど遅くはありません。事前にコンパイルしておくと役立ちますが、実際にこれを何度も呼び出す場合にのみ問題になります。
$ python -m timeit -s 'import re; e = re.compile(r"\s+")' 'e.sub("", " \t foo \n bar ")'
100000 loops, best of 3: 7.76 usec per loop
re.subは11.3倍遅くなりますが、ボトルネックは確実に他の場所にあることに注意してください。ほとんどのプログラムは、これらの3つの選択肢の違いを認識しません。
\s+
置換よりも遅いでしょう。私は再に固執します。
s.translate
たまたまこの方法を試しましたか?それはおそらく、このページに示されているすべての方法に勝るものです。
None
-驚くべきことに、それにより遅くなります...
myString.translate(None, " \t\r\n\v")
。Rogerの最速(分割して結合)技術である限り、83%しかかかりません。splitが行うすべての空白文字をカバーするかどうかは不明ですが、ほとんどのASCIIアプリケーションではおそらくそれで十分です。
または、
"strip my spaces".translate( None, string.whitespace )
そしてここにPython3バージョンがあります:
"strip my spaces".translate(str.maketrans('', '', string.whitespace))
NameError: name 'string' is not defined
。
import string
string1=" This is Test String to strip leading space"
print string1
print string1.lstrip()
string2="This is Test String to strip trailing space "
print string2
print string2.rstrip()
string3=" This is Test String to strip leading and trailing space "
print string3
print string3.strip()
string4=" This is Test String to test all the spaces "
print string4
print string4.replace(" ", "")
import re
re.sub(' ','','strip my spaces')
ロジャー・ペイトが述べたように、次のコードは私のために働きました:
s = " \t foo \n bar "
"".join(s.split())
'foobar'
Jupyter Notebookを使用して次のコードを実行しています:
i=0
ProductList=[]
while i < len(new_list):
temp='' # new_list[i]=temp=' Plain Utthapam '
#temp=new_list[i].strip() #if we want o/p as: 'Plain Utthapam'
temp="".join(new_list[i].split()) #o/p: 'PlainUtthapam'
temp=temp.upper() #o/p:'PLAINUTTHAPAM'
ProductList.append(temp)
i=i+2
split/join
またはリストほど効率的ではありませんが、リストをフィルタリングする標準的な手法が適用されますtranslate
メソッドます。
空白のセットが必要です:
>>> import string
>>> ws = set(string.whitespace)
filter
組み込み:
>>> "".join(filter(lambda c: c not in ws, "strip my spaces"))
'stripmyspaces'
リスト内包(はい、括弧を使用します:下記のベンチマークを参照してください):
>>> import string
>>> "".join([c for c in "strip my spaces" if c not in ws])
'stripmyspaces'
折り目:
>>> import functools
>>> "".join(functools.reduce(lambda acc, c: acc if c in ws else acc+c, "strip my spaces"))
'stripmyspaces'
基準:
>>> from timeit import timeit
>>> timeit('"".join("strip my spaces".split())')
0.17734256500003198
>>> timeit('"strip my spaces".translate(ws_dict)', 'import string; ws_dict = {ord(ws):None for ws in string.whitespace}')
0.457635745999994
>>> timeit('re.sub(r"\s+", "", "strip my spaces")', 'import re')
1.017787621000025
>>> SETUP = 'import string, operator, functools, itertools; ws = set(string.whitespace)'
>>> timeit('"".join([c for c in "strip my spaces" if c not in ws])', SETUP)
0.6484303600000203
>>> timeit('"".join(c for c in "strip my spaces" if c not in ws)', SETUP)
0.950212219999969
>>> timeit('"".join(filter(lambda c: c not in ws, "strip my spaces"))', SETUP)
1.3164566040000523
>>> timeit('"".join(functools.reduce(lambda acc, c: acc if c in ws else acc+c, "strip my spaces"))', SETUP)
1.6947649049999995
TL / DR
このソリューションはPython 3.6を使用してテストされました
Python3で文字列からすべてのスペースを取り除くには、次の関数を使用できます。
def remove_spaces(in_string: str):
return in_string.translate(str.maketrans({' ': ''})
空白文字( '\ t \ n \ r \ x0b \ x0c')を削除するには、次の関数を使用できます。
import string
def remove_whitespace(in_string: str):
return in_string.translate(str.maketrans(dict.fromkeys(string.whitespace)))
説明
Pythonのstr.translate
メソッドはstrの組み込みクラスメソッドであり、テーブルを受け取り、渡された変換テーブルを通じて各文字がマップされた文字列のコピーを返します。str.translateの完全なドキュメント
変換テーブルを作成するためにstr.maketrans
使用されます。このメソッドは、のもう1つの組み込みクラスメソッドですstr
。ここでは、1つのパラメーター(この場合はディクショナリー)だけで使用します。キーは、置換される文字であり、文字置換値で値にマップされます。で使用する変換テーブルを返しますstr.translate
。str.maketransの完全なドキュメント
string
Python のモジュールには、いくつかの一般的な文字列操作と定数が含まれています。string.whitespace
空白と見なされるすべてのASCII文字を含む文字列を返す定数です。これには、スペース、タブ、ラインフィード、リターン、フォームフィード、および垂直タブの文字が含まれます。文字列の完全なドキュメント
2番目の関数でdict.fromkeys
は、キーがstring.whitespace
それぞれvalueとともに返される文字列内の文字である辞書を作成するために使用されますNone
。dict.fromkeysの完全なドキュメント
最適なパフォーマンスが要件ではなく、単純なものが必要な場合は、文字列クラスの組み込みの「isspace」メソッドを使用して各文字をテストする基本関数を定義できます。
def remove_space(input_string):
no_white_space = ''
for c in input_string:
if not c.isspace():
no_white_space += c
return no_white_space
構築no_white_space
文字列は、このよう理想的な性能を持っていますが、解決策は、理解しやすいことはありません。
>>> remove_space('strip my spaces')
'stripmyspaces'
関数を定義したくない場合は、これをリスト内包で漠然と類似したものに変換できます。トップアンサーのjoin
ソリューションから借用する:
>>> "".join([c for c in "strip my spaces" if not c.isspace()])
'stripmyspaces'