回答:
str.count(sub [、start [、end]])
sub
範囲内で重複しない部分文字列の数を返します[start, end]
。オプションの引数でstart
ありend
、スライス表記と同様に解釈されます。
>>> sentence = 'Mary had a little lamb'
>>> sentence.count('a')
4
他の答えが言うように、文字列メソッドcount()を使用するのがおそらく最も簡単ですが、これを頻繁に行う場合は、collections.Counterをチェックしてください。
from collections import Counter
my_str = "Mary had a little lamb"
counter = Counter(my_str)
print counter['a']
正規表現かな?
import re
my_string = "Mary had a little lamb"
len(re.findall("a", my_string))
len(re.findall('1',bin(10)))
myString.count('a');
詳細はこちら
Python-3.x:
"aabc".count("a")
str.count(sub [、start [、end]])
[start、end]の範囲で部分文字列subの重複しない出現回数を返します。オプションの引数startおよびendは、スライス表記と同様に解釈されます。
str.count(a)
文字列内の単一の文字を数えるための最良のソリューションです。しかし、より多くの文字をカウントする必要がある場合は、カウントしたい文字数だけ文字列全体を読み取る必要があります。
この仕事のためのより良いアプローチは:
from collections import defaultdict
text = 'Mary had a little lamb'
chars = defaultdict(int)
for char in text:
chars[char] += 1
したがって、文字列内のすべての文字の出現回数を返し、0
存在しない場合は、dictを使用します。
>>>chars['a']
4
>>>chars['x']
0
大文字と小文字を区別しないカウンターの場合は、サブクラス化によってミューテーターメソッドとアクセサーメソッドをオーバーライドできますdefaultdict
(基本クラスのメソッドは読み取り専用です)。
class CICounter(defaultdict):
def __getitem__(self, k):
return super().__getitem__(k.lower())
def __setitem__(self, k, v):
super().__setitem__(k.lower(), v)
chars = CICounter(int)
for char in text:
chars[char] += 1
>>>chars['a']
4
>>>chars['M']
2
>>>chars['x']
0
Counter
これはすでにのクラスですcollections
。
この簡単でわかりやすい機能は、次のことに役立ちます。
def check_freq(x):
freq = {}
for c in x:
freq[c] = str.count(c)
return freq
check_freq("abbabcbdbabdbdbabababcbcbab")
{'a': 7, 'b': 14, 'c': 3, 'd': 3}
str
。変数にその名前を付けるとstr
、組み込み型ではなくなります。また、14 bを14回カウントしています。で変更for c in text
するだけで回避できfor c in set(text)
ます。
正規表現は、大文字と小文字を区別しない場合(そしてもちろん正規表現のすべての機能)が必要な場合に非常に役立ちます。
my_string = "Mary had a little lamb"
# simplest solution, using count, is case-sensitive
my_string.count("m") # yields 1
import re
# case-sensitive with regex
len(re.findall("m", my_string))
# three ways to get case insensitivity - all yield 2
len(re.findall("(?i)m", my_string))
len(re.findall("m|M", my_string))
len(re.findall(re.compile("m",re.IGNORECASE), my_string))
正規表現バージョンの実行には約10倍の時間がかかることに注意してください。これは、my_stringが非常に長い場合、またはコードがディープループ内にある場合にのみ問題になる可能性があります。
代替使用せずに、すべての文字カウントを取得する方法Counter()
、count
および正規表現
counts_dict = {}
for c in list(sentence):
if c not in counts_dict:
counts_dict[c] = 0
counts_dict[c] += 1
for key, value in counts_dict.items():
print(key, value)
count
確かに文字列内の文字の出現を数える最も簡潔で効率的な方法ですがlambda
、次のようなものを使用して解決策を考え出そうとしました:
sentence = 'Mary had a little lamb'
sum(map(lambda x : 1 if 'a' in x else 0, sentence))
これは次のようになります:
4
また、これには、文が上記と同じ文字を含む部分文字列のリストである場合、もう1つの利点がありますin
。これにより、を使用しているため、正しい結果が得られます。見てください:
sentence = ['M', 'ar', 'y', 'had', 'a', 'little', 'l', 'am', 'b']
sum(map(lambda x : 1 if 'a' in x else 0, sentence))
これも結果として:
4
もちろん、これは'a'
、この特定のケースのように単一の文字の出現をチェックする場合にのみ機能します。
「カウントを使用せずに文字列内の文字を検索する」メソッド。
import re
def count(s, ch):
pass
def main():
s = raw_input ("Enter strings what you like, for example, 'welcome': ")
ch = raw_input ("Enter you want count characters, but best result to find one character: " )
print ( len (re.findall ( ch, s ) ) )
main()
私はパンダライブラリ、特にvalue_counts()
メソッドのファンです。これを使用して、文字列内の各文字の出現をカウントできます。
>>> import pandas as pd
>>> phrase = "I love the pandas library and its `value_counts()` method"
>>> pd.Series(list(phrase)).value_counts()
8
a 5
e 4
t 4
o 3
n 3
s 3
d 3
l 3
u 2
i 2
r 2
v 2
` 2
h 2
p 1
b 1
I 1
m 1
( 1
y 1
_ 1
) 1
c 1
dtype: int64