Pythonでキャラクターの位置を取得する方法は?


回答:


697

そここのため、2つの文字列の方法がある、find()index()。2つの違いは、検索文字列が見つからない場合にどうなるかです。 find()戻る-1index()上げるValueError

使用する find()

>>> myString = 'Position of a character'
>>> myString.find('s')
2
>>> myString.find('x')
-1

使用する index()

>>> myString = 'Position of a character'
>>> myString.index('s')
2
>>> myString.index('x')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: substring not found

Pythonマニュアルから

string.find(s, sub[, start[, end]])
最下位インデックス戻りサブストリングサブように発見されたサブ完全に含まれているがs[start:end]-1失敗時に戻ります。負の値の開始終了、および解釈のデフォルトは、スライスの場合と同じです。

そして:

string.index(s, sub[, start[, end]])
同様find()しかし昇給ValueError部分文字列が見つからなかった場合。


127

完全を期すために、文字列内の文字のすべての位置を見つける必要がある場合は、次の操作を実行できます。

s = 'shak#spea#e'
c = '#'
print [pos for pos, char in enumerate(s) if char == c]

戻ります [4, 9]


4
python3では、構文エラーが発生します-これをどのように変更する必要がありますか?
Sean、

19
@Sean:印刷ステートメントが削除されました。関数形式のみが残ります。刺激が、答えは単純に変更することの最終ラインであるに: print( [pos for pos, char in enumerate(s) if char == c])
ネイト

3
foo = ( [pos for pos, char in enumerate(s) if char == c])座標fooをリスト形式にします。私はこれが本当に役立つと思います
3nrique0

インデックスは0で、0123は1234であるので、実際の位置は
5、10

それは可能な限り速いですか?np.arraysを使用した場合、長いstrのパフォーマンスが向上する可能性がありますか?
セブ

49
>>> s="mystring"
>>> s.index("r")
4
>>> s.find("r")
4

「曲がりくねった」方法

>>> for i,c in enumerate(s):
...   if "r"==c: print i
...
4

部分文字列を取得するには、

>>> s="mystring"
>>> s[4:10]
'ring'

1
与えられた位置に従って文字列の部分文字列を取得する方法を教えてください...
user244470 '19 / 02/19

1
@arung:部分文字列を取得するには、スライシングを使用します。str[from:to]ここでfromtoインデックスは
Eli Bendersky、

s.find()は、サブストリングが見つからない場合は-1を返します
Evgenii

s.search()は、部分文字列が見つからない場合にValueErrorを発生させます。部分文字列が見つからない場合、s.find()は-1を返します。
Praxiteles 2017年

16

完了のために、ファイル名で拡張子を確認して確認したい場合は、最後の「。」を見つける必要があります。この場合はrfindを使用します。

path = 'toto.titi.tata..xls'
path.find('.')
4
path.rfind('.')
15

私の場合、完全なファイル名が何であっても機能する次のコードを使用します。

filename_without_extension = complete_name[:complete_name.rfind('.')]

これは文字列の範囲を見つけるのに役立ちます。たとえば、辞書の検索は次のようになりますleft = q.find("{"); right = q.rfind("}")
ximiki

15

文字列に重複文字が含まれているとどうなりますか?私との私の経験から、index()重複に対しては同じインデックスを取得することがわかりました。

例えば:

s = 'abccde'
for c in s:
    print('%s, %d' % (c, s.index(c)))

戻ります:

a, 0
b, 1
c, 2
c, 2
d, 4

その場合、あなたはそのようなことをすることができます:

for i, character in enumerate(my_string):
   # i is the position of the character in the string

enumerateそういうことにはいいです
o11c

10
string.find(character)  
string.index(character)  

おそらく、2つの違いが何であるかを見つけるために、ドキュメントを参照したいと思うでしょう。


そのリンクされたドキュメントから:サブストリングが見つからない場合、s.search()はValueErrorを発生させます。部分文字列が見つからない場合、s.find()は-1を返します。
Praxiteles 2017年

7

文字は文字列内に複数回現れることがあります。たとえば、文字列ではsentence、位置はeisです1, 4, 7(インデックス作成は通常ゼロから始まるため)。しかし、私が見つけたのは両方の関数でfind()ありindex()、文字の最初の位置を返します。だから、これはこれを行うことで解決できます:

def charposition(string, char):
    pos = [] #list to store positions for each 'char' in 'string'
    for n in range(len(string)):
        if string[n] == char:
            pos.append(n)
    return pos

s = "sentence"
print(charposition(s, 'e')) 

#Output: [1, 4, 7]

1

more_itertools.locate は、条件を満たすアイテムのすべてのインデックスを検索するサードパーティのツールです。

ここでは、文字のすべてのインデックスの場所を検索ます"i"

import more_itertools as mit


s = "supercalifragilisticexpialidocious"
list(mit.locate(s, lambda x: x == "i"))
# [8, 13, 15, 18, 23, 26, 30]

0

すべてのインデックスにすばやくアクセスするためのnumpyを使用したソリューション:

string_array = np.array(list(my_string))
char_indexes = np.where(string_array == 'C')

4
この方法は使用しないでください。numpyを単純な文字列のインデックス操作に組み込む理由はありません。
マイクホラー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.