文字列内の文字の場所を見つける

87

文字列内の文字の位置を見つけたいのですが。

いう： string = "the2quickbrownfoxeswere2tired"

関数が戻り4、24-の2sの文字位置を返したいのですがstring。

— リカルド
ソース

なぜ正規表現を使用するのですか？rには.indexOf()何かがありませんか？

— fge 2013年

1

疑わしい。開発者はNixersであり、誰もが正規表現を知っていると想定していました。Rの文字列処理はちょっと厄介です。

— IRTFM 2013年

115

使用できます gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE

またはおそらく（バージョン1.0以降）のラッパーであるstr_locate_allパッケージからstringr~~gregexpr~~ stringi::stri_locate_allstringr

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

単に使用できることに注意してください stringi

library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

ベースの別のオプションはR次のようなものになります

lapply(strsplit(x, ''), function(x) which(x == '2'))

動作するはずです（文字ベクトルが与えられた場合x）

— mnel
ソース

最初の3つのソリューションによって返されたリスト/オブジェクトから整数を抽出するにはどうすればよいですか？

— 3pitt 2018

整数を簡単に取得するregexprにはgregexpr、の代わりにを使用します。またはunlist、以下の別の回答に示されているように、出力で使用します。

— アラニ2018年

41

もう1つの簡単な方法があります。

> which(strsplit(string, "")[[1]]=="2")
[1]  4 24

— ジルバー・ウルビーナ
ソース

何をし[[1]]ているのか説明できますか？

— francoiskroll

@francoiskroll、[[1]]はリストの最初の要素を表します。

— Prafulla

20

unlistを使用して、出力を4と24だけにすることができます。

unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

2

str1でstr2のn番目のオカレンスの位置を検索します（Oracle SQL INSTRと同じ順序のパラメーター）。見つからない場合は0を返します。

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0

— Abdelmonem Mahmoud Amer
ソース

2

最初の場所のみを検索するには、次のコマンドを使用lapply()しmin()ます。

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

最後の場所のみを検索するには、次のコマンドを使用lapply()しmax()ます。

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15

— MS Berends
ソース

1

あなたも使うことができますgrep：

grep('2', strsplit(string, '')[[1]])
#4 24

— AlexB
ソース