タグ付けされた質問 「stringr」

2
ユニコード記号とそのユニコード表現を区別するためのdplyrフィルター条件
私はそれがフォームであるかどうかに基づいてシンボル列をフィルタリングしようとしています \uxxxx これは、視覚的に簡単であること、いくつかのように見える$、¢、£、そして他の人が好き\u058f、\u060b、\u07fe。 しかし、私はstringi/ を使用してそれを理解するようには思えませんdplyr library(dplyr) library(stringi) df <- structure(list(Character = c("\\u0024", "\\u00A2", "\\u00A3", "\\u00A4", "\\u00A5", "\\u058F", "\\u060B", "\\u07FE", "\\u07FF", "\\u09F2", "\\u09F3", "\\u09FB", "\\u0AF1", "\\u0BF9", "\\u0E3F", "\\u17DB", "\\u20A0", "\\u20A1", "\\u20A2", "\\u20A3"), Symbol = c("$", "¢", "£", "¤", "¥", "\u058f", "\u060b", "\u07fe", "\u07ff", "৲", "৳", "\u09fb", "\u0af1", "\u0bf9", "฿", "៛", "₠", …
10 r  dplyr  stringr  stringi 

5
最後の(または唯一の)文字がゼロでない限り、Rの先行ゼロを削除する正規表現
gsub("(?<![0-9])0+", "", c("005", "0AB", "000", "0"), perl = TRUE) #> [1] "5" "AB" "" "" gsub("(^|[^0-9])0+", "\\1", c("005", "0AB", "000", "0"), perl = TRUE) #> [1] "5" "AB" "" "" 上記の正規表現は、Rの文字列からすべての先行ゼロを削除する方法を説明するこのSOスレッドからのものです。この正規表現の結果として、「000」と「0」は両方とも「」に変換されます。代わりに、最後の文字が偶然ゼロである場合、または唯一の文字がゼロである場合を除いて、文字列からすべての先行ゼロを削除します。 "005" would become "5" "0AB" would become "AB" "000" would become "0" "0" would become "0" この別のSOスレッドは私がやりたいことを行う方法を説明していますが、Rのソリューションを適用して構文が完全に正しいとは思いません。また、以下の1番目と2番目のソリューションの違いを本当に理解していません(彼らが実際に働いた場合)。 gsub("s/^0*(\d+)$/$1/;", "", …
9 r  regex  string  gsub  stringr 

5
#で始まる単語を除いて数字を削除する正規表現
文字、数字、「#」記号を含むことができる文字列があります。 「#」で始まる単語以外の数字を削除したい 次に例を示します。 "table9 dolv5e #10n #dec10 #nov8e 23 hello" そして予想される出力は: "table dolve #10n #dec10 #nov8e hello" どうすればこれを正規表現、ストリンガー、またはgsubで実行できますか?
8 r  regex  gsub  stringr 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.