タグ付けされた質問 「regex」

正規表現は、文字列内のパターンに一致する宣言型言語を提供します。これらは、文字列の検証、解析、および変換に一般的に使用されます。正規表現は完全に標準化されていないため、このタグの付いたすべての質問には、適切なプログラミング言語またはツールを指定するタグも含める必要があります。注:HTML、JSONなどを要求すると、正規表現は否定的な反応を示す傾向があります。パーサーがある場合は、代わりにそれを使用してください。


4
Python正規表現-一致の位置と値を取得する方法
reモジュールを使用してすべての試合の開始位置と終了位置を取得するにはどうすればよいですか?たとえば、パターンr'[a-z]'と文字列が与えられ'a1b2c3d4'たら、各文字を見つける位置を取得します。理想的には、私も試合のテキストを取り戻したいです。
112 python  regex 

18
文字列から非UTF8文字を削除する
文字列からutf8以外の文字を削除すると問題が発生しますが、正しく表示されません。文字はこのような0x97 0x61 0x6C 0x6F(16進表記) それらを削除する最良の方法は何ですか?正規表現か何か?
112 php  regex 


30
有効なIPv6アドレスに一致する正規表現
この質問の答えはコミュニティの努力です。この投稿を改善するには、既存の回答を編集してください。現在、新しい回答や相互作用を受け入れていません。 有効なIPv6アドレスに一致する正規表現(圧縮された形式(::各バイトペアの先頭のゼロが省略されている、または省略されている))を含む正規表現を書くのに問題があります。 誰かが要件を満たす正規表現を提案できますか? 各バイトペアを拡張し、その結果をより単純な正規表現と照合することを検討しています。
111 regex  networking  ipv6 

12
正規表現の一致を抽出する
文字列から数値を抽出しようとしています。 そして[0-9]+、文字列に対して何かをして"aaa12xxx"、取得し"12"ます。 私はそれが次のようなものになると思いました: > grep("[0-9]+", "aaa12xxx", value=TRUE) [1] "aaa12xxx" そして、私は考えました... > sub("[0-9]+", "\\1", "aaa12xxx") [1] "aaaxxx" しかし、私はいくつかの形の応答をしました: > sub("[0-9]+", "ARGH!", "aaa12xxx") [1] "aaaARGH!xxx" 私が見逃している小さな詳細があります。
111 regex  r 

5
Java RegExは大文字と小文字を区別しませんか?
Javaでは、replaceAllを実行して、次のような正規表現パターンを探します。 replaceAll("\\?i\\b(\\w+)\\b(\\s+\\1)+\\b", "$1"); (重複する連続した大文字と小文字を区別しない単語を削除するために、たとえばテストテスト)、どこに置くかわかりません?i。私はそれが最初にあるはずであると読みました、しかし、それを取り出すならば、私は重複した連続した単語(例えばテストテスト)をキャッチしますが、大文字小文字を区別しない単語(例えばテストテスト)をキャッチしません。したがって、最初に?iを追加できると思いましたが、それで仕事が完了したようには見えません。何かご意見は?ありがとう!




8
http://がURLに存在しない場合に追加する方法は?
どのように私は追加することができhttp://、それはすでにプロトコル(例えば含まれていない場合は、URLにhttp://、https://またはをftp://)? 例: addhttp("google.com"); // http://google.com addhttp("www.google.com"); // http://www.google.com addhttp("google.com"); // http://google.com addhttp("ftp://google.com"); // ftp://google.com addhttp("https://google.com"); // https://google.com addhttp("http://google.com"); // http://google.com addhttp("rubbish"); // http://rubbish
110 php  regex 

3
Java 8の分割で、結果配列の先頭にある空の文字列が削除されることがあるのはなぜですか?
次のように空の文字列で分割するJava 8より前 String[] tokens = "abc".split(""); 分割メカニズムは、でマークされた場所で分割されます | |a|b|c| ""各文字の前後に空白スペースがあるためです。結果として、最初にこの配列が生成されます ["", "a", "b", "c", ""] その後、末尾の空の文字列を削除します(limit引数に負の値を明示的に指定しなかったため)。 ["", "a", "b", "c"] Java 8では、分割メカニズムが変更されたようです。今私たちが使うとき "abc".split("") ["a", "b", "c"]代わりに配列を取得するため["", "a", "b", "c"]、最初の空の文字列も削除されているように見えます。しかし、この理論は失敗します "abc".split("a") startに空の文字列の配列を返します["", "bc"]。 ここで何が起こっているのか、Java 8で分割のルールがどのように変更されたのかを誰かが説明できますか?
110 java  regex  split  java-8 


13
文字列から数値を抽出して整数の配列を取得するにはどうすればよいですか?
文字列変数(基本的には番号が指定されていない英語の文)があり、すべての数値を整数の配列に抽出したいと思います。正規表現を使用した簡単な解決策があるかどうか疑問に思っていましたか? 私はショーンのソリューションを使用して、少し変更しました: LinkedList<String> numbers = new LinkedList<String>(); Pattern p = Pattern.compile("\\d+"); Matcher m = p.matcher(line); while (m.find()) { numbers.add(m.group()); }
109 java  arrays  regex  string 

15
パスワード検証用のRegexp Java
Javaアプリケーションで構成パラメーターとして使用されるパスワード検証の正規表現を作成しています。 正規表現は次のとおりです。 ^.*(?=.{8,})(?=..*[0-9])(?=.*[a-z])(?=.*[A-Z])(?=.*[@#$%^&+=]).*$ パスワードポリシーは次のとおりです。 8文字以上 少なくとも1つの数字が含まれています 少なくとも1つの下位アルファ文字と1つの上位アルファ文字が含まれています 特殊文字のセット(@#%$^など)内に少なくとも1つの文字が含まれています スペース、タブなどを含まない ポイント5だけがありません。スペース、タブ、キャリッジリターンなどの正規表現チェックを行うことができません。 誰か助けてもらえますか?
109 java  regex 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.