タグ付けされた質問 「regex」

正規表現は、文字列内のパターンに一致する宣言型言語を提供します。これらは、文字列の検証、解析、および変換に一般的に使用されます。正規表現は完全に標準化されていないため、このタグの付いたすべての質問には、適切なプログラミング言語またはツールを指定するタグも含める必要があります。注:HTML、JSONなどを要求すると、正規表現は否定的な反応を示す傾向があります。パーサーがある場合は、代わりにそれを使用してください。

25
grepを使用して複数行にわたるパターンを見つける方法は?
「abc」と「efg」がこの順序で含まれているファイルを検索したいのですが、その2つの文字列はそのファイルの異なる行にあります。例:コンテンツを含むファイル: blah blah.. blah blah.. blah abc blah blah blah.. blah blah.. blah blah.. blah efg blah blah blah blah.. blah blah.. 一致する必要があります。
208 regex  grep 

18
正規表現を使用してHTMLを解析する:なぜそうしないのですか?
質問者が正規表現を使用してHTMLから一部の情報を取得する、stackoverflowのすべての質問には、必然的に正規表現を使用してHTMLを解析しないことを示す「回答」が含まれます。 何故なの?Beautiful Soupのように、引用符で囲まれていない「実際の」HTMLパーサーが存在することは承知しており、パワフルで便利だと確信していますが、単純、迅速、またはダーティなことをしているのであれば、その理由はいくつかの正規表現が問題なく機能するときに、複雑なものを使用するのは面倒ですか? さらに、私が正規表現について理解していない根本的なものがあって、それらを一般的に解析するのに悪い選択にしていますか?

21
冒とく的なフィルターをどのように実装しますか?
私たちの多くは、ユーザー入力、検索クエリ、および入力テキストに冒とく的な表現や望ましくない言語が含まれている可能性がある状況に対処する必要があります。多くの場合、これは除外する必要があります。 さまざまな言語や方言で書かれた不適切な言葉のリストはどこにありますか? 適切なリストを含むソースで利用できるAPIはありますか?あるいは、いくつかのパラメータを使用して、「はい、これはクリーンです」または「いいえ、これはダーティ」と単純に言うAPIでしょうか。 a $$、azz、a55など、システムをだまそうとしている人々を捕まえるためのいくつかの良い方法は何ですか? PHPのソリューションを提供する場合のボーナスポイント。:) 編集:プログラムの問題を単に回避するという回答への応答: たとえば、ユーザーがパブリックイメージ検索を使用して、機密性の高いコミュニティプールに追加される写真を見つけることができる場合、この種のフィルターの場所があると思います。彼らが「ペニス」を検索できれば、彼らはうん、多くの写真を撮るでしょう。その写真が必要ない場合は、間違いなく確実な方法ではありませんが、その単語を検索語として使用しないことは優れたゲートキーパーです。そもそも単語のリストを取得するのは本当の問題です。 だから私は本当に、単一のトークンがダーティかどうかを把握し、単にそれを許可しない方法を参照しています。完全に陽気な「長い首のキリン」参照のような感情を邪魔しないでください。そこでは何もできません。:)
207 php  regex  user-input 





13
複数の区切り文字を含むString.split()を使用する
区切り文字-とに基づいて文字列を分割する必要があり.ます。以下は私の望ましい出力です。 AA.BB-CC-DD.zip -> AA BB CC DD zip しかし、私の次のコードは機能しません。 private void getId(String pdfName){ String[]tokens = pdfName.split("-\\."); }
201 java  regex 



1
シーケンスで始まらない文字列の正規表現
このプログラムを使用して一連のテーブルを処理していますが、「tbd_」というラベルで始まるテーブルは無視する必要があります。これまでのところ[^ tbd_]のようなものがありますが、それはそれらの文字とは一致しません。
196 regex 

4
Ruby正規表現の\ A \ zと^ $の違い
私が読んだドキュメントでは: \ Aと\ zを使用して文字列の開始と終了を一致させ、^と$を行の開始/終了と一致させます。 正規表現を適用して、ユーザーが送信したユーザー名(または電子メールは同じ)を確認します。validates_format_ofモデルでどの式を使用する必要がありますか?違いがわかりません。^と$をいつも使ってきました...
196 ruby  regex 

7
split(“ |”)を使用してパイプ記号でJava文字列を分割する
Javaの公式ドキュメントには次のように記載されています。 "boo:and:foo"たとえば、文字列は、これらの式Regex Resultで次の結果を生成します。 { "boo", "and", "foo" }" そして、それは私がそれを動作させるために必要な方法です。ただし、これを実行すると: public static void main(String[] args){ String test = "A|B|C||D"; String[] result = test.split("|"); for(String s : result){ System.out.println(">"+s+"<"); } } それは印刷します: >< >A< >|< >B< >|< >C< >|< >|< >D< これは私が期待するものとはかけ離れています: >A< >B< >C< >< >D< なぜこうなった?
195 java  regex  string 

30
大文字の前にスペースを追加する
「ThisStringHasNoSpacesButItDoesHaveCapitals」という文字列が与えられた場合、大文字の前にスペースを追加する最良の方法は何ですか。したがって、最後の文字列は「この文字列にはスペースがありませんが、大文字は含まれています」になります。 これがRegExでの私の試みです System.Text.RegularExpressions.Regex.Replace(value, "[A-Z]", " $0")
193 c#  regex  string 

7
JavaScriptでの文字列照合のSwitchステートメント
次の条件付きのswtichを作成するにはどうすればよいですか? URL が含まれている場合「foo」 settings.base_urlは「bar」です。 以下は必要な効果を達成していますが、これはスイッチでより管理しやすいと感じています。 var doc_location = document.location.href; var url_strip = new RegExp("http:\/\/.*\/"); var base_url = url_strip.exec(doc_location) var base_url_string = base_url[0]; //BASE URL CASES // LOCAL if (base_url_string.indexOf('xxx.local') > -1) { settings = { "base_url" : "http://xxx.local/" }; } // DEV if (base_url_string.indexOf('xxx.dev.yyy.com') > -1) { settings = { …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.