プログラミング regex

25

「abc」と「efg」がこの順序で含まれているファイルを検索したいのですが、その2つの文字列はそのファイルの異なる行にあります。例：コンテンツを含むファイル： blah blah.. blah blah.. blah abc blah blah blah.. blah blah.. blah blah.. blah efg blah blah blah blah.. blah blah.. 一致する必要があります。

208 regex grep

18

正規表現を使用してHTMLを解析する：なぜそうしないのですか？

質問者が正規表現を使用してHTMLから一部の情報を取得する、stackoverflowのすべての質問には、必然的に正規表現を使用してHTMLを解析しないことを示す「回答」が含まれます。何故なの？Beautiful Soupのように、引用符で囲まれていない「実際の」HTMLパーサーが存在することは承知しており、パワフルで便利だと確信していますが、単純、迅速、またはダーティなことをしているのであれば、その理由はいくつかの正規表現が問題なく機能するときに、複雑なものを使用するのは面倒ですか？さらに、私が正規表現について理解していない根本的なものがあって、それらを一般的に解析するのに悪い選択にしていますか？

207 regex html-parsing

21

冒とく的なフィルターをどのように実装しますか？

私たちの多くは、ユーザー入力、検索クエリ、および入力テキストに冒とく的な表現や望ましくない言語が含まれている可能性がある状況に対処する必要があります。多くの場合、これは除外する必要があります。さまざまな言語や方言で書かれた不適切な言葉のリストはどこにありますか？適切なリストを含むソースで利用できるAPIはありますか？あるいは、いくつかのパラメータを使用して、「はい、これはクリーンです」または「いいえ、これはダーティ」と単純に言うAPIでしょうか。 a $$、azz、a55など、システムをだまそうとしている人々を捕まえるためのいくつかの良い方法は何ですか？ PHPのソリューションを提供する場合のボーナスポイント。:) 編集：プログラムの問題を単に回避するという回答への応答：たとえば、ユーザーがパブリックイメージ検索を使用して、機密性の高いコミュニティプールに追加される写真を見つけることができる場合、この種のフィルターの場所があると思います。彼らが「ペニス」を検索できれば、彼らはうん、多くの写真を撮るでしょう。その写真が必要ない場合は、間違いなく確実な方法ではありませんが、その単語を検索語として使用しないことは優れたゲートキーパーです。そもそも単語のリストを取得するのは本当の問題です。だから私は本当に、単一のトークンがダーティかどうかを把握し、単にそれを許可しない方法を参照しています。完全に陽気な「長い首のキリン」参照のような感情を邪魔しないでください。そこでは何もできません。:)

207 php regex user-input

9

Javascript Regex：変数を正規表現の中に入れる方法は？

だから例えば： function(input){ var testVar = input; string = ... string.replace(/ReGeX + testVar + ReGeX/, "replacement") } しかし、これはもちろん機能していません:)これを行う方法はありますか？

206 javascript regex variables

5

文字列がBashスクリプトの正規表現と一致するかどうかを確認する

スクリプトが受け取る引数の1つは、次の形式の日付ですyyyymmdd。入力として有効な日付を取得したかどうかを確認したいと思います。これどうやってするの？私は次のような正規表現を使用しようとしています：[0-9]\{\8}

204 regex bash shell scripting

6

VSCode正規表現はサブマッチ数学を見つけて置き換えますか？

%s@{fileID: $213[0-9]*$@\='{fileID: '.(submatch(1)-1900)@ この正規表現の検索と置換コマンドをvimで使用して、一致する各IDから定数を減算しています。 VSCodeで正規表現検索を行うことはできますが、submatch数学の参照を参照して置換する方法 submatch(1)VSCodeで動作しませんか？ありがとう。

204 regex visual-studio-code

20

究極の郵便番号とzip正規表現とは何ですか？

究極の郵便番号と郵便番号の正規表現を探しています。世界の大部分（できればすべて）をカバーできるものを探しています。

201 regex zipcode postal-code

13

複数の区切り文字を含むString.split（）を使用する

区切り文字-とに基づいて文字列を分割する必要があり.ます。以下は私の望ましい出力です。 AA.BB-CC-DD.zip -> AA BB CC DD zip しかし、私の次のコードは機能しません。 private void getId(String pdfName){ String[]tokens = pdfName.split("-\\."); }

201 java regex

7

文字列がhttp：//またはhttps：//で始まるかどうかをテストする正規表現

私は、文字列の先頭をチェックする正規表現を設定しようとしている、そしてそれはどちらか含まれている場合、http://またはhttps://それと一致する必要があります。どうやってやるの？うまくいかない次のことを試しています： ^[(http)(https)]://

200 regex

13

英数字以外のすべての文字を空の文字列に置き換える

私はこれを使ってみましたがうまくいきませんでした return value.replaceAll("/[^A-Za-z0-9 ]/", "");

197 java regex non-alphanumeric

1

シーケンスで始まらない文字列の正規表現

このプログラムを使用して一連のテーブルを処理していますが、「tbd_」というラベルで始まるテーブルは無視する必要があります。これまでのところ[^ tbd_]のようなものがありますが、それはそれらの文字とは一致しません。

196 regex

4

Ruby正規表現の\ A \ zと^ $の違い

私が読んだドキュメントでは： \ Aと\ zを使用して文字列の開始と終了を一致させ、^と$を行の開始/終了と一致させます。正規表現を適用して、ユーザーが送信したユーザー名（または電子メールは同じ）を確認します。validates_format_ofモデルでどの式を使用する必要がありますか？違いがわかりません。^と$をいつも使ってきました...

196 ruby regex

7

split（“ |”）を使用してパイプ記号でJava文字列を分割する

Javaの公式ドキュメントには次のように記載されています。 "boo:and:foo"たとえば、文字列は、これらの式Regex Resultで次の結果を生成します。 { "boo", "and", "foo" }" そして、それは私がそれを動作させるために必要な方法です。ただし、これを実行すると： public static void main(String[] args){ String test = "A|B|C||D"; String[] result = test.split("|"); for(String s : result){ System.out.println(">"+s+"<"); } } それは印刷します： >< >A< >|< >B< >|< >C< >|< >|< >D< これは私が期待するものとはかけ離れています： >A< >B< >C< >< >D< なぜこうなった？

195 java regex string

30

大文字の前にスペースを追加する

「ThisStringHasNoSpacesButItDoesHaveCapitals」という文字列が与えられた場合、大文字の前にスペースを追加する最良の方法は何ですか。したがって、最後の文字列は「この文字列にはスペースがありませんが、大文字は含まれています」になります。これがRegExでの私の試みです System.Text.RegularExpressions.Regex.Replace(value, "[A-Z]", " $0")

193 c# regex string

7

JavaScriptでの文字列照合のSwitchステートメント

次の条件付きのswtichを作成するにはどうすればよいですか？ URL が含まれている場合「foo」 settings.base_urlは「bar」です。以下は必要な効果を達成していますが、これはスイッチでより管理しやすいと感じています。 var doc_location = document.location.href; var url_strip = new RegExp("http:\/\/.*\/"); var base_url = url_strip.exec(doc_location) var base_url_string = base_url[0]; //BASE URL CASES // LOCAL if (base_url_string.indexOf('xxx.local') > -1) { settings = { "base_url" : "http://xxx.local/" }; } // DEV if (base_url_string.indexOf('xxx.dev.yyy.com') > -1) { settings = { …

193 javascript regex switch-statement

タグ付けされた質問 「regex」

タグ付けされた質問「regex」