タグ付けされた質問 「regex」

正規表現は、文字列内のパターンに一致する宣言型言語を提供します。これらは、文字列の検証、解析、および変換に一般的に使用されます。正規表現は完全に標準化されていないため、このタグの付いたすべての質問には、適切なプログラミング言語またはツールを指定するタグも含める必要があります。注:HTML、JSONなどを要求すると、正規表現は否定的な反応を示す傾向があります。パーサーがある場合は、代わりにそれを使用してください。

13
正規表現を使用してJavaで値を抽出する
大まかな形でいくつかの文字列があります: [some text] [some number] [some more text] Java正規表現クラスを使用して、[いくつか]のテキストを抽出したいと思います。 使用したい正規表現を大まかに知っています(ただし、すべての提案を歓迎します)。私が本当に興味を持っているのは、正規表現文字列を取得し、それをソースデータで使用して[some number]の値を生成するJava呼び出しです。 編集:私は単一の[いくつかの番号](基本的には最初のインスタンス)にのみ興味があることを追加する必要があります。ソース文字列は短く、[数]の複数の出現を探すつもりはありません。
169 java  regex 

5
RegexOptions.Compiledはどのように機能しますか?
正規表現をコンパイル対象としてマークすると、裏で何が起こっていますか?これはどのように比較されますか/キャッシュされた正規表現とは異なりますか? この情報を使用して、パフォーマンスの向上と比較して計算のコストが無視できる場合をどのように判断しますか?
169 .net  regex 

9
(grep)非ASCII文字に一致する正規表現?
Linuxでは、多くのファイルを含むディレクトリがあります。一部には非ASCII文字がありますが、すべて有効なUTF-8です。1つのプログラムにバグがあり、ASCII以外のファイル名で機能しないため、影響を受けるファイルの数を調べる必要があります。私はこれを使ってこれを行いfind、次にgrepを実行して非ASCII文字を出力し、次にa wc -lを実行して数字を見つけていました。grepである必要はありません。私は、任意の標準的なUnix使用できる正規表現のように、Perlの、sedは、AWKなどを、 しかし、「ASCII文字以外の文字」の正規表現はありますか?
169 regex  unicode  grep  ascii 

7
正規表現でパンダの行をフィルタリングする方法
列の1つで正規表現を使用してデータフレームをきれいにフィルタリングしたいと思います。 不自然な例: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat 行をフィルタリングしfて、正規表現を使用して始まる行に絞り込みます。最初に行く: In [213]: foo.b.str.match('f.*') Out[213]: 0 [] 1 () 2 () 3 [] それはそれほど有用ではありません。しかし、これは私のブールインデックスを取得します: In [226]: foo.b.str.match('(f.*)').str.len() …
169 python  regex  pandas 

20
JavaScriptで文字列からベースURLを抽出する方法は?
JavaScript(またはjQuery)を使用して文字列変数からベースURLを抽出する比較的簡単で信頼できる方法を見つけようとしています。 たとえば、次のようなものが与えられたとします。 http://www.sitename.com/article/2009/09/14/this-is-an-article/ 入手したい: http://www.sitename.com/ 正規表現が最善の策ですか?その場合、特定の文字列から抽出されたベースURLを新しい変数に割り当てるためにどのステートメントを使用できますか? 私はこれについていくつか検索を行いましたが、JavaScriptの世界で見つけたものはすべて、location.hostなどを使用して実際のドキュメントのURLからこの情報を収集することに関係しているようです。
168 javascript  regex  string  url 

1
正規表現の学習[終了]
現在のところ、この質問は、Q&A形式には適していません。事実、参考文献、専門知識によって回答が裏付けられることを期待していますが、この質問は、討論、議論、投票、または拡張ディスカッションを求める可能性があります。この質問が改善され、場合によっては再開できると思われる場合は、ヘルプセンターにアクセスしてください。 8年前に閉鎖。 この質問の答えはコミュニティの努力です。この投稿を改善するには、既存の回答を編集してください。現在、新しい回答や相互作用を受け入れていません。 正規表現がよくわかりません。わかりやすく説明してもらえますか?オンラインツールや本がある場合は、それらにもリンクしていただけませんか。
166 regex 

6
Bashで文字列を正規表現と一致させるにはどうすればよいですか?
私は与えられたときに機能が含まれているbashスクリプト記述しようとしています.tar、.tar.bz2、.tar.gzなどのファイルには、ファイルを解凍するために、関連するスイッチとタールを使用します。 私はif elif thenステートメントを使用して、ファイル名をテストしてそれが何で終わるかを確認し、正規表現のメタ文字を使用して一致させることができません。 コマンドラインで 'test'を使用しているスクリプトを常に書き換えるのを保存するために、以下のステートメントが機能するはずだと思いました。角括弧、引用符、メタ文字のすべての組み合わせを試しても、失敗します。 test sed-4.2.2.tar.bz2 = tar\.bz2$; echo $? (this returns 1, false) 問題は単純なものであり、どこを見ても確認できましたが、どうすればよいかを理解することはできません。誰か私がこれを行う方法を知っていますか?
166 regex  string  bash 

18
HH:MM時間形式に一致するための正規表現
HH:MM形式で時刻を一致させるための正規表現が必要です。これが私が持っているもので、うまくいきます: ^[0-2][0-3]:[0-5][0-9]$ これは00:00から23:59までのすべてに一致します。 ただし、00:00、01:30だけでなく、0:00、1:00なども合わせて変更したいと思います。つまり、左端の数字をオプションにして、HH:MMだけでなくH:MMにも一致させます。 その変更を行う方法はありますか?私はこれがphpと同様にJavaScriptで動作するために必要です。
166 regex 

11
JavaScriptで2つの文字列間の文字列を取得する正規表現
非常によく似た投稿を見つけましたが、ここでは正規表現をまったく取得できません。 他の2つの文字列の間にある文字列を返す正規表現を記述しようとしています。たとえば、「cow」と「milk」の間にある文字列を取得したいとします。 私の牛はいつも牛乳を出しています 戻るだろう 「常に与える」 ここに私が今までつなぎ合わせた表現があります: (?=cow).*(?=milk) ただし、これは文字列「cow always present」を返します。
166 javascript  regex  string 

9
アクセント付き文字用の具体的なJavascript正規表現(発音区別符号)
私はスタックオーバーフロー(文字を置き換える..ええと、JavaScriptがどのようにRegExpに関するUnicode標準に準拠していないかなど)を調べましたが、質問に対する具体的な答えは見つかりませんでした。 How can JavaScript match for accented characters (those with diacritical marks)? UIのフィールドをlast_name, first_name (最後の[カンマスペース]が最初に)一致するように強制していて、発音区別符号のサポートを提供したいのですが、JavaScriptでは、明らかに他の言語/プラットフォームよりも少し難しいです。 これは、発音区別符のサポートを追加するまで、元のバージョンでした。 /^[a-zA-Z]+,\s[a-zA-Z]+$/ 現在、サポートを追加するための3つの方法の1つについて議論しています。それらはすべてテストして動作しました(少なくともある程度は、2番目のアプローチの「範囲」が何であるか本当にわかりません)。はい、どうぞ: 有効にしたいすべてのアクセント付き文字を明示的にリストします(不完全で複雑すぎる)。 var accentedCharacters = "àèìòùÀÈÌÒÙáéíóúýÁÉÍÓÚÝâêîôûÂÊÎÔÛãñõÃÑÕäëïöüÿÄËÏÖÜŸçÇßØøÅåÆæœ"; // Build the full regex var regex = "^[a-zA-Z" + accentedCharacters + "]+,\\s[a-zA-Z" + accentedCharacters + "]+$"; // Create a RegExp from the string version regexCompiled = …

14
有効なローマ数字のみを正規表現とどのように照合しますか?
私の他の問題を考えて、ローマ数字に一致する正規表現を作成することさえできないと決めました(それらを生成する文脈自由文法はもちろんのこと) 問題は、有効なローマ数字のみに一致することです。たとえば、990は「XM」ではなく、「CMXC」です。 このための正規表現を作成する上での私の問題は、特定の文字を許可または許可しないために、振り返る必要があるということです。たとえば、何千、何百と考えてみましょう。 M {0,2} C?Mを許可できます(900、1000、1900、2000、2900、3000を許可するため)。ただし、一致がCMの場合、次の文字をCまたはDにすることはできません(既に900にいるため)。 これを正規表現でどのように表現できますか? 単純に正規表現で表現できない場合、文脈自由文法で表現できますか?

3
文字列全体に一致
テキストが完全に一致する場合にのみ一致する正規表現(重要な場合はJavaScript)とは何ですか?つまり、文字列の他の端に余分な文字があってはなりません。 例えば、私は一致しようとしている場合はabc、その後、1abc1、1abc、とabc1は一致しません。
165 regex 

22
タイトルをjQueryでURLスラッグに変換する方法は?
私はCodeIgniterのアプリに取り組んでおり、フォームのフィールドにURLスラグを動的に生成させようとしています。句読点を削除して小文字に変換し、スペースをハイフンに置き換えます。したがって、たとえば、ShaneのRib Shackは、shanes-rib-shackになります。 これが私が今まで持っているものです。小文字の部分は簡単でしたが、置換がまったく機能していないようで、句読点を削除する考えがありません。 $("#Restaurant_Name").keyup(function(){ var Text = $(this).val(); Text = Text.toLowerCase(); Text = Text.replace('/\s/g','-'); $("#Restaurant_Slug").val(Text); });
163 javascript  jquery  regex 

8
JavaScriptで文字列に別の部分文字列が含まれていることを確認する最も速い方法は?
JavaScriptのパフォーマンスの問題に取り組んでいます。だから私は尋ねたいだけです:文字列が別の部分文字列を含むかどうかを確認する最も速い方法は何ですか(私はブール値だけが必要ですか?)あなたのアイデアとサンプルスニペットコードを提案していただけませんか?

1
何かが先行していない場合に何かを照合するための正規表現
したがって、Javaの正規表現を使用して、パターンの前に特定の文字がない場合にのみ一致する正規表現を作成します。例えば: String s = "foobar barbar beachbar crowbar bar "; barの前にfooがない場合に一致させたい。したがって、出力は次のようになります。 barbar beachbar crowbar bar これはおそらく非常に単純な質問です。私は正規表現を学ぼうとしていますが、その間に私は今仕事をするために何かが必要です。
163 java  regex 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.