3
Java正規表現の\ wおよび\ bに相当するUnicodeですか?
多くの最近の正規表現の実装では、\w文字クラスの省略形を「任意の文字、数字、または接続句読点」(通常はアンダースコア)として解釈します。そのように、のような正規表現\w+の言葉が好きな試合hello、élève、GOÄ_432またはgefräßig。 残念ながら、Javaにはありません。Javaでは、\wに制限されてい[A-Za-z0-9_]ます。これにより、上記のような単語のマッチングが困難になります。 また、 \b単語セパレーターが一致してはならない場所で一致しているように見えます。 .NETのような、Unicode対応の、\wまたは\bJava の正しい同等物は何ですか?Unicode対応にするために「書き換え」が必要な他のショートカットはどれですか。