Unicodeにはおそらく50個のスペースがあります
\ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000] [\ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000
および6つの改行
CRLF、LF、CRだけでなく、NEL(U + 0085)、PS(U + 2029)、LS(U + 2028)もあります。
スペースとPS(「段落区切り記号」)のほとんどを理解できたかもしれませんが、「次の行」と「行区切り記号」は何に役立つのでしょうか?
それはすべて非常に大きな委員会によって発明されたように見えます。そこでは誰もが自分のスペースを望み、リーダーはそれぞれ1行の改行を許可されました。しかし、真剣に、プログラミング言語がサポートしていない(またはJavaのように間違っている)場合、どのように対処しますか?
Pattern.compile2010
昨年の定義に従って動作する正規表現を返すメソッドを自由に作成できます。またPattern.compileLatestUTS
、新しい仕様に従って意味が変わることを明示的に述べるメソッドを自由に作成できます。