回答:
を使用し[^A-Za-z0-9]
ます。
注:スペースは通常英数字とは見なされないため、削除しました。
試す
return value.replaceAll("[^A-Za-z0-9]", "");
または
return value.replaceAll("[\\W]|_", "");
return value.replaceAll("\\W", "");
[^a-zA-Z]
は、それ自体が文字範囲AZ / azにない文字を置き換えることに注意してください。つまりé
、ß
などの特殊文字やキリル文字などは削除されます。
これらの文字を置き換えたくない場合は、代わりに事前定義された文字クラスを使用してください。
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS:\p{Alnum}
この効果は得られず、と同じように機能し[A-Za-z0-9]
ます。
[^\\p{IsAlphabetic}\\p{IsDigit}]
うまくいきます。
{IsDigit}
は私にとっては機能せず{Digit}
、Androidでこれを試しているためです。AndroidはUNICODE_CHARACTER_CLASS
デフォルトでオンになっています。クリアランスをありがとう。
次のより簡単な正規表現を試すこともできます。
str = str.replaceAll("\\P{Alnum}", "");
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}
。
私はファイル名を作成するためにこの方法を作りました:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
キャレット^
が角括弧内の最初の文字として現れると、パターンを否定します。このパターンは、a、b、c以外のすべての文字に一致します。
キーワードを2つの関数として見る:
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
さらに、パターンに関して:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
したがって、パターンに含まれていないすべての文字を置き換えます
たとえばドイツ語のウムラウトのように、ASCII文字セットに属さない英数字も許可する場合は、次の解決策の使用を検討できます。
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
UNICODE_CHARACTER_CLASSフラグを使用すると、パフォーマンスが低下する可能性があることに注意してください(このフラグのjavadocを参照してください)。
簡単な方法:
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
出力:ChlamydiasppIgGIgMIgAAbs8006
Github:https : //github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
GuavaのCharMatcherは簡潔なソリューションを提供します:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);