回答:
replace正規表現を使用できます。
s/[;,\t\r ]|[\n]{2}/\n/g
s/
最初は検索を意味します[
と]
(任意の順序で)検索する文字です/
は、検索対象テキストと置換テキストを区切ります英語では、これは次のようになります。
" ;
または,
or \t
または\r
or (スペース)または正確に2つのシーケンシャル
\n
を検索し、それを\n
"で置き換えます
C#では、次の操作を実行できます:(インポート後System.Text.RegularExpressions
)
Regex pattern = new Regex("[;,\t\r ]|[\n]{2}");
pattern.Replace(myString, "\n");
\s
実際には同等な[ \f\n\r\t\v]
ので、元の質問にはなかったものが含まれています。加えて、元の質問はReplace("\n\n", "\n")
あなたの正規表現が処理しないものを求めます。
特に賢く感じていて、Regexを使いたくない場合:
char[] separators = new char[]{' ',';',',','\r','\t','\n'};
string s = "this;is,\ra\t\n\n\ntest";
string[] temp = s.Split(separators, StringSplitOptions.RemoveEmptyEntries);
s = String.Join("\n", temp);
少しの労力でこれを拡張メソッドにラップすることもできます。
編集:または、2分間待つと、とにかくそれを書いてしまいます:)
public static class ExtensionMethods
{
public static string Replace(this string s, char[] separators, string newVal)
{
string[] temp;
temp = s.Split(separators, StringSplitOptions.RemoveEmptyEntries);
return String.Join( newVal, temp );
}
}
そして出来上がり...
char[] separators = new char[]{' ',';',',','\r','\t','\n'};
string s = "this;is,\ra\t\n\n\ntest";
s = s.Replace(separators, "\n");
Regex.Replace
複数のstring.Replace
呼び出しを行うよりも8倍以上遅いです。Split
+ より4倍遅いJoin
。gist.github.com/MarcinJuraszek/c1437d925548561ba210a1c6ed144452を
LinqのAggregate関数を使用できます。
string s = "the\nquick\tbrown\rdog,jumped;over the lazy fox.";
char[] chars = new char[] { ' ', ';', ',', '\r', '\t', '\n' };
string snew = chars.Aggregate(s, (c1, c2) => c1.Replace(c2, '\n'));
拡張メソッドは次のとおりです。
public static string ReplaceAll(this string seed, char[] chars, char replacementCharacter)
{
return chars.Aggregate(seed, (str, cItem) => str.Replace(cItem, replacementCharacter));
}
拡張メソッドの使用例:
string snew = s.ReplaceAll(chars, '\n');
これが最短の方法です。
myString = Regex.Replace(myString, @"[;,\t\r ]|[\n]{2}", "\n");
ああ、パフォーマンスホラー!答えは少し時代遅れですが、それでも...
public static class StringUtils
{
#region Private members
[ThreadStatic]
private static StringBuilder m_ReplaceSB;
private static StringBuilder GetReplaceSB(int capacity)
{
var result = m_ReplaceSB;
if (null == result)
{
result = new StringBuilder(capacity);
m_ReplaceSB = result;
}
else
{
result.Clear();
result.EnsureCapacity(capacity);
}
return result;
}
public static string ReplaceAny(this string s, char replaceWith, params char[] chars)
{
if (null == chars)
return s;
if (null == s)
return null;
StringBuilder sb = null;
for (int i = 0, count = s.Length; i < count; i++)
{
var temp = s[i];
var replace = false;
for (int j = 0, cc = chars.Length; j < cc; j++)
if (temp == chars[j])
{
if (null == sb)
{
sb = GetReplaceSB(count);
if (i > 0)
sb.Append(s, 0, i);
}
replace = true;
break;
}
if (replace)
sb.Append(replaceWith);
else
if (null != sb)
sb.Append(temp);
}
return null == sb ? s : sb.ToString();
}
}
あなたはそれを変更可能にする必要があります:
StringBuilder
unsafe
世界に行ってポインターで遊んでください(ただし危険です)そして、文字の配列を最小限の回数だけ反復してみます。HashSet
ループ内の文字シーケンスのトラバースを回避するため、ここに注意してください。さらに高速なルックアップが必要な場合は、(に基づいて)のHashSet
最適化されたルックアップに置き換えることができます。char
array[256]
StringBuilderの例
public static void MultiReplace(this StringBuilder builder,
char[] toReplace,
char replacement)
{
HashSet<char> set = new HashSet<char>(toReplace);
for (int i = 0; i < builder.Length; ++i)
{
var currentCharacter = builder[i];
if (set.Contains(currentCharacter))
{
builder[i] = replacement;
}
}
}
編集-最適化バージョン
public static void MultiReplace(this StringBuilder builder,
char[] toReplace,
char replacement)
{
var set = new bool[256];
foreach (var charToReplace in toReplace)
{
set[charToReplace] = true;
}
for (int i = 0; i < builder.Length; ++i)
{
var currentCharacter = builder[i];
if (set[currentCharacter])
{
builder[i] = replacement;
}
}
}
次に、次のように使用します。
var builder = new StringBuilder("my bad,url&slugs");
builder.MultiReplace(new []{' ', '&', ','}, '-');
var result = builder.ToString();
wchar_t
。ネットでは、すべての可能な文字のサブセットのみを交換する(そして、あなたはそれを...最適化するために、65536 boolsが必要です)
これらの文字列拡張メソッドを記述して、ソリューションのどこかに置くこともできます。
using System.Text;
public static class StringExtensions
{
public static string ReplaceAll(this string original, string toBeReplaced, string newValue)
{
if (string.IsNullOrEmpty(original) || string.IsNullOrEmpty(toBeReplaced)) return original;
if (newValue == null) newValue = string.Empty;
StringBuilder sb = new StringBuilder();
foreach (char ch in original)
{
if (toBeReplaced.IndexOf(ch) < 0) sb.Append(ch);
else sb.Append(newValue);
}
return sb.ToString();
}
public static string ReplaceAll(this string original, string[] toBeReplaced, string newValue)
{
if (string.IsNullOrEmpty(original) || toBeReplaced == null || toBeReplaced.Length <= 0) return original;
if (newValue == null) newValue = string.Empty;
foreach (string str in toBeReplaced)
if (!string.IsNullOrEmpty(str))
original = original.Replace(str, newValue);
return original;
}
}
次のように呼び出します。
"ABCDE".ReplaceAll("ACE", "xy");
xyBxyDxy
この:
"ABCDEF".ReplaceAll(new string[] { "AB", "DE", "EF" }, "xy");
xyCxyF
次のようなRegEx.Replaceを使用します。
string input = "This is text with far too much " +
"whitespace.";
string pattern = "[;,]";
string replacement = "\n";
Regex rgx = new Regex(pattern);
string result = rgx.Replace(input, replacement);
RegEx.Replaceに関するこのMSDNドキュメントの詳細情報を以下に示します。
パフォーマンスの向上これはおそらく最善の解決策ではないかもしれませんが、機能します。
var str = "filename:with&bad$separators.txt";
char[] charArray = new char[] { '#', '%', '&', '{', '}', '\\', '<', '>', '*', '?', '/', ' ', '$', '!', '\'', '"', ':', '@' };
foreach (var singleChar in charArray)
{
str = str.Replace(singleChar, '_');
}
\t
および\r
に含まれてい\s
ます。したがって、正規表現はと同等[;,\s]
です。