閱讀1023 返回首頁    go 技術社區[雲棲]


C#正則表達式——中文/英文空格(全角/半角空格)處理

 

1. 匹配中文(全角)空格

Regex.IsMatch(" ", "\u3000");\u3000是全角空格的16進製Unicode編碼。

 

2. 匹配英文(半角)空格

Regex.IsMatch(" ", "\u0020")\u0020是半角空格的16進製Unicode編碼。

 

3. 去除中文字符之間的英文(半角)空格

string text = "<p> 測 試 test1. 一下</p>";

var result = Regex.Replace(text, "(?<=[\u4e00-\u9fa5])(\u0020)(?=[\u4e00-\u9fa5])", string.Empty);Console.WriteLine(result);

//結果是:<p> 測試 test1. 一下</p>

(?=[\u4e00-\u9fa5]) 表示“正向預搜索”一個中文字符,判斷\u0020的右側是否為中文字符。

(?<=[\u4e00-\u9fa5]) 表示“反向預搜索”一個中文字符,判斷\u0020的左側是否為中文字符。

 

4. 在中文字符與英文字符之間增加空格

string text = "<p> test測試test1. 一hello下</p>";           

text = Regex.Replace(text, @"(?<=[\u4e00-\u9fa5])([a-zA-Z])(?=[a-zA-Z])", " $1");text = Regex.Replace(text, @"(?<=[a-zA-Z])([a-zA-Z])(?=[\u4e00-\u9fa5])", "$1 ");

Console.WriteLine(text);

//輸出結果:<p> test 測試 test1. 一 hello 下</p>

 

第一個正則表達式是針對“左中文,右英文”的情況。

第二個正則表達式是針對“左英文,右中文”的情況。

 

原帖地址:https://www.cnblogs.com/dudu/archive/2011/09/17/2179423.html

最後更新:2017-04-02 22:16:02

  上一篇:go Struts遍曆標簽&lt;s:iterator&gt;總結
  下一篇:go Struts遍曆標簽s:iterator總結