正则表达式中对各字符集编码范围的总结

这些字符集尤其是日文字符集的各种字、标点以及特殊符号的时候有所帮助。

UTF8

[x01-x7f]|[xc0-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3}

UTF16

[x00-xd7][xe0-xff]|[xd8-xdf][x00-xff]{2}

JIS

[x20-x7e]|[x21-x5f]|[x21-x7e]{2}

SJIS

[x20-x7e]|[xa1-xdf]|([x81-x9f]|[xe0-xef])([x40-x7e]|[x80-xfc])

EUC_JP

[x20-x7e]|x81[xa1-xdf]|[xa1-xfe][xa1-xfe]|x8f[xa1-xfe]{2}

EUC_JP标点符号及特殊字符

[xa1-xa2][xa0-xfe]

EUC_JP全角数字

xa3[xb0-xb9]

EUC_JP全角大写英文

xa3[xc1-xda]

EUC_JP全角小写英文

xa3[xe1-xfa]

EUC_JP全角平假名

xa4[xa1-xf3]

EUC_JP全角片假名 [color=Red]2007-03-12 15:00更新[/color]

xa3[xb0-xb9]|xa3[xc1-xda]|xa5[xa1-xf6][xa3][xb0-xfa]|[xa1][xbc-xbe]|[xa1][xdd]

EUC_JP全角汉字 [color=Red]2007-03-12 15:06更新[/color]

[xb0-xcf][xa0-xd3]|[xd0-xf4][xa0-xfe]|[xB0-xF3][xA1-xFE]|[xF4][xA1-xA6]|[xA4][xA1-xF3]|[xA5][xA1-xF6]|[xA1][xBC-xBE]

Big5

[x01-x7f]|[x81-xfe]([x40-x7e]|[xa1-xfe])

GBK

[x01-x7f]|[x81-xfe][x40-xfe]

GB2312汉字

[xb0-xf7][xa0-xfe]

GB2312半角标点符号及特殊符号

xa1[xa2-xfe]

GB2312罗马数组及项目序号

xa2([xa1-xaa]|[xb1-xbf]|[xc0-xdf]|[xe0-xe2]|[xe5-xee]|[xf1-xfc])

GB2312全角标点及全角字母

xa3[xa1-xfe]

GB2312日文平假名

xa4[xa1-xf3]

GB2312日文片假名

xa5[xa1-xf6]

補充:

GB18030

[x00-x7f]|[x81-xfe][x40-xfe]|[x81-xfe][x30-x39][x81-xfe][x30-x39]

[color=Red]2007-03-12 21:35 补充[/color]

日文半角空格

x20

SJIS全角空格

(?:x81x81)

SJIS全角数字

(?:x82[x4f-x58])

SJIS全角大写英文

(?:x82[x60-x79])

SJIS全角小写英文

(?:x82[x81-x9a])

SJIS全角平假名

(?:x82[x9f-xf1])

SJIS全角平假名扩展

(?:x82[x9f-xf1]|x81[x4ax4bx54x55])

SJIS全角片假名

(?:x83[x40-x96])

SJIS全角片假名扩展

(?:x83[x40-x96]|x81[x45x5bx52x53])

EUC_JP全角空格

(?:xa1xa1)

EUC半角片假名

(?:x8e[xa6-xdf])

转载请注明:代码学堂>编程开发 > 正则学习 > 正则表达式中对各字符集编码范围的总结

1. 本站所有资源来源于用户上传和网络,因此不包含技术服务请大家谅解!如有侵权请邮件联系客服!10210454@qq.com
2. 本站不保证所提供所有下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理,有奖励!
3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负!
4. 如果您也有好的资源或教程,您可以投稿发布,成功分享后有RB奖励和额外RMB收入!

磊宇堂正在使用的服务器 维护管理由磊宇云服务器提供支持

磊宇堂 » 正则表达式中对各字符集编码范围的总结

提供最优质的资源集合

立即查看 了解详情