正则表达式中文字符
如何用正则表达式提取字符串中的汉字?
如何用正则表达式提取字符串中的汉字?
Python re正则匹配中文,其实非常简单,把中文的unicode字符串转换成utf-8格式就可以了,然后可以在re中随意调用unicode中中文的编码为/u4e00-/u9fa5,因此正则表达式u”[\一-\龥] ”可以表示一个或者多个中文字符gtgtgt import regtgtgt s='中文:123456aa哈哈哈bbcc'.decode('utf8')gtgtgt su'\中\文\:123456aa\哈\哈\哈bbcc'gtgtgt print s中文:123456aa哈哈哈bbccgtgtgt re.match(u\