在处理中文时,isspace
函数可能会遇到问题,因为中文字符不被视为空白字符。解决方法如下:
def is_whitespace(ch):
if ch.isspace() or ord(ch) == 12288 or ord(ch) in range(8192, 8200):
return True
else:
return False
import re
def is_whitespace(ch):
if re.match(r'[\s\u3000]', ch):
return True
else:
return False
使用上述的自定义函数或正则表达式,可以解决isspace
函数对中文处理的问题。