str8="中国 和 韩国 的区别" # a=str8.find("Python") # print a b=str8.find("和") print b word=str8.split(" ") #Python3 和Spark 这里可以直接正确分割中文 print word for i in word: #python 2.x 需要这样输出 print i #这是关于编码的问题# print "-"*50# data=str8.decode("utf-8").encode("gb2312")# print type(data)# data2=data.decode("gb2312")# print type(data2)# print data2.split(u" ")# data3=data2.encode("utf-8").split(" ")# print data3# for i in data3:# print i
结果:
7
[‘\xe4\xb8\xad\xe5\x9b\xbd‘, ‘\xe5\x92\x8c‘, ‘\xe9\x9f\xa9\xe5\x9b\xbd‘, ‘\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab‘]
中国
和
韩国
的区别
--------------------------------------------------
<type ‘str‘>
<type ‘unicode‘>
[u‘\u4e2d\u56fd‘, u‘\u548c‘, u‘\u97e9\u56fd‘, u‘\u7684\u533a\u522b‘]
[‘\xe4\xb8\xad\xe5\x9b\xbd‘, ‘\xe5\x92\x8c‘, ‘\xe9\x9f\xa9\xe5\x9b\xbd‘, ‘\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab‘]
中国
和
韩国
的区别
原文地址:https://www.cnblogs.com/soyo/p/8157505.html
时间: 2024-10-13 05:03:32