Python split 分割中文

str8="中国 和 韩国 的区别"
# a=str8.find("Python")
# print a
b=str8.find("和")
print b
word=str8.split(" ")         #Python3 和Spark 这里可以直接正确分割中文
print word
for i in word:               #python 2.x 需要这样输出
    print i

#这是关于编码的问题# print "-"*50# data=str8.decode("utf-8").encode("gb2312")# print type(data)# data2=data.decode("gb2312")# print type(data2)# print data2.split(u" ")# data3=data2.encode("utf-8").split(" ")# print data3# for i in data3:#     print i

结果:

7

[‘\xe4\xb8\xad\xe5\x9b\xbd‘, ‘\xe5\x92\x8c‘, ‘\xe9\x9f\xa9\xe5\x9b\xbd‘, ‘\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab‘]
中国

韩国
的区别
--------------------------------------------------
<type ‘str‘>
<type ‘unicode‘>
[u‘\u4e2d\u56fd‘, u‘\u548c‘, u‘\u97e9\u56fd‘, u‘\u7684\u533a\u522b‘]
[‘\xe4\xb8\xad\xe5\x9b\xbd‘, ‘\xe5\x92\x8c‘, ‘\xe9\x9f\xa9\xe5\x9b\xbd‘, ‘\xe7\x9a\x84\xe5\x8c\xba\xe5\x88\xab‘]
中国

韩国
的区别

原文地址:https://www.cnblogs.com/soyo/p/8157505.html

时间: 2024-10-13 05:03:32

Python split 分割中文的相关文章

python split()分割和join()合并

一.split()可以基于指定的分割符将字符串分割成多个子字符串,如果不指定分割符,则默认使用空白符(换行符/空格/制表符) 示例:  f = "hello world"   f1 = f.split("o")             print(f1)             f2 = f.split()             print(f2)             f3 = f.split("\n")             print

python中分割字符串split切割并选择输出 逐行读取文件后字符串拼接

字符串根据分隔符切割后输出,一下面 #!/usr/bin/python # -*- coding: utf-8 -*- str="abc,123 efg,567" #以空行分割后输出 print str.split(); #以','分割2次后输出 print str.split(',',2); #以','分割2次后输出地2个参数,1是从0开始,代表第二个参数 print str.split(',',2)[1]; 输出结果如下: ['abc,123', 'efg,567'] ['abc'

(一)Python入门-2编程基本概念:17字符串-split()分割-join()合并-join()效率测试

一:split()分割 split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中).如果不指定分隔 符,则默认使用空白字符(换行符/空格/制表符).示例代码如下: 1 >>> a = "to be not to be" 2 3 >>> a.split() 4 5 ['to', 'be', 'not', 'to', 'be'] 6 >>> a.split("be") 7 8 ['to ', ' no

Python 字符串分割的方法

在平时工作的时候,发现对于字符串分割的方法用的比较多,下面对分割字符串方法进行总结一下:第一种:split()函数split()函数应该说是分割字符串使用最多的函数用法:str.split('分割符')通过该分割操作后,会返回一个列表. 注:当然如果你的字符串含有一个或者多个空格就直接 str.split() 就可以了 例如: >>> a = "hello,python,Good Night" >>> a.split(',') ['hello', '

Python split()方法

描述 Python split() 通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则仅分隔 num 个子字符串 语法 split() 方法语法: str.split(str="", num=string.count(str)). 参数 str -- 分隔符,默认为所有的空字符,包括空格.换行(\n).制表符(\t)等. num -- 分割次数. 返回值 返回分割后的字符串列表. 实例 以下实例展示了split()函数的使用方法: #!/usr/bin/python str

【Rollo的Python之路】Python Split()函数 的用法

Python Split()函数 Python split() 通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串 split() 方法语法: str.split(str="", num=string.count(str)). 参数 str -- 分隔符,默认为所有的空字符,包括空格.换行(\n).制表符(\t)等. num -- 分割次数.默认为 -1, 即分隔所有. 返回值 返回分割后的字符串列表. str = "this is s

大小写转换,split分割

一.大小写转换 1.定义和用法 toUpperCase() 方法用于把字符串转换为大写. toLowerCase() 方法用于把字符串转换为小写.    用法: stringObject.toUpperCase(): stringObject.toLowerCase(): var str = 'www.BAIDU.com'; alert(str.toUpperCase()); // WWW.BAIDU.COM alert(str.toLowerCase()); // www.baidu.com

python里面出现中文的时候报错 &#39;ascii&#39; codec can&#39;t encode characters in position

编码问题,在头部添加 import sys reload(sys) sys.setdefaultencoding( "utf-8" ) http://www.xuebuyuan.com/2226637.html python里面出现中文的时候报错 'ascii' codec can't encode characters in position

windows下Python打开包含中文路径名文件

windows使用gbx(gb2312,gbk,gb18030我也不知道是哪个)对文件名及文件路径进行编码保存.打开文件的函数中使用诸如open(filename.encode('gbk'))可以很好的解决. #coding:utf8 if __name__ == '__main__': srcfile = r"D:/测试路径/测试文件.txt" f = open(srcfile.decode('utf8').encode('gbk')) for text in f.readlines