Python 字符串方法详解

Python 字符串方法详解

本文最初发表于赖勇浩(恋花蝶)的博客(http://blog.csdn.net/lanphaday),如蒙转载,敬请保留全文完整,切勿去除本声明和作者信息。

在编程中,几乎90% 以上的代码都是关于整数或字符串操作,所以与整数一样,Python 的字符串实现也使用了许多拿优化技术,使得字符串的性能达到极致。与 C++ 标准库(STL)中的 std::string 不同,python 字符串集合了许多字符串相关的算法,以方法成员的方式提供接口,使用起来非常方便。 字符串方法大约有几十个,这些方法可以分为如下几类(根据 manuals 整理):

类型 方法 注解
填充
center(width[, fillchar]) ,

ljust(width[, fillchar]),

rjust(width[, fillchar]),

zfill(width),

expandtabs([tabsize])


l         fillchar 参数指定了用以填充的字符,默认为空格

l         顾名思义,zfill()即是以字符0进行填充,在输出数值时比较常用

l         expandtabs()的tabsize 参数默认为8。它的功能是把字符串中的制表符(tab)转换为适当数量的空格。

删减
strip([chars]),

lstrip([chars]),

rstrip([chars])

*strip()函数族用以去除字符串两端的空白符,空白符由string.whitespace常量定义。
变形
lower(),

upper(),

capitalize(),

swapcase(),

title()


title()函数是比较特别的,它的功能是将每一个单词的首字母大写,并将单词中的非首字母转换为小写(英文文章的标题通常是这种格式)。

>>> ‘hello wORld!‘.title()

‘Hello World!‘

因为title() 函数并不去除字符串两端的空白符也不会把连续的空白符替换为一个空格,所以建议使用string 模块中的capwords(s)函数,它能够去除两端的空白符,再将连续的空白符用一个空格代替。

>>> ‘ hello   world!‘.title()

‘ Hello   World!‘

>>> string.capwords(‘ hello   world!‘)

‘Hello World!‘

分切
partition(sep),

rpartition(sep),

splitlines([keepends]),

split([sep [,maxsplit]]),

rsplit([sep[,maxsplit]])


l         *partition()函数族是2.5版本新增的方法。它接受一个字符串参数,并返回一个3个元素的 tuple 对象。如果sep没出现在母串中,返回值是 (sep, ‘’, ‘’);否则,返回值的第一个元素是 sep 左端的部分,第二个元素是 sep 自身,第三个元素是 sep 右端的部分。

l         参数 maxsplit 是分切的次数,即最大的分切次数,所以返回值最多有 maxsplit+1 个元素。

l         s.split() 和 s.split(‘ ‘)的返回值不尽相同

>>> ‘ hello   world!‘.split()

[‘hello‘, ‘world!‘]

>>> ‘ hello   world!‘.split(‘ ‘)

[‘‘, ‘‘, ‘hello‘, ‘‘, ‘‘, ‘world!‘]

产生差异的原因在于当忽略 sep 参数或sep参数为 None 时与明确给 sep 赋予字符串值时 split() 采用两种不同的算法。对于前者,split() 先去除字符串两端的空白符,然后以任意长度的空白符串作为界定符分切字符串(即连续的空白符串被当作单一的空白符看待);对于后者则认为两个连续的 sep 之间存在一个空字符串。因此对于空字符串(或空白符串),它们的返回值也是不同的:

>>> ‘‘.split()

[]

>>> ‘‘.split(‘ ‘)

[‘‘]

连接 join(seq)
join() 函数的高效率(相对于循环相加而言),使它成为最值得关注的字符串方法之一。它的功用是将可迭代的字符串序列连接成一条长字符串,如:

>>> conf = {‘host‘:‘127.0.0.1‘,

...     ‘db‘:‘spam‘,

...     ‘user‘:‘sa‘,

...     ‘passwd‘:‘eggs‘}

>>> ‘;‘.join("%s=%s"%(k, v) for k, v in conf.iteritems())

‘passswd=eggs;db=spam;user=sa;host=127.0.0.1‘

判定
isalnum(),

isalpha(),

isdigit(),

islower(),

isupper(),

isspace(),

istitle(),

startswith(prefix[, start[, end]]),

endswith(suffix[,start[, end]])


这些函数都比较简单,顾名知义。需要注意的是*with()函数族可以接受可选的 start, end 参数,善加利用,可以优化性能。

另,自 Py2.5 版本起,*with() 函数族的 prefix 参数可以接受 tuple 类型的实参,当实参中的某人元素能够匹配,即返回 True。

查找
count( sub[, start[, end]]),

find( sub[, start[, end]]),

index( sub[, start[, end]]),

rfind( sub[, start[,end]]),

rindex( sub[, start[, end]])


find()函数族找不到时返回-1,index()函数族则抛出ValueError异常

另,也可以用 in 和 not in 操作符来判断字符串中是否存在某个模板。

替换
replace(old, new[,count]),

translate(table[,deletechars])


l         replace()函数的 count 参数用以指定最大替换次数

l         translate() 的参数 table 可以由 string.maketrans(frm, to) 生成

l         translate() 对 unicode 对象的支持并不完备,建议不要使用。

编码
encode([encoding[,errors]]),

decode([encoding[,errors]])

这是一对互逆操作的方法,用以编码和解码字符串。因为str是平台相关的,它使用的内码依赖于操作系统环境,而unicode是平台无关的,是Python内部的字符串存储方式。unicode可以通过编码(encode)成为特定编码的str,而str也可以通过解码(decode)成为unicode。

附注:

1)C++ 中可以通过 boost.string_algo 库来获得同样方便的字符串处理能力。

2)这些字符串方法在 python1.6 版本才开始提供,如果你使用的python版本非常老,可能需要使用string模块来获得这些方便的算法。

时间: 2024-10-25 04:28:34

Python 字符串方法详解的相关文章

javascript中的字符串编码、字符串方法详解

js中的字符串是一种类数组,采用UTF-16编码的Unicode字符集,意味字符串的每个字符可用下标方式获取,而每个字符串在内存中都是一个16位值组成的序列.js对字符串的各项操作均是在对16位值进行操作,而非字符. 在js中"\"后面的第一个字符不会被解析为字符,这就是js的转义字符: \o NUL字符 \b 退格符 \t 水平制表符 \n 换行符 \v 垂直制表符 \f 换页符 \r 回车符 \" 双引号 \' 撇号或单引号 \\ 反斜线 \xXX 由两位十六进制数xx指

python 字符串操作方法详解

字符串序列用于表示和存储文本,python中字符串是不可变对象.字符串是一个有序的字符的集合,用于存储和表示基本的文本信息,一对单,双或三引号中间包含的内容称之为字符串.其中三引号可以由多行组成,编写多行文本的快捷语法,常用文档字符串,在文件的特定地点,被当做注释.便捷的多行注释. Python实际三类字符串: 1.通常意义字符串(str) 2.原始字符串,以大写R 或 小写r开始,r'',不对特殊字符进行转义 3.Unicode字符串,u'' basestring子类 python中字符串支持

python魔法方法详解

文章来源:http://blog.csdn.net/koko66/article/details/42709279 据说,Python 的对象天生拥有一些神奇的方法,它们总被双下划线所包围,他们是面向对象的 Python 的一切. 他们是可以给你的类增加魔力的特殊方法,如果你的对象实现(重载)了这些方法中的某一个,那么这个方法就会在特殊的情况下被 Python 所调用,你可以定义自己想要的行为,而这一切都是自动发生的. Python 的魔术方法非常强大,然而随之而来的则是责任.了解正确的方法去使

知识点:Python 魔法方法详解

据说,Python 的对象天生拥有一些神奇的方法,它们总被双下划线所包围,他们是面向对象的 Python 的一切. 他们是可以给你的类增加魔力的特殊方法,如果你的对象实现(重载)了这些方法中的某一个,那么这个方法就会在特殊的情况下被 Python 所调用,你可以定义自己想要的行为,而这一切都是自动发生的. Python 的魔术方法非常强大,然而随之而来的则是责任.了解正确的方法去使用非常重要! 魔法方法 含义 基本的魔法方法 __new__(cls[, ...]) 1. __new__ 是在一个

Python 魔法方法详解

据说,Python 的对象天生拥有一些神奇的方法,它们总被双下划线所包围,他们是面向对象的 Python 的一切. 他们是可以给你的类增加魔力的特殊方法,如果你的对象实现(重载)了这些方法中的某一个,那么这个方法就会在特殊的情况下被 Python 所调用,你可以定义自己想要的行为(重写该方法),而这一切都是自动发生的. Python 的魔术方法非常强大,然而随之而来的则是责任.了解正确的方法去使用非常重要! 魔法方法 含义   基本的魔法方法 __new__(cls[, ...]) 1. __n

Python数据类型及其方法详解

Python数据类型及其方法详解 我们在学习编程语言的时候,都会遇到数据类型,这种看着很基础也不显眼的东西,却是很重要,本文介绍了python的数据类型,并就每种数据类型的方法作出了详细的描述,可供知识回顾. 一.整型和长整型 整型:数据是不包含小数部分的数值型数据,比如我们所说的1.2.3.4.122,其type为"int" 长整型:也是一种数字型数据,但是一般数字很大,其type为"long" 在python2中区分整型和长整型,在32位的机器上,取值范围是-2

49.Python使用requests包进行HTTP交互方法详解

简介 使用方法 传递QUERY参数 定制请求头 填写cookie 填充请求体 处理响应对象 重定向与访问历史 超时 Session对象 根据响应获取请求 SSL认证 HTTP认证 基本认证 摘要认证 代理场景 HTTPHTTPS代理 SOCKS代理 简介 Python的HTTP包有urllib.urllib2.httplib等,但是都需要了解较多的HTTP原理才能编码,借助requests包可以在较高的抽象层次上完成HTTP交互过程的开发.安装requests使用pip install requ

Python:file/file-like对象方法详解【单个文件读写】

IO中读写文件操作方法汇总!----The_Third_Wave的学习笔记! 本文由@The_Third_Wave(Blog地址:http://blog.csdn.net/zhanh1218)原创.不定期更新,有错误请指正. Sina微博关注:@The_Third_Wave 如果这篇博文对您有帮助,为了好的网络环境,不建议转载,建议收藏!如果您一定要转载,请带上后缀和本文地址. class file(object) |  file(name[, mode[, buffering]]) -> fi

Python中格式化format()方法详解

Python中格式化format()方法详解 Python中格式化输出字符串使用format()函数, 字符串即类, 可以使用方法; Python是完全面向对象的语言, 任何东西都是对象; 字符串的参数使用{NUM}进行表示,0, 表示第一个参数,1, 表示第二个参数, 以后顺次递加; 使用":", 指定代表元素需要的操作, 如":.3"小数点三位, ":8"占8个字符空间等; 还可以添加特定的字母, 如: 'b' - 二进制. 将数字以2为基数