python字符串内置方法

网上已经有很多,自己操作一遍,加深印象。

dir

dir会返回一个内置方法与属性列表,用字符串‘a,b,cdefg‘测试一下

dir(‘a,b,cdefg‘)

得到一个列表

[‘__add__‘,
 ‘__class__‘,
 ‘__contains__‘,
 ‘__delattr__‘,
 ‘__dir__‘,
 ‘__doc__‘,
 ‘__eq__‘,
 ‘__format__‘,
 ‘__ge__‘,
 ‘__getattribute__‘,
 ‘__getitem__‘,
 ‘__getnewargs__‘,
 ‘__gt__‘,
 ‘__hash__‘,
 ‘__init__‘,
 ‘__iter__‘,
 ‘__le__‘,
 ‘__len__‘,
 ‘__lt__‘,
 ‘__mod__‘,
 ‘__mul__‘,
 ‘__ne__‘,
 ‘__new__‘,
 ‘__reduce__‘,
 ‘__reduce_ex__‘,
 ‘__repr__‘,
 ‘__rmod__‘,
 ‘__rmul__‘,
 ‘__setattr__‘,
 ‘__sizeof__‘,
 ‘__str__‘,
 ‘__subclasshook__‘,
 ‘capitalize‘,
 ‘casefold‘,
 ‘center‘,
 ‘count‘,
 ‘encode‘,
 ‘endswith‘,
 ‘expandtabs‘,
 ‘find‘,
 ‘format‘,
 ‘format_map‘,
 ‘index‘,
 ‘isalnum‘,
 ‘isalpha‘,
 ‘isdecimal‘,
 ‘isdigit‘,
 ‘isidentifier‘,
 ‘islower‘,
 ‘isnumeric‘,
 ‘isprintable‘,
 ‘isspace‘,
 ‘istitle‘,
 ‘isupper‘,
 ‘join‘,
 ‘ljust‘,
 ‘lower‘,
 ‘lstrip‘,
 ‘maketrans‘,
 ‘partition‘,
 ‘replace‘,
 ‘rfind‘,
 ‘rindex‘,
 ‘rjust‘,
 ‘rpartition‘,
 ‘rsplit‘,
 ‘rstrip‘,
 ‘split‘,
 ‘splitlines‘,
 ‘startswith‘,
 ‘strip‘,
 ‘swapcase‘,
 ‘title‘,
 ‘translate‘,
 ‘upper‘,
 ‘zfill‘]

双下横向开头的字符串为内部方法或私有方法。剩下的就是能用到的字符串方法了。

str.capitalize()

首字母大写

In:‘a,b,cdefg‘.capitalize()
Out: ‘A,b,cdefg‘

str.casefold()

把所有字母变为小写,与lower类似,lower只支持英文字母A~Z,但是casefold可以把非英文变为小写。

In:‘B,b,cdEfg‘.casefold()
Out: ‘b,b,cdefg‘

In:‘B,b,cdEfg‘.lower()
Out: ‘b,b,cdefg‘

官方:

str.casefold()

Return a casefolded copy of the string. Casefolded strings may be used for caseless matching.

Casefolding is similar to lowercasing but more aggressive because it is intended to remove all case distinctions in a string. For example, the German lowercase letter ‘?‘ is equivalent to "ss". Since it is already lowercase, lower() would do nothing to ‘?‘casefold() converts it to "ss".

The casefolding algorithm is described in section 3.13 of the Unicode Standard.

New in version 3.3.

In:‘?‘.lower()
Out: ‘?‘

In:‘?‘.casefold()
Out: ‘ss‘

str.center(width[, fillchar])

按照给定字符和总宽度居中显示。比如,宽度为5的字符串‘11111’按照给定字符‘r’和总宽度8,显示的是:5个原始字符居中,‘r‘填充,长度为8的字符串。

In:‘11111‘.center(8,‘r‘)
Out: ‘r11111rr‘

str.count(substartend)

子字符串在原字符串中的个数。

sub -- 需要搜索的子字符串

start -- 字符串开始搜索的位置,不填默认0

end -- 字符串结束搜索的位置,不填为最后

In:‘r11111rr‘.count(‘1‘,1,5)
Out[39]: 4

str.encode(encoding="utf-8"errors="strict")

encoding -- 编码方式

errors -- 错误的处理方案。默认为 ‘strict‘,是编码错误引起一个UnicodeError。 其他可能得值有 ‘ignore‘--‘ ’, ‘replace‘--‘?’, ‘xmlcharrefreplace‘-- 可扩展标记语言替换, ‘backslashreplace‘--反斜杠替代 以及codecs.register_error() 注册的所有值。


‘党‘.encode(‘ascii‘)
Traceback (most recent call last):


File "<ipython-input-52-eb91b915d522>", line 1, in <module>
‘党‘.encode(‘ascii‘)


UnicodeEncodeError: ‘ascii‘ codec can‘t encode character ‘\u515a‘ in position 0: ordinal not in range(128)


‘党‘.encode(‘ascii‘,‘replace‘)
Out[48]: b‘?‘

‘党‘.encode(‘ascii‘,‘ignore‘)
Out[49]: b‘‘

‘党‘.encode(‘ascii‘,‘xmlcharrefreplace‘)
Out[50]: b‘党‘

‘党‘.encode(‘ascii‘,‘backslashreplace‘)
Out[51]: b‘\\u515a‘

str.endswith(suffixstartend)

如果字符串含有指定的后缀返回True,否则返回False。

suffix -- 子字符串

start -- 长字符串中的开始位置,默认0

end -- 长字符中结束位置,默认最后

‘B,b,cdEfg‘.endswith(‘g‘)
Out[54]: True

‘B,b,cdEfg‘.endswith(‘Efg‘)
Out[55]: True

‘B,b,cdEfg‘.endswith(‘Ef‘)
Out[56]: False

‘B,b,cdEfg‘.endswith(‘Ef‘,1,8)
Out[57]: True

str.expandtabs(tabsize=8)

把Tab--‘\t’变为其他长度的空格符,‘\t‘默认为8,下面为官网的例子:

‘01\t012\t0123\t01234‘.expandtabs()
Out[101]: ‘01      012     0123    01234‘

‘01\t012\t0123\t01234‘.expandtabs(16)
Out[102]: ‘01              012             0123            01234‘

str.find(str, beg=0, end=len(string))

检测字符串中是否包含子字符串 str ,beg(开始)到end(结束) 如果包含子字符串,则返回开始的(最小的)索引值,否则返回-1。默认为0和最后。

‘B,b,cdEfcg‘.find(‘c‘,6,9)
Out[106]: 8

‘B,b,cdEfcg‘.find(‘c‘)
Out[107]: 4

‘B,b,cdEfcg‘.find(‘h‘)
Out[108]: -1

str.rfind(str, beg=0, end=len(string))

用法与str.find一致,这个得到的是结束的(最大的)索引值。

str.format(*args**kwargs)

字符串格式化,通过{}代替传统的%.*arg表示不可变参数--元组,**kwargs表示可变参数--字典

1.索引

{}里面为索引,0对应format中第一个元素。

‘我{}好人,你{}好人!‘.format(‘是‘,‘不是‘)
Out[111]: ‘我是好人,你不是好人!‘
‘我{1}好人,你{0}好人!‘.format(‘是‘,‘不是‘)
Out[112]: ‘我不是好人,你是好人!‘

l = [‘是‘,‘不是‘]
‘我{0[0]}好人,你{0[1]}好人!‘.format(l)
Out[118]: ‘我是好人,你不是好人!‘

2.关键字

‘我{我}好人,你{你}好人!‘.format(我=‘是‘,你=‘不是‘)
Out[121]: ‘我是好人,你不是好人!‘

3.填充

‘{0:*<10}‘.format(‘党‘)  #总长度为10,字符串在左面
Out[127]: ‘党*********‘

‘{0:*>10}‘.format(‘党‘)  #总长度为10,字符串在右面
Out[128]: ‘*********党‘  

‘{0:*^10}‘.format(‘党‘)  #总长度为10,字符串居中
Out[129]: ‘****党*****‘

4.精度与进制

‘{0:.2f}‘.format(1/3)
Out[132]: ‘0.33‘

‘{0:b}‘.format(8)    #二进制
Out[133]: ‘1000‘

‘{0:o}‘.format(8)     #八进制
Out[134]: ‘10‘

‘{:,}‘.format(111111111111111)  #千分位格式化
Out[135]: ‘111,111,111,111,111‘

str.format_map(mapping)

str.format(**mapping)类似,区别在于format_map直接用字典,而不是复制一个。下面是官方例子,其中Default是dict的一个子类。

class Default(dict):
    def __missing__(self, key):
        return key
‘{name} was born in {country}‘.format_map(Default(name=‘Guide‘))

Out[18]: ‘Guide was born in country‘

str.index(str, beg=0, end=len(string))

与str.find类似,区别在于,index如果找不到要寻到的字符,会得到ValueError,而find则返回-1。

‘asdfghjkhl‘.find(‘i‘)
Out[24]: -1

‘asdfghjkhl‘.index(‘i‘)
Traceback (most recent call last):

  File "<ipython-input-25-af5de9246bb5>", line 1, in <module>
    ‘asdfghjkhl‘.index(‘i‘)

ValueError: substring not found

str.rindex(str, beg=0, end=len(string))

用法与str.rindex一致,这个得到的是结束的(最大的)索引值。

str.isalum()

如果字符串至少有一个字符,并且所有字符都是字母或数字则返回 True,否则返回 False。

‘asdfghjkhl‘.isalnum()
Out[26]: True

‘asdfg.. hjkhl‘.isalnum()
Out[27]: False

str.isalpha()

如果字符串至少有一个字符,并且所有字符都是字母或汉字则返回 True,否则返回 False。

str.isdecimal()     str.isdigit()     str.isnumeric()

3个都是判断字符串是不是数字字符

差别:

str.isdecimal()  表面上就是: str 是阿拉伯数字123456这样的为True,是汉字数字,罗马数字为False,显示的‘’不是‘’数字的b" "为Error。

str.isdigit() 除了汉字数字为False,其他数字都为True,包括单字节数字b" "。

str.isnumeric() 除了单字节数字b" "是Error,所有的数字都为True。

str.isidentifier()

检测字符串是否是字母开头。

‘asdfghjkhl‘.isidentifier()
Out[33]: True

‘1asdfghjkhl‘.isidentifier()
Out[34]: False

str.islower()

如果字符串中的所有字符都是小写,并且至少有一个字符,则返回True,否则返回False。

‘asdfghjkhl‘.islower()
Out[37]: True

‘asdfghjkHl‘.islower()
Out[38]: False

str.isprintable()

判断是不是都为可见/可打印字符

‘asdf\nghjkHl‘.isprintable()
Out[42]: False

‘asdfghjkHl‘.isprintable()
Out[43]: True

str.isspace()

判断是否为空格字符(注意不是空)

‘‘.isspace()
Out[44]: False

‘ ‘.isspace()
Out[45]: True

‘ss‘.isspace()
Out[46]: False

str.istitle()

字面上意思是:判断字符串能不能做标题

‘Wo Shi Hao Ren 1‘.istitle()
Out[50]: True

‘Wo Shi Hao Ren 党‘.istitle()
Out[51]: True

‘Wo Shi Hao ren‘.istitle()
Out[52]: False

‘Wo Shi Hao Ren‘.istitle()
Out[53]: True

str.title()

把字符串变为标题格式。

‘wo shi hao ren‘.title()
Out[140]: ‘Wo Shi Hao Ren‘

str.isupper()

与str.islower()对应,如果字符串中的所有字符都是大写,并且至少有一个字符,则返回True,否则返回False。

str.join(string)

以str作为分隔符,将string所有的元素合并成一个新的字符串。若string为空,则TypeError。

‘111‘.join(‘asdfghjkl‘)
Out[55]: ‘a111s111d111f111g111h111j111k111l‘

‘111‘.join()
Traceback (most recent call last):

  File "<ipython-input-56-5fa735339586>", line 1, in <module>
    ‘111‘.join()

TypeError: join() takes exactly one argument (0 given)

str.ljust(width,fillchar)

得到一个原始字符串左对齐,并使用fiichar填充至指定长度的新字符串。若指定的长度小于原字符串的长度则返回原始字符串。与format的填充用法相似。

width--指定长度

fillchar--填充字符串,默认空格字符。

‘111‘.ljust(50)
Out[57]: ‘111                                               ‘

‘111‘.ljust(50,‘*‘)
Out[58]: ‘111***********************************************‘
‘{0:*<50}‘.format(‘111‘)
Out[62]: ‘111***********************************************‘

str.rjust(width,fillchar)

得到一个原始字符串右对齐,并使用fiichar填充至指定长度的新字符串。若指定的长度小于原字符串的长度则返回原始字符串。与format的填充用法相似。(用法与ljust一致)

str.lower()

把所有字母转化为小写,与str.upper()相对,与str.casefold()区别。

str.upper()

把所有字母转化为大写。

str.lstrip(chars)

删除str左边所有出现在chars子字符串,chars为空时默认空格字符。

‘     Wo Shi Hao ren   ‘.lstrip()
Out[67]: ‘Wo Shi Hao ren   ‘

‘Wo Shi Hao ren‘.lstrip(‘fdsfsfW‘)
Out[68]: ‘o Shi Hao ren‘

‘Wo Shi Hao ren‘.lstrip(‘fdsfsfw‘)
Out[69]: ‘Wo Shi Hao ren‘

str.rstrip(chars)

与str.lstrip(chars)对应且方法一致,删除str右边所有出现在chars子字符串,chars为空时默认空格字符。

str.strip(chars)

与str.lstrip(chars)和str.rstrip(chars)用法一致,这个是删除两边所有出现在chars子字符串,chars为空时默认空格字符。

‘asdas‘.strip(‘as‘)
Out[124]: ‘d‘

str.maketrans(intab,outtab)

得到一个用于str.translate()的映射,其实就是一个字典。

intab--是原始字符

outtab--翻译后的字符,长度与in相等

intab = "abcde"
outtab = "12345"
name = "asdwgwegb"
x = ‘‘.maketrans(intab, outtab)
name.translate(x)

Out[103]: ‘1s4wgw5g2‘

ord(‘a‘)  #a的Unicode编码
Out[104]: 97

x
Out[105]: {97: 49, 98: 50, 99: 51, 100: 52, 101: 53}

x就是maketrans得到的字典,字典中的映射是字符对应的Unicode编码。

str.translate()

根据str.maketrans得到的字典翻译str

str.partition(char)    str.split(char,count)

作用都是字符串分割

str.partition(char)根据字符串char分割str得到一个3元素元组(只识别第一次出现的字符串)。char不能为空

‘asdsawoainiasdaswoainid‘.partition(‘woaini‘)
Out[111]: (‘asdsa‘, ‘woaini‘, ‘asdaswoainid‘)

‘asdsawoainiasdaswoainid‘.partition(‘woainid‘)
Out[112]: (‘asdsawoainiasdas‘, ‘woainid‘, ‘‘)

 str.split(char,count)  根据字符串char分割str得到一个列表(识别所有的char,并且char不包含在列表内),char默认为空格符。

char--子字符串

count--切割次数,默认全部。

‘asdsawoainiasdaswoainid‘.split(‘woaini‘)
Out[113]: [‘asdsa‘, ‘asdas‘, ‘d‘]

‘asdsawoainiasdaswoainid‘.split()
Out[114]: [‘asdsawoainiasdaswoainid‘]

‘asdsawoainiasdaswo ainid‘.split()
Out[115]: [‘asdsawoainiasdaswo‘, ‘ainid‘]

str.rpartition(char)

用法与str.partition(char)一致,str.rpartition(char)根据字符串char分割str得到一个3元素元组(只识别最后一次出现的字符串)。char不能为空

str.rsplit(char,count)

与str.split用法一致,但是str.rsplit是从后往前工作,str.split是签到后工作。

‘basdasa‘.rsplit(‘as‘,1)
Out[131]: [‘basd‘, ‘a‘]

‘basdasa‘.split(‘as‘,1)
Out[132]: [‘b‘, ‘dasa‘]

str.splitlines(keepends)

str.splitlines(keepends) 按照行(‘\r‘, ‘\r\n‘, \n‘)分隔,得到各行元素的列表,如果keepends为 False,不包含换行符,如果为 True,则保留换行符。默认为False。

‘asdsa\r\nwo\rainia\r\nsdas\nw\roainid‘.splitlines()
Out[116]: [‘asdsa‘, ‘wo‘, ‘ainia‘, ‘sdas‘, ‘w‘, ‘oainid‘]

‘asdsa\r\nwo\rainia\r\nsdas\nw\roainid‘.splitlines(False)
Out[117]: [‘asdsa‘, ‘wo‘, ‘ainia‘, ‘sdas‘, ‘w‘, ‘oainid‘]

‘asdsa\r\nwo\rainia\r\nsdas\nw\roainid‘.splitlines(True)
Out[118]: [‘asdsa\r\n‘, ‘wo\r‘, ‘ainia\r\n‘, ‘sdas\n‘, ‘w\r‘, ‘oainid‘]

str.replace(old,new,count)

把字符串中的 old(旧字符串) 替换成 new(新字符串),替换不超过count 次,count为空时不限次数。

‘asdas‘.replace(‘as‘,‘sa‘,1)
Out[121]: ‘sadas‘

‘asdas‘.replace(‘as‘,‘sa‘)
Out[122]: ‘sadsa‘

str.startswith(start,end)

startswith() 方法用于检查字符串是否是以指定字符串开头,如果是返回True,否则返回False。start,end未指定范围,默认0,len(str)-1

‘basdasa‘.startswith(‘ba‘)
Out[135]: True

‘basdasa‘.startswith(‘ba‘,1,5)
Out[136]: False

str.swapcase()

大写变小写,小写变大写

‘basdasaDASDA‘.swapcase()
Out[138]: ‘BASDASAdasda‘

str.zfill(width)

width--指定长度

在字符串str前面填充字符串‘0’,使长度为指定长度width。

‘asdas‘.zfill(10)
Out[141]: ‘00000asdas‘

参考:https://docs.python.org/3/library/stdtypes.html#string-methods

时间: 2024-10-12 03:38:22

python字符串内置方法的相关文章

python 字符串内置方法整理

编码相关内置方法: (1)    str.encode(encoding='utf-8'):返回字符串编码,encoding指定编码方式. >>> a = 'I love Python' >>> a.encode(encoding='utf-8') b'I love Python' >>> a.encode(encoding='gbk') b'I love Python' >>> b.encode(encoding='utf-8')

7.python字符串-内置方法分析

上篇对python中的字符串进行了列举和简单说明,但这些方法太多,逐一背下效率实在太低,下面我来对这些方法安装其功能进行总结: 1.字母大小写相关(中文无效) 1.1 S.upper() -> string 返回一个字母全部大写的副本 1.2 S.lower() -> string 返回一个字母全是小写的副本 1.3 S.swapcase() -> string 返回一个字母大小写转换后的副本 1.4 S.title() -> string 将单词的首字母大写,即为所谓的标题 方框

python字符串-内置方法用法分析

1.字母大小写相关(中文无效) 1.1 S.upper() -> string 返回一个字母全部大写的副本 1.2 S.lower() -> string 返回一个字母全是小写的副本 1.3 S.swapcase() -> string 返回一个字母大小写转换后的副本 1.4 S.title() -> string 将单词的首字母大写,即为所谓的标题 方框里是中文的编码,可以发现 s 还是大写了,说明会无视其他类型的字符,找到英文单词就将其首字母大写 1.6 S.capitaliz

Python 字符串内置方法(二)

startswith()方法:匹配以指定字符开头的字符串 输出 匹配成功 --> 输出:True 匹配不成功 --> 输出:False In [18]: a Out[18]: 'abcda12' In [19]: a.startswith('a') Out[19]: True In [20]: a.startswith('ab') Out[20]: True In [21]: a.startswith('a',1,10) Out[21]: False rfind()方法:输出字符串中指定字符的

Python 字符串内置方法(一)

以下方法只需要知道用法就行了,权当了解,不用硬背,以后需要用到的时候再回来看 说明: 一般方法中前面是is开头的就是判断来的,输出不是True就是False,例如isalpha()方法 capitalize()方法:首字母大写 In [1]: a='abc' In [2]: a.capitalize() Out[2]: 'Abc' center()方法:设置宽度,并对字符串进行居中 输出指定的总长度,这里是20,然后内容居中,未指定填充物的时候填充空格 In [3]: a='abc' In [4

Python 字符串内置方法学习

def capitalize(self): # real signature unknown; restored from __doc__ """ S.capitalize() -> str Return a capitalized version of S, i.e. make the first character have upper case and the rest lower case. """ return "&qu

Python的内置方法,abs,all,any,basestring,bin,bool,bytearray,callable,chr,cmp,complex,divmod

Python的内置方法 abs(X):返回一个数的绝对值,X可以是一个整数,长整型,或者浮点数,如果X是一个复数,此方法返回此复数的绝对值(此复数与它的共轭复数的乘积的平方根) >>> abs(3+2j) 3.605551275463989 >>> abs(3-2j) 3.605551275463989 all(iterable):如果迭代器的所有元素都是true,或者空迭代器,则此方法返回true. any(iterable):迭代器只要有一个元素为false,或者空

Python字典内置方法

Python字典包含了以下内置方法: 序号 函数及描述 1 radiansdict.clear()删除字典内所有元素 2 radiansdict.copy()返回一个字典的浅复制 3 radiansdict.fromkeys()创建一个新字典,以序列seq中元素做字典的键,val为字典所有键对应的初始值 4 radiansdict.get(key, default=None)返回指定键的值,如果值不在字典中返回default值 5 key in dict如果键在字典dict里返回true,否则返

Python的内置方法和类的继承举例

1.类的内置方法 Python内部类:所谓内部类,就是在类的内部定义的类,主要目的是为了更好的抽象现实世界.例子:汽车是一个类,汽车的底盘轮胎也可以抽象为类,将其定义到汽车内中,而形成内部类,更好的描述汽车类,因为底盘轮胎是汽车的一部分.内部类实例化方法: 方法1:直接使用外部类调用内部类方法2:先对外部类进行实例化,然后再实例化内部类out_name = outclass_name()in_name = out_name.inclass_name()in_name.method() #!/us