Python序列——字符串

    • 字符串

      • 1 string模块预定义字符串
      • 2 普通字符串与Unicode字符串
      • 3 只适用于字符串的操作
      • 4 原始字符串
      • 5 Unicode字符串操作符
    • 内建函数
      • 1 标准类型函数与序列操作函数
      • 2 字符串类型函数
    • 字符串内建函数
    • 字符串特有性质
      • 1 转义字符
      • 2 三引号

本文介绍Python序列中的字符串。

1. 字符串

字符串支持序列操作。

1.1 string模块预定义字符串

>>> import string
>>> string.ascii_letters
‘abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ‘
>>> string.ascii_lowercase
‘abcdefghijklmnopqrstuvwxyz‘
>>> string.ascii_uppercase
‘ABCDEFGHIJKLMNOPQRSTUVWXYZ‘
>>> string.digits
‘0123456789‘
>>> 

1.2 普通字符串与Unicode字符串

>>> u‘Hello‘ + ‘ furzoom‘
u‘Hello furzoom‘
>>> 

1.3 只适用于字符串的操作

>>> ‘%x‘ % 108
‘6c‘
>>> ‘%X‘ % 108
‘6C‘
>>> ‘%#X‘ % 108
‘0X6C‘
>>> ‘%#x‘ % 108
‘0x6c‘
>>> ‘%f‘ % 1234.567890
‘1234.567890‘
>>> ‘%.2f‘ % 1234.567890
‘1234.57‘
>>> ‘%E‘ % 1234.567890
‘1.234568E+03‘
>>> ‘%e‘ % 1234.567890
‘1.234568e+03‘
>>> ‘%g‘ % 1234.567890
‘1234.57‘
>>> ‘%G‘ % 1234.567890
‘1234.57‘
>>> ‘%e‘ % 111111111111111111111
‘1.111111e+20‘
>>> ‘Welcome to %(website)s, %(name)s‘ % {‘name‘: ‘mn‘, ‘website‘: ‘furzoom.com‘}
‘Welcome to furzoom.com, mn‘
>>> from string import Template
>>> s = Template(‘There are ${howmany} ${lang} Quotation Symbols‘)
>>> print s.substitute(lang=‘Python‘, howmany=3)
There are 3 Python Quotation Symbols
>>>
>>> print s.substitute(lang=‘Python‘)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.7/string.py", line 172, in substitute
    return self.pattern.sub(convert, self.template)
  File "/usr/lib/python2.7/string.py", line 162, in convert
    val = mapping[named]
KeyError: ‘howmany‘
>>>
>>> print s.safe_substitute(lang=‘Python‘)
There are ${howmany} Python Quotation Symbols
>>> 

1.4 原始字符串

>>> ‘\n‘
‘\n‘
>>> print ‘\n‘

>>> r‘\n‘
‘\\n‘
>>> print r‘\n‘
\n
>>> 

1.5 Unicode字符串操作符

他用Unicode原始字符串时,u要出现在r前面。

>>> ur‘hello\nfurzoom‘
u‘hello\\nfurzoom‘
>>> ru‘hello\nmn‘
  File "<stdin>", line 1
    ru‘hello\nmn‘
                ^
SyntaxError: invalid syntax
>>>

2. 内建函数

2.1 标准类型函数与序列操作函数

  • cmp()
  • len()
  • max()
  • min()
  • enumerate()
  • zip()
>>> s1 = ‘furzoom‘
>>> s2 = ‘abcdefg‘
>>> cmp(s1, s2)
1
>>> cmp(s2, s1)
-1
>>> cmp(s1, ‘furzoom‘)
0
>>> len(s1)
7
>>> max(s1)
‘z‘
>>> min(s1)
‘f‘
>>> us1 = u‘furzoom‘
>>> len(us1)
7
>>> us1
u‘furzoom‘
>>> print us1
furzoom
>>> min(us1)
u‘f‘
>>> max(us1)
u‘z‘
>>> for i, t in enumerate(s1):
...     print i, t
...
0 f
1 u
2 r
3 z
4 o
5 o
6 m
>>> zip(s2, s1)
[(‘a‘, ‘f‘), (‘b‘, ‘u‘), (‘c‘, ‘r‘), (‘d‘, ‘z‘), (‘e‘, ‘o‘), (‘f‘, ‘o‘), (‘g‘, ‘m‘)]
>>> 

2.2 字符串类型函数

  • raw_input()
  • str()
  • unicode()
  • chr()
  • unichr()
  • ord()

unichr()如果配置为USC2的Unicode,参数范围是range(65535),如果配置为USC4的Unicode,那么参数范围是range(0x1100000)

>>> name = raw_input("Enter your name: ")
Enter your name: furzoom MN
>>> name
‘furzoom MN‘
>>> len(name)
10
>>> unicode(name)
u‘furzoom MN‘
>>> str(unicode(name))
‘furzoom MN‘
>>>
>>> isinstance(u‘\0xAB‘, str)
False
>>> isinstance(‘mn‘, unicode)
False
>>> isinstance(u‘‘, unicode)
True
>>> isinstance(‘mn‘, str)
True
>>> chr(65)
‘A‘
>>> ord(‘a‘)
97
>>> unichr(12345)
u‘\u3039‘
>>> chr(12345)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: chr() arg not in range(256)
>>> ord(u‘\uffff‘)
65535
>>> 

3. 字符串内建函数

  • string.capitalize()
  • string.center(width[, fillchar])
  • string.count(sub[, start[, end]]])
  • string.decode([encode[, errors]])
  • string.encode([encode[, errors]])
  • string.endswith(suffix[, start[, end]]])
  • string.expandtabs([tabsize])
  • string.find(sub[, start[, end]])
  • string.format(*args, **kwargs)
  • string.index(sub[, start[, end]])
  • string.isalnum()
  • string.isalpha()
  • string.isdigit()
  • string.islower()
  • string.isspace()
  • string.istitle()
  • string.isupper()
  • string.istitle()
  • string.join(iterable)
  • string.ljust(width[, fillchar])
  • string.lower()
  • string.lstrip([chars])
  • string.partition(sep)
  • string.replace(old, new[, count])
  • string.rfind(sub[, start[, end]])
  • string.rindex(sub[, start[, end]])
  • string.rjust(width[, fillchar])
  • string.rpartition(sep)
  • string.rsplit([sep[, maxsplit]])
  • string.rstrip([chars])
  • string.split([sep[, maxsplit]])
  • string.splitlines([keepends])
  • string.startswith(prefix[, start[, end]])
  • string.strip([chars])
  • string.swapcase()
  • string.title()
  • string.translate(talbe[, deletechars])
  • string.upper()
  • string.zfill(width)

string.format()将在后面进行介绍。

>>> s = ‘welcome to visit furzoom.com‘
>>> s.capitalize()
‘Welcome to visit furzoom.com‘
>>> s.center(50)
‘           welcome to visit furzoom.com           ‘
>>> s.center(50, ‘#‘)
‘###########welcome to visit furzoom.com###########‘
>>> s.count(‘om‘)
3
>>> s.count(‘om‘, -10)
2
>>> s.count(‘om‘, 0, 10)
1
>>> s.decode()
u‘welcome to visit furzoom.com‘
>>> s.decode().encode()
‘welcome to visit furzoom.com‘
>>> s.endswith(‘com‘)
True
>>> s.endswith(‘‘)
True
>>> s.endswith(‘mn‘)
False
>>> s.endswith(‘co‘, 0, -1)
True
>>> s1 = ‘1\t23\t456\t789‘
>>> s1.expandtabs()
‘1       23      456     789‘
>>> s1.expandtabs(4)
‘1   23  456 789‘
>>> s1.expandtabs(3)
‘1  23 456   789‘
>>> s1.expandtabs(5)
‘1    23   456  789‘
>>> s1.expandtabs(6)
‘1     23    456   789‘
>>> s.find(‘om‘)
4
>>> s.find(‘mn‘)
-1
>>> s.find(‘om‘, 5)
22
>>> s.index(‘om‘)
4
>>> s.index(‘mn‘)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: substring not found
>>> ‘234‘.isalnum()
True
>>> s.isalnum()
False
>>> ‘‘.isalnum()
False
>>> s.isalpha()
False
>>> ‘furzoom‘.isalpha()
True
>>> s.isdigit()
False
>>> ‘234‘.isdigit()
True
>>> ‘‘.isdigit()
False
>>> s.islower()
True
>>> ‘234‘.islower()
False
>>> s.isspace()
False
>>> ‘ \t‘.isspace()
True
>>> s.istitle()
False
>>> ‘Welcome To Furzoom‘.istitle()
True
>>> s.isupper()
False
>>> ‘MN‘.isupper()
True
>>> ‘#‘.join([str(i) for i in range(10)])
‘0#1#2#3#4#5#6#7#8#9‘
>>> s.ljust(40)
‘welcome to visit furzoom.com            ‘
>>> s.ljust(40, ‘#‘)
‘welcome to visit furzoom.com############‘
>>> s.lower()
‘welcome to visit furzoom.com‘
>>> ss = s.center(40)
>>> ss
‘      welcome to visit furzoom.com      ‘
>>> ss.lstrip()
‘welcome to visit furzoom.com      ‘
>>> ss.lstrip(‘ we‘)
‘lcome to visit furzoom.com      ‘
>>> s.partition(‘om‘)
(‘welc‘, ‘om‘, ‘e to visit furzoom.com‘)
>>> s.partition(‘mn‘)
(‘welcome to visit furzoom.com‘, ‘‘, ‘‘)
>>> s.replace(‘o‘, ‘#‘)
‘welc#me t# visit furz##m.c#m‘
>>> s.replace(‘o‘, ‘#‘, 3)
‘welc#me t# visit furz#om.com‘
>>> s.rfind(‘o‘)
26
>>> s.rfind(‘o‘, 25)
26
>>> s.rfind(‘o‘, -3)
26
>>> s.rfind(‘o‘, -3, -20)
-1
>>> s.rfind(‘o‘, 5, 15)
9
>>> s.rindex(‘om‘)
26
>>> s.rjust(40)
‘            welcome to visit furzoom.com‘
>>> s.rjust(40, ‘#‘)
‘############welcome to visit furzoom.com‘
>>> s.rpartition(‘oom‘)
(‘welcome to visit furz‘, ‘oom‘, ‘.com‘)
>>> s.rsplit()
[‘welcome‘, ‘to‘, ‘visit‘, ‘furzoom.com‘]
>>> s.rsplit(‘ ‘, 2)
[‘welcome to‘, ‘visit‘, ‘furzoom.com‘]
>>> ss.rstrip()
‘      welcome to visit furzoom.com‘
>>> ss.rstrip(‘ m‘)
‘      welcome to visit furzoom.co‘
>>> ‘ab\n\nde fg\rhi\r\n‘.splitlines()
[‘ab‘, ‘‘, ‘de fg‘, ‘hi‘]
>>> ‘ab\n\nde fg\rhi\r\n‘.splitlines(True)
[‘ab\n‘, ‘\n‘, ‘de fg\r‘, ‘hi\r\n‘]
>>> ‘‘.splitlines()
[]
>>> ‘‘.split(‘\n‘)
[‘‘]
>>> ‘line\n‘.split(‘\n‘)
[‘line‘, ‘‘]
>>> ‘line\n‘.splitlines()
[‘line‘]
>>> s.startswith(‘wel‘)
True
>>> s.startswith(‘ ‘)
False
>>> ss.strip()
‘welcome to visit furzoom.com‘
>>> ss.strip(‘ wm‘)
‘elcome to visit furzoom.co‘
>>> s.swapcase()
‘WELCOME TO VISIT FURZOOM.COM‘
>>> s.title()
‘Welcome To Visit Furzoom.Com‘
>>> s.title().swapcase()
‘wELCOME tO vISIT fURZOOM.cOM‘
>>> s.translate(None, ‘aeiou‘)
‘wlcm t vst frzm.cm‘
>>> import string
>>> s.translate(string.maketrans(‘aeiou‘, ‘12345‘))
‘w2lc4m2 t4 v3s3t f5rz44m.c4m‘
>>> s.upper()
‘WELCOME TO VISIT FURZOOM.COM‘
>>> s.zfill(40)
‘000000000000welcome to visit furzoom.com‘

4. 字符串特有性质

4.1 转义字符

转义字符 十六进制
\0 0x00
\a 0x07
\b 0x08
\t 0x09
\n 0x0A
\v 0x0B
\f 0x0C
\r 0x0D
\e 0x1B
\” 0x22
\’ 0x27
\\ 0x5C
>>> print ‘aaa\b\bbb‘
abb
>>> print ‘aaaaaaa\rbbc‘
bbcaaaa

4.2 三引号

使用三引号,字符串可以包含换行符、制表符等其他特殊字符。常常在需要包含HTML和SQL语句时使用。

时间: 2024-10-27 05:36:41

Python序列——字符串的相关文章

Python——序列

#!/usr/bin/python #coding:utf8 ''' Python——序列 字符串的操作 ''' s = 'abcdefg' print s print s[2] print s[-1] print s[0:1] print s[-3:] ''' 开始下标位 结束下表位 隔一个取一个 ''' print s[0::2] print s[-3:-1:2] ''' 开始下标位 结束下表位 -2倒的取 隔一个取一个 ''' print s[::-2] 打印结果: abcdefgcgae

Python格式化字符串~转

Python格式化字符串 在编写程序的过程中,经常需要进行格式化输出,每次用每次查.干脆就在这里整理一下,以便索引. 格式化操作符(%) "%"是Python风格的字符串格式化操作符,非常类似C语言里的printf()函数的字符串格式化(C语言中也是使用%). 下面整理了一下Python中字符串格式化符合: 格式化符号 说明 %c 转换成字符(ASCII 码值,或者长度为一的字符串) %r 优先用repr()函数进行字符串转换 %s 优先用str()函数进行字符串转换 %d / %i

python之字符串

字符串与文本操作 字符串: Python 2和Python 3最大的差别就在于字符串 Python 2中字符串是byte的有序序列 Python 3中字符串是unicode的有序序列 字符串是不可变的 字符串支持下标与切片 # 证明字符串支持切片和下标 In [40]: s = 'hello world!' In [41]: s[0] Out[41]: 'h' In [42]: s[0:3] Out[42]: 'hel' In [43]: s[::-1] Out[43]: '!dlrow oll

Python&lt;3&gt;字符串基础

字符串是单个字符的字符串序列,有序字符的集合. Python允许字符串包括在双引号或单引号中(代表相同的东西). 序列操作 <1>索引 正向索引,反向索引 <2>分片 包括左边,不包括右边 左边默认为0,右边默认为len(str) 可以设置读取的间隔 <3>合并+.重复* 不可变性 创建后就不能被改变,不能对某一位置赋值 常用表达式 <1>str='' :空字符串 <2>str1.find(str2):返回子字符串的偏移量 <3>st

Python 序列操作符与函数

Python序列包括:元组.列表.字符串. 1.序列共同支持的函数: 函数 功能 说明 cmp(seq1,seq2) 比较序列大小 从左到右依次比较,直到比较出大小 len(seq1) 获取序列长度 如果seq1为字符串,返回字符串中字符数,否则返回序列中元素个数 max(seq1)或min(seq1)   求最大值或最小值 seq1字符串:返回字符串中ASCII码最大或最小的字符.也可比较序列中元素或多个序列 sorted(seq1) 按由小到大顺序排列   sum(seq1) 求和 对数字型

python学习笔记:python序列

python序列包括字符串.列表和元组三部分,下面先总的说一下python序列共有的一些操作符和内建函数. 一.python序列 序列类型操作符 标准类型的操作符一般都能适用于所有的序列类型,这里说一下序列类型操作符. 1. 成员关系操作符(in.not in) 成员关系操作符是用来判断一个元素是否属于一个序列的.具体语法: 对象 [not] in 序列 2. 连接操作符(+) 这个操作符允许我们把一个序列和另一个相同类型的序列做连接,具体语法: sequence1 +sequence2 3.

Python中字符串的使用

这篇文章主要介绍python当中用的非常多的一种内置类型——str.它属于python中的Sequnce Type(序列类型).python中一共7种序列类型,分别为str(字符串),unicode(u字符串),list(列表),tuple(元组),bytearray(字节数组),buffer(缓冲内存),xrange(范围).它们的通用操作如下: Operation Result x in s 判断x是否在s中 x not in s 判断x是不在s中 x + t 两个序列合并, 将t加到s之后

python 序列类型

1.不可变的序列类型:tuple.range.str.set 001:对于tuple 类型有如下几种构造方式 1.() 构造一个空的元组. 2.a | (a,) 构造一个只有一个元素的元组. 3.tuple('1') 使用内置的tuple方法构造. 4.(1,2,3) 使用字面值的方法来构造一个元组. 002:对于range就没有这么多的花样了,只有一个构造方法可用 range(起始索引,结束索引,步长) 003:str 也没有太多的花样:它主要用字面值来构造,这些字面值可以用单引号,双引号,三

Python序列

(1)序列(数据结构的一种)的操作 1.索引(排序的编号) 2.分片 3.序列相加 4.乘法 5.包含 6.获取长度.最小值.最大值 ------------------------数据结构:通过某种方式组织在一起的数据元素的集合内建序列:列表和元组,字符串,Unicode字符串,Buffer对象,xrange对象------------------------ 1.索引(排序的编号): 列表索引: 用[]扣起来表示列表,只要把逗号分隔的不同的数据项使用方括号括起来即可, edwrad=['Ed