将字符串分片

RegexObject 的 split() 方法在 RE 匹配的地方将字符串分片,将返回列表。它同字符串的 split() 方法相似但提供更多的定界符;split()只支持空白符和固定字符串。就象你预料的那样,也有一个模块级的 re.split() 函数。

split(string [, maxsplit = 0])

通过正则表达式将字符串分片。如果捕获括号在 RE 中使用,那么它们的内容也会作为结果列表的一部分返回。如果 maxsplit 非零,那么最多只能分出 maxsplit 个分片。

你可以通过设置 maxsplit 值来限制分片数。当 maxsplit 非零时,最多只能有 maxsplit 个分片,字符串的其余部分被做为列表的最后部分返回。在下面的例子中,定界符可以是非数字字母字符的任意序列。

#!python
>>> p = re.compile(r‘\W+‘)
>>> p.split(‘This is a test, short and sweet, of split().‘)
[‘This‘, ‘is‘, ‘a‘, ‘test‘, ‘short‘, ‘and‘, ‘sweet‘, ‘of‘, ‘split‘, ‘‘]
>>> p.split(‘This is a test, short and sweet, of split().‘, 3)
[‘This‘, ‘is‘, ‘a‘, ‘test, short and sweet, of split().‘]

有时,你不仅对定界符之间的文本感兴趣,也需要知道定界符是什么。如果捕获括号在 RE 中使用,那么它们的值也会当作列表的一部分返回。比较下面的调用:

#!python
>>> p = re.compile(r‘\W+‘)
>>> p2 = re.compile(r‘(\W+)‘)
>>> p.split(‘This... is a test.‘)
[‘This‘, ‘is‘, ‘a‘, ‘test‘, ‘‘]
>>> p2.split(‘This... is a test.‘)
[‘This‘, ‘... ‘, ‘is‘, ‘ ‘, ‘a‘, ‘ ‘, ‘test‘, ‘.‘, ‘‘]

模块级函数 re.split() 将 RE 作为第一个参数,其他一样。

#!python
>>> re.split(‘[\W]+‘, ‘Words, words, words.‘)
[‘Words‘, ‘words‘, ‘words‘, ‘‘]
>>> re.split(‘([\W]+)‘, ‘Words, words, words.‘)
[‘Words‘, ‘, ‘, ‘words‘, ‘, ‘, ‘words‘, ‘.‘, ‘‘]
>>> re.split(‘[\W]+‘, ‘Words, words, words.‘, 1)
[‘Words‘, ‘words, words.‘]
时间: 2024-10-12 16:58:58

将字符串分片的相关文章

python字符串编码

http://blog.csdn.net/pipisorry/article/details/44136297 文本,他们通常指显示在屏幕上的字符或者其他的记号:但是计算机不能直接处理这些字符和标记:它们只认识位(bit)和字节(byte).实际上,从屏幕上的每一块文本都是以某种字符编码(character encoding)的方式保存的.粗略地说就是,字符编码提供一种映射,使屏幕上显示的内容和内存.磁盘内存储的内容对应起来.有许多种不同的字符编码,有一些是为特定的语言,比如俄语.中文或者英语,

No.2 字符串的基本用法

之前讲到变量的时候,有些变量被进行了不同形式的赋值.你可以在IDE中进行下面的编写: num = 1 string = '1' print(num + string) 就会得到如下的结果 Traceback (most recent call last): File "F:/PycharmPrograme/StringDemo.py", line 3, in <module> print(num + string) TypeError: unsupported operan

Python学习笔记1—Python字符串

字符串是python中重要的数据对象 python字符串是以单引号.双引号.或者三个三单引号三个双引号包含的任意的python数据对象都可以称为python字符串 注意以单引号或双引号包含的数据对象中间不可以换行(若需要换行需要用转义字符\n)以三个单引号或三个双引号可以包含多行的数据对象. 一.转义符 在任何的语言里都有转义符这样的概念存在转义符是让含有特殊意义的字符失去特殊的意义按照普通的形式打印. 例如我们需要打印出某个文件的路径 print 'c:\note\takes.txt' 执行结

Python 数据类型之字符串

格式化字符串 参数替换(类的对象,方法调用,返回一个字符串) >>> username = 'root' >>> password = 'foxconn168!' >>> "{0}'s password is {1}".format(username,password) --> 类的对象方法调用 "root's password is foxconn168!" --> 返回一个字符串 复合字段名 使用

python(一)字符串

python字符串.字符串处理函数及字符串相关操作 字符串介绍 python字符串表示 Python除处理数字外还可以处理字符串,字符串用单撇号或双撇号包裹: >>> 'spam eggs' 'spam eggs' >>> 'doesn/'t' "doesn't" >>> "doesn't" "doesn't" >>> '"Yes," he said.'

30 字符串的基本操作 格式化字符串(%,Template类,format方法*****)

Python视频课程(5)-Python字符串 第一课 字符串的基本操作 # 字符串:基本操作 字符串取单个字母 s1 = "I love python." print(s1[7]) # p print(s1[11]) # o # print(s1[15]) # 超过字符串长度 会报错 # 利用分片截取字符串的子字符串 取一段区间的字符串 print(s1[7:13]) # python print(s1[7:]) # python. print(s1[::2]) # Ilv yhn

python学习-day2

列表: 1.找出某个元素有多少个 字符串: 1.字符串去除空格 .strip() username = input("user:") if username.strip() == 'alex': print("welcom") 2.字符串分隔 split() 分隔后是一个列表 names = "alex,jack,rain" name2 = names.split(",") #split()默认是以空格 print("

Python正则表达式操作指南

摘要 本文是通过Python的 re 模块来使用正则表达式的一个入门教程,和库参考手册的对应章节相比,更为浅显易懂.循序渐进. 本文可以从 http://www.amk.ca/python/howto 捕获 目录 目录 [隐藏] 1 简介 2 简单模式 2.1 字符匹配 2.2 重复 3 使用正则表达式 3.1 编译正则表达式 3.2 反斜杠的麻烦 3.3 执行匹配 3.4 模块级函数 3.5 编译标志 4 更多模式功能 4.1 更多的元字符 4.2 分组 4.3 无捕获组和命名组 4.4 前向

python小程序(模拟用户登陆系统)

模拟登陆1.用户输入账号密码进行登陆2.用户信息存在文件内3.用户密码输错三次后锁定用户 知识点:strip().split().while.for循环混用以及布尔值的使用 strip()  方法用于移除字符串头尾指定的字符(默认为空格) 实例1: >> str = "0000000this is string example....wow!!!0000000"; >> print str.strip( '0' ); this is string example