python爬虫笔记_列表操作

列表是Python中最基本的数据结构,列表是最常用的Python数据类型,列表的数据项不需要具有相同的类型。列表中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。
Python有6个序列的内置类型,但最常见的是列表和元组。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。

一、创建一个列表
只要把逗号分隔的不同的数据项使用方括号括起来即可。如下所示:

list1 = [‘physics‘, ‘chemistry‘, 1997, 2000];
list2 = [1, 2, 3, 4, 5 ];
list3 = ["a", "b", "c", "d"];

与字符串的索引一样,列表索引从0开始。列表可以进行截取、组合等。
二、访问列表中的值
使用下标索引来访问列表中的值,同样你也可以使用方括号的形式截取字符,如下所示:

#!/usr/bin/python

list1 = [‘physics‘, ‘chemistry‘, 1997, 2000];
list2 = [1, 2, 3, 4, 5, 6, 7 ];

print "list1[0]: ", list1[0]
print "list2[1:5]: ", list2[1:5]

以上实例的输出结果:
list1[0]:  physics
list2[1:5]:  [2, 3, 4, 5]

三、更新列表
你可以对列表的数据项进行修改或更新,你也可以使用append()方法来添加列表项,如下所示:

#!/usr/bin/python

list = [‘physics‘, ‘chemistry‘, 1997, 2000];
print "Value available at index 2 : "
print list[2];
list[2] = 2001;
print "New value available at index 2 : "
print list[2];

以上实例的输出结果是:

Value available at index 2 :
1997
New value available at index 2 :
2001

使用append()方法来添加列表项

>>> s=[‘physics‘,‘chemistry‘]
>>> s.append("wangtao")
>>> s
[‘physics‘, ‘chemistry‘, ‘wangtao‘]

四、删除列表元素
可以使用 del 语句来删除列表的的元素,如下实例:

#!/usr/bin/python

list1 = [‘physics‘, ‘chemistry‘, 1997, 2000];
print list1;
del list1[2];
print "After deleting value at index 2 : "
print list1;

以上实例的输出结果是:

[‘physics‘, ‘chemistry‘, 1997, 2000]
After deleting value at index 2 :
[‘physics‘, ‘chemistry‘, 2000]

五、Python列表脚本操作符
列表对 + 和 * 的操作符与字符串相似。+ 号用于组合列表,* 号用于重复列表。

如下所示:

Python 表达式 结果 描述
len([1, 2, 3]) 3 长度
[1, 2, 3] + [4, 5, 6] [1, 2, 3, 4, 5, 6] 组合
[‘Hi!‘] * 4 [‘Hi!‘, ‘Hi!‘, ‘Hi!‘, ‘Hi!‘] 重复
3 in [1, 2, 3] True 元素是否存在于列表中
for x in [1, 2, 3]: print x, 1 2 3 迭代

六、Python列表截取
Python的列表截取与字符串操作类型,如下所示:

L = [‘spam‘, ‘Spam‘, ‘SPAM!‘]

操作:

Python 表达式 结果 描述
L[2] ‘SPAM!‘ 读取列表中第三个元素
L[-2] ‘Spam‘ 读取列表中倒数第二个元素
L[1:] [‘Spam‘, ‘SPAM!‘] 从第二个元素开始截取列表

七、Python列表操作的函数和方法
列表操作包含以下函数:
1、cmp(list1, list2):比较两个列表的元素 
2、len(list):列表元素个数 
3、max(list):返回列表元素最大值 
4、min(list):返回列表元素最小值 
5、list(seq):将元组转换为列表 
列表操作包含以下方法:
1、list.append(obj):在列表末尾添加新的对象
2、list.count(obj):统计某个元素在列表中出现的次数
3、list.extend(seq):在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)
4、list.index(obj):从列表中找出某个值第一个匹配项的索引位置
5、list.insert(index, obj):将对象插入列表
6、list.pop(obj=list[-1]):移除列表中的一个元素(默认最后一个元素),并且返回该元素的值
7、list.remove(obj):移除列表中某个值的第一个匹配项
8、list.reverse():反向列表中元素
9、list.sort([func]):对原列表进行排序

八、extend() 函数用于在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)

#!/usr/bin/python

aList = [123, ‘xyz‘, ‘zara‘, ‘abc‘, 123];
bList = [2009, ‘manni‘];
aList.extend(bList)

print "Extended List : ", aList ;

以上实验的输出结果:

$ python extend.py
Extended List: [123, ‘xyz‘, ‘zara‘, ‘abc‘, 123, 2009, ‘manni‘]
时间: 2024-10-08 00:57:40

python爬虫笔记_列表操作的相关文章

Python学习笔记3_列表操作

1.1   遍历整个列表 需要对列表中的每个元素都执行相同的操作时,可使用Python中的for循环. 如,让Python从列表magicians中取出一个名字,并将其存储在变量magician中. magicians = ['alice', 'david', 'carolina'] for magician in magicians: # Need spaces print(magician)    for magician in magicians: 让Python获取列表magicians

python开发基础:列表操作

一,列表操作 1 #!/usr/bin/env python 2 #_*_coding:utf-8_*_ 3 4 # l=[1,2,3] #l=list([1,2,3]) 5 # print(type(l)) 6 7 #pat1===>优先掌握部分 8 # 索引 9 # 10 # 切片 11 # l=['a','b','c','d','e','f'] 12 13 # print(l[1:5]) 14 # print(l[1:5:2]) 15 # print(l[2:5]) 16 # print(

python学习笔记之列表、元组、字典(1)

1.最基本的数据结构:序列 a.任何序列都是从 0 序列号(也成为索引)开始的: 如下:第一个元素是‘H’ >>> a = 'Hello'>>> a[0]'H' b.序列的操作: 分片:a[1:5]  #表示从第2个元素到第6个元素,但不包括第6个元素 a[-3:-1] #表示从倒数第3个元素到倒数第一个元素,但不包括倒数第一个元素 a[-3:]   #表示从倒数第三个元素到最后一个元素,可以取到最后一个元素 a[:]  #表示a的全部元素 a[1:9:2]  #表示从

python学习笔记2——列表

1.列表简介 列表 由一系列按特定顺序排列的元素组成. 你可以创建包含字母表中所有字母. 数字0~9或所有家庭成员姓名的列表: 也可以将任何东西加入列表中, 其中的元素之间可以没有任何关系. 鉴于列表通常包含多个元素, 给列表指定一个表示复数的名称(如letters . digits 或names ) 是个不错的主意. 在Python中, 用方括号([] ) 来表示列表, 并用逗号来分隔其中的元素. 下面是一个简单的列表示例, 这个列表包含几种自行车:  bicycles = ['trek',

Python学习笔记2_列表简介

1.1   列表是什么 在Python中,用方括号([])来表示列表,并用逗号来分隔其中的元素. 列表是有序集合,因此要访问列表的任何元素,只需将该元素的位置或索引告诉Python即可.Python为访问最后一个列表元素提供了一种特殊语法.通过将索引指定为-1,可让Python返回最后一个列表元素: bicycles = ['trek', 'cannondale', 'redline', 'specialized'] print(bicycles) print(bicycles[0]) prin

Python 爬虫的工具列表

这个列表包含与网页抓取和数据处理的Python库 网络 通用 urllib -网络库(stdlib). requests -网络库. grab - 网络库(基于pycurl). pycurl - 网络库(绑定libcurl). urllib3 - Python HTTP库,安全连接池.支持文件post.可用性高. httplib2 - 网络库. RoboBrowser - 一个简单的.极具Python风格的Python库,无需独立的浏览器即可浏览网页. MechanicalSoup -一个与网站

Python_03_字符串_数据类型_for循环_列表操作

个人笔记,仅作学习记录,如有错误烦请指正 字符串: str1 = "这是一个字符串" str2 = '这也是一个字符串' 一般字符串都需要用双引号或单引号引起来 在Python中双引号和单引号是一样的,但必须成对出现 msg = "i'm liming" # 此处因为字符串中包含单引号,所以外边用双引号引起来表示字符串内容 msg = """收到消息"i'm liming".""" #

Python 爬虫的工具列表 附Github代码下载链接

这个列表包含与网页抓取和数据处理的Python库 网络 通用 urllib -网络库(stdlib). requests -网络库. grab – 网络库(基于pycurl). pycurl – 网络库(绑定libcurl). urllib3 – Python HTTP库,安全连接池.支持文件post.可用性高. httplib2 – 网络库. RoboBrowser – 一个简单的.极具Python风格的Python库,无需独立的浏览器即可浏览网页. MechanicalSoup -一个与网站

Python学习笔记-Day3-set集合操作

set集合,是一个无序且不重复的元素集合.定义方式类似字典使用{}创建 目前我们学过的数据类型: 1.字符串(str),2.整型(int),3.浮点型(float),4,列表(list) 5.元组(tuple),6.字典(dict),7.集合(set),8.布尔型(bool) 1.集合创建 2.集合操作   2.1 set.add 添加元素 往set中添加一个元素只有set中不存在该元素时,才会加入该元素   2.2 set.clear 清空所有元素 从set中移除所有元素   2.3 set.