python中BeautifulSoup库中find函数

http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html#contents

简单的用法:

find(nameattrsrecursivetext**kwargs)

好了,我们现在看看其他的搜索方法。他们都是有和 findAll 几乎一样的参数。

find方法是最接近findAll的函数, 只是它并不会获得所有的匹配对象,它仅仅返回找到第一个可匹配对象。 也就是说,它相当于limit参数为1的结果集。 以上面的 文档为例:

soup.findAll(‘p‘, limit=1)
#[<p id="firstpara" align="center">This is paragraph <b>one</b>.</p>]

soup.find(‘p‘, limit=1)
#<p id="firstpara" align="center">This is paragraph <b>one</b>.</p>

soup.find(‘nosuchtag‘, limit=1) == None
#True

通常,当你看到一个搜索方法的名字由复数构成 (如findAllfindNextSiblings)时, 这个方法就会存在limit参数,并返回一个list的结果。但你 看到的方法不是复数形式(如findfindNextSibling)时, 你就可以知道这函数没有limit参数且返回值是单一的结果。

这里面常用的有 find(‘div‘, {‘class‘:‘nums‘}) 这种找法,要直接获得内容在找到的词条用 .text() 即可获得内容

时间: 2024-10-29 11:53:06

python中BeautifulSoup库中find函数的相关文章

Lua中字符串库中的几个重点函数

前言 在<Lua中的一些库>中也说道了,要对string库的模式匹配进行单独的讲解.对于字符串的处理,对于任何语言的学习来说,都是一个难点,而且也是一个必会的知识点.给你一个字符串,让你按照某种需求进行处理,你不会,那是多么尴尬的一件事情.所以,看完<Lua中的一些库>和这篇文章之后,我争取做到让你在处理字符串时,不再感到捉襟见肘,不再尴尬. 说到Lua中的模式匹配,基本上就是围绕着以下几个函数展开的: find match gsub gmatch 我的总结也就是围绕着上面的四个函

Python初探——sklearn库中数据预处理函数fit_transform()和transform()的区别

敲<Python机器学习及实践>上的code的时候,对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊,查阅了很多资料,这里整理一下: # 从sklearn.preprocessing导入StandardScaler from sklearn.preprocessing import StandardScaler # 标准化数据,保证每个维度的特征数据方差为1,均值为0,使得预测结果不会被某些维度过大的特征值而主导 ss = Standard

Oracle Dataguard中备库中归档日志不同步

环境:RAC+单机 Dataguard问题:启动备库到ADG模式时,发现后台归档日志并不同步 1.在备库中发现日志的归档日志不同步,内容如下:MRP0: Background Media Recovery process shutdown (strac)Managed Standby Recovery Canceled (strac)Completed: alter database recover managed standby database cancelSun Mar 04 16:35:

Python 安装第三方库中常见问题总结

1.安装某个库时,例如 pip install tinify 出现Permission denied时,在安装命令的最前面添加sudo 例如: sudo pip install tinify 即可. 2.安装某个库时,例如sudo pip install click 出现  Read timed out时,把安装命令变为 sudo pip --default-timeout=100 install -U click 即可. 持续更新中.......... ====================

Python的numpy库中rand(),randn(),randint(),random_integers()的使用

1.numpy.random.rand() 用法是:numpy.random.rand(d0,d1,-dn) 以给定的形状创建一个数组,并在数组中加入在[0,1]之间均匀分布的随机样本. 用法及实现: >>> np.random.rand(3,2) array([[ 0.14022471, 0.96360618], #random [ 0.37601032, 0.25528411], #random [ 0.49313049, 0.94909878]]) #random >>

python中json库中的load、loads、dump、dumps的区别与用法

一.json.dumps(i): json中的dumps方法是用来将特定格式的数据进行字符串化的操作,比如列表字典都可以进行字符串化操作然后写入json的file:而且如果是要写入json文件就必须要进行dumps操作: 二.json.dump(): 和dumps差一个s,功能作用大致上是一样,也是讲数据转换成str格式,最终包括了讲数据写入json文件的一个操作步骤,json.dump(data, file-open,ascii=False),可以包含三个属性,第三个ascii是用来避免出现u

BeautifulSoup库之find_all函数

BeautifulSoup将复杂的HTML文档转换成一个复杂的树形结构.每个节点都是Python对象.所有对象可以归纳为四种:Tag , NavigableString , BeautifulSoup , Comment . 1.Tag对象最重要的属性:Name:标签的名字:attributes:属性(用class指代) 2.BeautifulSoup 对象表示的是一个文档的全部内容.大部分时候,可以把它当作 Tag 对象,它支持 遍历文档树 和 搜索文档树 中描述的大部分的方法.因为 Beau

【问题解决方案】GitHub的md中使用库中图片

参考链接: 在GitHub中使用图片功能 步骤: 在github上的仓库建立一个存放图片的文件夹,文件夹名字随意.如:image 将需要在插入到文本中的图片,push到image文件夹中. 然后打开github官网,进入仓库的image文件夹中,打开图片,点download,复制网址的链接(注意网址第一段) 在README.md中填入: ![Image text](填上你复制的地址即可) 保存即可. END 原文地址:https://www.cnblogs.com/anliux/p/114951

python 科学计算库NumPy—tile函数

在学习knn分类算法的过程中用到了tile函数,有诸多的不理解,记录下来此函数的用法.   函数原型:numpy.tile(A,reps) #简单理解是此函数将A进行重复输出 其中A和reps都是array_like的参数,A可以是:array,list,tuple,dict,matrix以及基本数据类型int,string,float以及bool类型,reps的类型可以是tuple,list,dict,array,int,bool,但不可以是float,string,matrix类型. 计较常