原文网址:https://blog.csdn.net/u010244522/article/details/79627073
从网页获取HTML数据后,获取对应标签、属性的值
取值方法主要有以下几种:
1.通过标签名(tag)获取: tag.name tag对应的type是<class ‘bs4.element.Tag‘>
2.通过属性(attrs)获取:tag.attrs
通过标签属性获取: tag["class"] 或 tag.get("class")
获取对应的内容
1. tag.string 获取当前标签的内容
2. tag.get_text() 获取标签内所有的字符串
查找相应的内容
1.find_all(class_="class") 返回的是多个标签,格式为<class ‘bs4.element.ResultSet‘>
2.find(class_="class") 返回一个标签,格式是<class ‘bs4.element.Tag‘>
3.select_one() 返回一个标签,格式是<class ‘bs4.element.Tag‘>
4.select() 返回的是多个标签,格式为<class ‘bs4.element.ResultSet‘>
1和4是返回组标签(就算只有一个标签也是一组)
取值时需要先定位,定位是list(ResultSet)中的那个标签在取值
tag[0].string
使用 find_all() 不带条件查找,tag[0]["class"].string
原文地址:https://www.cnblogs.com/moying-wq/p/10050720.html
时间: 2024-10-10 12:38:30