bs4 库 BeautifulSoup类:
1. bs4 库 :
定义: bs4 库 是用来解析 遍历 维护 html (标签树) 的功能库
2 . bs4 库的引用,导入:
3 BeautifulSoup 类:
soup=BeautifulSoup(content,‘html.parser‘) # 实例化对象 | content是内容 | ‘html.parser‘ 是解析器
import requestsfrom bs4 import BeautifulSoup url=‘http://www.bilibili.com/video/av9784617/index_56.html#page=22‘try: r=requests.get(url) r.raise_for_status() r.encoding=r.apparent_encoding content=r.text[:500]except: print(‘Error!‘) soup=BeautifulSoup(‘‘,‘html.parser‘) # 实例化 soup 对象 | content是内容 ‘html.parser‘ 是解析器 print(soup.head.prettify())
4 bs库的遍历 :
时间: 2024-11-11 06:06:47