Beautifulsoup4模块
简称BS4
from bs4 import BeautifulSoup soup = BeautifulSoup(content,‘html.parser‘) #1.生成一个BeautifulSoup对象 for tag in soup.find_all(): #针对script标签 应该直接删除 if tag.name == ‘script‘: tag.decompose() #将符合条件的标签删除 desc = soup.text[0:150] #截取文章简介 150个文本内容
原文地址:https://www.cnblogs.com/s686zhou/p/11625956.html
时间: 2024-10-25 08:59:48