一 使用beautifulSoup 解析网页
Soup = BeantifulSoup(html,‘lxml‘)
二 描述需要爬取的东西在哪?
= Soup.select(‘???‘)
三 从标签中获得你要的信息
<p>Something</p> 去掉标签,并放到数据容器中。
title.get_text() > Something
title.tripped_strings>获取title目录下,所有标签。
python 可以做列表》list(title.tripped_strings)
{title = Something ; rate = 4.0}
时间: 2024-10-25 15:28:16