--数据解析原理
--定位标签
--提取标签中存储的数据
--xpath解析原理
--实例化一个etree的对象且将解析的页面源码数据加载到该对象中
--通过xpath方法(返回值:列表)结合者xpath表达式进行数据解析
-- //tagName
-- //tagName[@attr = ‘value‘]
-- //tagName[index]
-- /text() //text()
-- /@attrName
--bs4解析原理
--实例化一个bs4的对象且将解析的页面源码数据加载到该对象中
--通过相关的方法和属性进行数据解析
-- soup.tagName
-- soup.find(‘tagName‘, attrName = ‘value‘) <==> find_all()
-- select(‘css选择器‘) //标签, 类, id, 层级
-- string,text,get_text()
-- tag[‘attrName‘]
原文地址:https://www.cnblogs.com/helloboke/p/11504150.html
时间: 2024-10-01 11:08:14