selenium获取文本

# 标题list_title = driver.find_elements_by_xpath(‘//*[@id="share-content"]/div/div[1]/ul/li/h3/a‘)print(list_title)# 用selenium + xpath 抓取网页数据,上述代码返回的是列表类型,打印出来是:[<selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-1")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-2")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-3")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-4")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-5")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-6")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-7")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-8")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-9")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-10")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-11")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-12")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-13")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-14")>, <selenium.webdriver.remote.webelement.WebElement (session="35b2fa1b1832c956eb1f9d06cc3a1997", element="0.02111220449086315-15")>]
for i in list_title:    print(type(i))

显示结果:<class ‘selenium.webdriver.remote.webelement.WebElement‘>

抓取到的信息不能以中文形式显示出来,一时间陷入了怎么去编码解码解决这类型的代码,在网上找了好多方法去试,结果都报错,翻看笔记,原来这个方法很简单!!
for i in list_title:    print(i.text)把列表遍历,.text方法即可得到想要的文本内容。与xpath中的text()又不一样。

1.从定位到的元素中获取数据

el.get_attribute(key)            获取key属性名对应的属性值
    el.text                        获取开闭标签之间的文本内容
       
    1.对定位到的元素的操作
    el.click()                        对元素执行点击操作


el.submit()                      对元素执行提交操作


el.clear()                        清空可输入元素中的数据


el.send_keys(data)               向可输入元素输入数据



原文地址:https://www.cnblogs.com/lutt/p/10181799.html

时间: 2024-10-10 11:04:49

selenium获取文本的相关文章

selenium 获取table数据

public class Table { /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub WebDriver driver = ExplorerBase.IESetting(); String url = "http://zs.njust.edu.cn/newzs/news/zhxw/20140710151805.htm"; driver.m

python+selenium获取禅道所有Bug标题

前言: 对于一组很多的数据,一个页面加载不完,需要分页加载,比如禅道的Bug数,一页默认是20个(自己可以根据需求更改),这时就有了第二页,第三页等等. 这时如果要获取所有的Bug标题来怎么做呢? 点击下一页Bug,你会发现url的变化,就只有最后一个数字改变,如下图: 大体思路: 获取所有url→ddt驱动获取每一页的数据 步骤: 第一步:获取所有url 这里已经显示了总共有几页和当前所在的页面数,我们要获取的就后面的数字 '3'. 先定位到这个元素,在通过正则取出后面的 '3',具体代码如下

selenium获取元素内容,iframe切换,和常用方法

获取元素信息 1. text 属性,显示该元素在web页面显示出来的文本内容 2. get_attribute方法 获取某个属性的值: element.get_attribute(元素属性) element.get_attribute('href') element.get_attribute('style') 获取该元素对应HTML源代码: element.get_attribute('outerHTML') 获取该元素的内部部分的HTML源代码: element.get_attribute(

JavaScript获取文本框value

<html> <head> <title>获取文本框中的value</title> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <script language="javascript"> function getUsername(){ //思路:获取文本框节点:获取文本框节点的val

JS动态生成Input文本框 并获取文本框值

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns= "http://www.w3.org/1999/xhtml" > <head> <meta http-equiv= "Conte

JS获取文本框值

一.获取文本框/编辑框/隐藏域框 <script type="text/javascript">function Mycheck(){  var checkstr="获取内容如下:\n";  if (document.form1.文章作者.value != ""){     checkstr+="作者名称:"+document.form1.文章作者.value+"\n";  }  if (doc

&lt;html:option获取文本值

<p class="w120">变更后IP:</p> <div class="comBobox w200 f_l"> <html:select name="ITSM_J_EQUIPMENT_CHANGE/CHANGE_IP_INSTANCEID" style="width:100%" attributesText=" eos_isnull='false' eos_displa

JS获取文本节点

1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> 2 <html> 3 <head> 4 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> 5 <titl

js/jquery获取文本框的值与改变文本框的值

我们就用它来学习获取文本框的值及改变文本框的值. 代码如下 复制代码 <script>function get1(){ document.getElementById("txtbox2").value=document.getElementById("txtbox").value; //获取文本框1的值,并赋值给文本框2}</script> <table width="500" border="0"