取百度首页链接文字

from selenium import webdriver
import time
b=webdriver.Ie()
b.implicitly_wait(10)
b.get(‘www.baidu.com‘)
e2=b.find_element_by_id(‘u1‘)
list1=e2.find_elements_by_tag_name(‘a‘)
for i in list1:print(i.text,i.get_attribute("href"))

原文地址:https://www.cnblogs.com/dengpeiyou/p/9242612.html

时间: 2024-10-18 00:03:12

取百度首页链接文字的相关文章

java爬取百度首页源代码

爬虫感觉挺有意思的,写一个最简单的抓取百度首页html代码的程序.虽然简单了一点,后期会加深的. 1 package test; 2 3 import java.io.BufferedReader; 4 import java.io.InputStreamReader; 5 import java.net.URL; 6 import java.net.URLConnection; 7 8 public class Main 9 { 10 public static void main(Strin

几行代码抓取百度首页

python中源码位置(以urllib为例):    python中自带的模块:        /usr/lib/python3.5/urllib/request.py(python3)        /usr/lib/python2.7/urllib2.py(python2)    python的第三方模块:        /usr/local/lib/python2.7/site-packages/ 注意:关于urllib模块,python3中的导入方法为import urllib.requ

java爬取百度首页logo

两个方法 一个获得Url的网页源代码getUrlContentString,另外一个从源代码中得到想要的地址片段,其中需要用到正则表达式去匹配 得到网页源代码的过程: 地址为string,将地址转换为java中的url对象 url的openConnection方法返回urlConnection urlConnection的connect方法建立连接 新建一个InputStreamReader对象,其中InputStreamReader的构建需要InputStream输入流对象,而URLConne

仿百度首页并实现搜索功能

学了html和css之后没有做过什么大的项目,没有什么项目经验,所以决定从小的项目做起,然后做大的项目,循序渐进,增加自己的项目经历和增强自己的动手能力. 百度首页没有特别多的东西,所以仿起来比较容易,但是要做到完全一模一样还是要花费一些功夫的. 一 做一些准备工作: 1 编辑器:webstorm,浏览器:Chrome; 2 利用Chrome的Image downloader插件抓取百度首页的图片,作为素材. 3编程实现 二 项目的文件结构 百度首页 .├── css│   └── index.

Selenium2学习-009-WebUI自动化实战实例-007-Selenium 8种元素定位实战实例源代码(百度首页搜索录入框及登录链接)

此 文主要讲述用 Java 编写 Selenium 自动化测试脚本编写过程中,通过 ID.name.xpath.cssSelector.linkText.className.partialLinkText.tagName 的实战实例源代码演示 Selenium 元素定位的 8 种方法,源代码测试通过日期为:2015-01-26 00:18,请知悉.注意:其中通过 tagName 定位元素时,返回的是一个 WebElement 的数组,需要根据实际的测试需求对其进行进一步的处理. 希望能对初学 S

爬取唯品会首页商品分类及链接

很久之前做的东西.一直没时间分享,今天有空正好分享出来. 想做个爬取唯品会首页的商品分类和链接的脚本.第一反应是用BeautifulSoup.但是在浏览器里调试了很久没有发现链接,无奈只能放弃了使用BeautifulSoup. 尝试了抓包,我们看看下面是抓到的包: 通过多次的抓取,终于抓到了两个接口.然后点击查看两个接口中我们抓到的headers 我们可以很清楚的看到,两个接口除了ids这个字段的值不一样,其他的东西都是一样的.我们可以双击打开这两个接口,就会发现里面返回的内容正好是我们想要的东

如何不给花一分钱,关键词怎么霸屏百度首页?

如何不给花一分钱,关键词怎么霸屏百度首页?先不废话,上几个图给大家看看! 这是如何做到的呢? 第一招:搜狐自媒体 不论百度指数是几十还几百上千的关键词,都可以做到首页,不光收录快,而且还可带链接,百度指数100左右的基本上可以做到百度首页. 1.首先要申请一个搜狐自媒体,用公司营业执照申请比较容易,如果个人申请,如果在其它自媒体上有自己的帐号,申请也相对比较容易,如果没有自媒体卡号,可以在猪八戒网上找人写原创文章,然后建立QQ空间.博客等其它自媒体,然后再提交申请. 2.尽量写原创和伪原创文章,

关键词进百度首页几点重要素

我们发布信息大家都知道,一个好的信息即:看你如何十分好的把要害字融入进入,以及要害字加粗等,可是否晓得为何要这样? 这要从蜘蛛抓取的原理来解释了. 蜘蛛匍匐主要是通过三个过程: 1)匍匐和抓取, 2)预处置, 3)排行. 其间预处置中有一步适当要害,那即是"有关性".我的了解即是你在查找框中输入要害字,显示出来的页面也即是与这个要害字有关.信息越有关,排行比他人就越靠前,当然这也跟许多的要素有联络的. 那有关性与那些要素有联络呢?最主要的有五点,也即是说咱们发布信息为何要这样做的缘由?

python3 爬虫学习-根据关键词爬取百度百科内容

小白编了好久才写出来,记录一下免得之后再用的时候都忘了还得重新学~ 学习爬虫最开始是学习了慕课上的python课程,然后学习了慕课和网易云上的爬虫教程.这两个自己去查一下就好了~ 开始还比较费劲,毕竟熟悉需要时间么,而且python也不太熟悉. 关于python版本:我一开始看很多资料说python2比较好,因为很多库还不支持3,但是使用到现在为止觉得还是pythin3比较好用,因为编码什么的问题,觉得2还是没有3方便.而且在网上找到的2中的一些资料稍微改一下也还是可以用. 好了,开始说爬百度百