Python+Selenium获取百度联系我们页面的email列表

#coding=utf-8

from selenium import webdriver
import re

driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)

driver.get("http://home.baidu.com/contact.html")
# 得到页面源代码
doc = driver.page_source
emails = re.findall(r‘[\w][email protected][\w\.-]+‘,doc) # 利用正则,找出 [email protected] 的字段,保存到emails列表
# 循环打印匹配的邮箱
for email in list(set(emails)):
print (email)

driver.close()

时间: 2024-10-02 22:42:39

Python+Selenium获取百度联系我们页面的email列表的相关文章

将ECSHOP会员注册页面的Email修改成非必填项

将ECSHOP会员注册页面的Email修改成非必填项 ECSHOP教程/ ecshop教程网(www.ecshop119.com) 2011-07-29 有人说,在后台的 “会员注册项设置 ”里面不是可以控制是否必填吗??我就碰到好几个人这么说过.其实是他看问题不认真,这里说的是“将会员注册页面的email修改成非必填项”,注意是 email , 那个"会员注册项设置"里是不包括EMAIL的 闲话少叙,下面就来说一下方法,注意此方法是在Ecshop2.7.2版上修改的,针对以前版本的修

将会员注册页面的Email修改成非必填项(ecshop2.7.2版)

"将ECSHOP会员注册页面的email修改成非必填项",注意是 email , 那个"会员注册项设置"里是不包括EMAIL的 闲话少叙,下面就来说一下方法, 注意此方法是在官方默认模板上修改的 1). 首先来修改模板文件, 这里以官方默认模板为例 打开 /themes/default/user_passport.dwt 文件 找到 onblur="checkEmail(this.value);" 将其删除,继续向下找到 <span id=

[Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒

前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒,同样可以通过Spider获取网站内容,最近学习了Selenium+Phantomjs后,准备利用它们获取百度百科的旅游景点消息盒(InfoBox),这也是毕业设计实体对齐和属性的对齐的语料库前期准备工作.希望文章对你有所帮助~ 源代码 1 # coding=utf-8 2 """ 3 Created on 2015-09-04 @author: Eastmount 4 """ 5

用python+selenium从百度获取本地明日的天气信息并根据温度情况邮件提醒

从百度天气获取当地明天的天气情况,如果明天下雨,请发送邮件通知全体同事带伞, 如果明天气温低于10度,请邮件提醒同事注意保暖,如果气温高于30度则提醒同事注意高温. 假设存在发送邮件的方法self.send_email(email_content) 代码如下: #coding=utf-8 from selenium import webdriver import unittest from time import sleep class WeatherReport(unittest.TestCa

selenium测瀑布流UI页面的Python代码

from  selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.action_chains import  ActionChains import time from selenium.common.exceptions import NoSuchElementException driver = webdriver.Chrome() dr

Python Selenium 获取不到弹出框的另外一种思路

大家都知道弹出框大致可以分为三种:1.警告消息框(alert).2.确认消息框(confirm).3.提示消息对话(prompt) 而selenium 提供switch_to_alert()方法来定位: switch_to_alert() #定位弹出对话 text()               #获取对话框文本值 accept()                   #相当于点击"确认" dismiss()                  #相当于点击"取消"

python+selenium获取禅道所有Bug标题

前言: 对于一组很多的数据,一个页面加载不完,需要分页加载,比如禅道的Bug数,一页默认是20个(自己可以根据需求更改),这时就有了第二页,第三页等等. 这时如果要获取所有的Bug标题来怎么做呢? 点击下一页Bug,你会发现url的变化,就只有最后一个数字改变,如下图: 大体思路: 获取所有url→ddt驱动获取每一页的数据 步骤: 第一步:获取所有url 这里已经显示了总共有几页和当前所在的页面数,我们要获取的就后面的数字 '3'. 先定位到这个元素,在通过正则取出后面的 '3',具体代码如下

用python+selenium获取XX省交通违章数据

前言: 目前在研究易信公众号,想给公众号增加一个获取个人交通违章的查询菜单,通过点击返回查询数据.以下是实施过程. 一.首先,用火狐浏览器打开XX省交管网,分析页面信息: 可以看到共有4种查询种类,我只要查询违章数据,所以分析第一个电子警察信息查询就好了,用firebug分别查看车牌号码.车辆识别码.验证码输入框,可以得到id属性,分别为:carNum1.carAuthCode1.captcha1. 到这里,我们可以用selenium根据获取的id,自动填入车牌号码.车辆识别码.验证码,但验证码

用python+selenium获取北上广深成五地PM2.5数据信息并按空气质量排序

从http://www.pm25.com/shenzhen.html抓取北京,深圳,上海,广州,成都的pm2.5指数,并按照空气质量从优到差排序,保存在txt文档里 #coding=utf-8 from selenium import webdriver from time import sleep class PM: def __init__(self): self.dr = webdriver.Chrome() self.pm25_info = self.get_pm25_info() de