python中使用selenium的一些注意

#coding:utf-8
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains #引入ActionChains鼠标操作类
from selenium.webdriver.common.keys import Keys #引入keys类操作
import time

def main():
    browser = webdriver.Chrome(‘D:\\phantomjs\\chromedriver.exe‘)

#程序片段一:打开百度主页获取相关信息
    browser.get(‘http://www.baidu.com‘)
    browser.maximize_window()  # 将浏览器最大化
    print browser.find_element_by_name(‘tj_trhao123‘).text
    print browser.title  # 页面标题
    print browser.page_source  # 页面全部代码
    time.sleep(10)
    return

# 程序片段二:打开百度主页,通过鼠标点击其中链接
    browser.maximize_window()
    browser.get(‘http://www.baidu.com‘)
    article = browser.find_element_by_link_text(u‘地图‘)
    ActionChains(browser).move_to_element(article).click().perform()
    time.sleep(10)
    return

# 程序片段三:打开百度主页,输入关键词并点击搜索按钮
    browser.get(‘http://www.baidu.com‘)
    browser.find_element_by_id(‘kw‘).send_keys(u‘中国人‘)
    print browser.find_element_by_id(‘kw‘).get_attribute(‘type‘)
    print browser.find_element_by_id(‘kw‘).size  # 打印输入框的大小
    browser.find_element_by_id(‘su‘).click()
    time.sleep(10)
    return

# 程序片段四:操作键盘示例
    browser.get(‘http://www.renren.com/SysHome.do‘)
    browser.find_element_by_id(‘email‘).clear()  # 这个是以id选择元素
    browser.find_element_by_id(‘email‘).send_keys(‘email‘)
    browser.find_element_by_id(‘email‘).send_keys(Keys.BACK_SPACE)
    browser.find_element_by_id(‘email‘).send_keys(Keys.ENTER)
    time.sleep(10)
    return

if __name__ == ‘__main__‘:

main()

注意:

1、下载和存放chromedriver,其版本与谷歌浏览器Chrome一致,本例中存放在D盘某目录下

2、python中需要安装selenium模块

3、需要下载和安装PhantomJS软件

4、四个程序片段可以单独运行,可以把不需要运行的代码注释掉

时间: 2024-08-07 04:17:01

python中使用selenium的一些注意的相关文章

python中使用selenium错误-Firefox浏览器

今天下午学习了一下编写自动化脚本,遇到的问题,记录一下. 解决方法:下载geckodriver.exe,将下载好的geckodriver.exe放入到D:\MyConfiguration\wtt42800\AppData\Local\Programs\Python\Python36-32(python的安装目录) 参考链接:http://jingyan.baidu.com/article/c910274b87b84acd361d2da3.html https://github.com/mozil

安装selenium操作步骤(python中使用selenium)

前置条件:系统中已经安装好python个pip 第一步:在cmd中进入到pip安装目录,如:D:\python34\scripts 第二步:执行安装命令:pip install selenium 安装完成后进行浏览器驱动配置 第三步:在网上下载浏览器驱动(谷歌.IE.火狐等) 第四步:将下载好的浏览器驱动放在python安装的目录的根目录 第五步:将浏览器驱动的路径配置到环境变量中,如:D:\python34\Chome.exe 完成以上步骤可以输入以下代码进行测试: from selenium

python中使用selenium调用Firefox缺少geckodriver解决方法

from selenium import webdriver driver=webdriver.Firefox() 会报错 解决方法: 因为缺少geckodriver.exe,先到https://github.com/mozilla/geckodriver/releases下载对应版本的geckofriver.exe 然后放到python的安装目录与python.exe在同一目录下

python中通过selenium简单操作及元素定位

浏览器的简单操作 # 导入webdriver模块 # 创建driver对象,指定Chrome浏览器 driver = webdriver.Chrome() # 窗口最大化 driver.maximize_window() # 访问百度 driver.get("http://baidu.com") driver.get("http://sina.com") # 后退 driver.back() # 前进 driver.forward() # 刷新 driver.ref

Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容

在上一篇python使用xslt提取网页数据中,要提取的内容是直接从网页的source code里拿到的. 但是对于一些Ajax或动态html, 很多时候要提取的内容是在source code找不到的,这种情况就要想办法把异步或动态加载的内容提取出来. python中可以使用selenium执行javascript,selenium可以让浏览器自动加载页面,获取需要的数据.selenium自己不带浏览器,可以使用第三方浏览器如Firefox, Chrome等,也可以使用headless浏览器如P

python爬虫之Selenium

首先解决python中使用selenium调用Firefox缺少geckodriver的问题 geckodriver.exe下载地址 : https://pan.baidu.com/s/10Vy9WH1ZpkvdFmZ3T7aw_w , https://github.com/mozilla/geckodriver/releases 解压完成,然后放到python的安装目录与python.exe在同一目录下 Selenium是一个第三方模块,可以完全模拟用户在浏览器上操作(在浏览器上点点点). 安

解决python中'chromedriver' executable needs to be in PATH报错

在使用python中的selenium模块的时候出现以下错误 解决: 问题是没有Chrome 驱动,那么先下载驱动. 下载之前先查看自己chrome当前的版本信息: 点击chrome浏览器右上角的圆圈标记处,在帮助-->关于Google Chrome(E)中查看浏览器的版本信息 之后打开网址http://npm.taobao.org/mirrors/chromedriver/找到对应的版本,下载并解压到自己想放的路径中. 然后在代码中添加chromedriver文件路径 from seleniu

在Python中实现PageFactory模式

关于 PageFactory 的概念主要是Java中内置了PageFactory类. import org.openqa.selenium.support.PageFactory; …… 例子,http://libin0019.iteye.com/blog/1260090 Python(Selenium)中没有这个类. PageFactory 的概念和Page Object应该类似,属于一种设计模式.所以并不局限于语言及场景.于是,好奇,既然Java有,那Python也应该有类似的玩法.还真让我

Python PhatomJS 和Selenium动态加载页面 获取图片内容

随笔中的代码拷贝自 http://www.cnblogs.com/Albert-Lee/p/6275146.html 感谢阿里波特,通过学习自己做了一些注释,作为总结和记录. 1 from selenium import webdriver 2 import requests 3 from bs4 import BeautifulSoup 4 import os 5 import time 6 #定义函数时,尽量写上默认参数,字符='',数字=0,特殊对象也要定义默认值,这样就可以简单的通过.来