use selenium in scrapy webdriver

https://pypi.python.org/pypi/selenium

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

browser = webdriver.Firefox()

browser.get(‘http://www.yahoo.com‘)
assert ‘Yahoo‘ in browser.title

elem = browser.find_element_by_name(‘p‘)  # Find the search box
elem.send_keys(‘seleniumhq‘ + Keys.RETURN)

browser.quit()

//do get all contents

driver = webdriver.Chrome()
driver.get("http://www.ask.com")

print driver.title
inputElement = driver.find_element_by_name("q")

# type in the search
inputElement.send_keys("baseball hats")
# submit the form (although google automatically searches now without submitting)
inputElement.submit()

try:
    WebDriverWait(driver, 10).until(EC.title_contains("baseball"))
    print driver.title
    output = driver.page_source
    print(output)
finally:
    driver.quit()
iframes = driver.find_elements_by_tag_name("iframe")

for iframe in iframes
    driver.switch_to_default_content()
    driver.switch_to_frame(iframe)

    output = driver.page_source
    print(output)
时间: 2024-10-25 14:59:01

use selenium in scrapy webdriver的相关文章

爬虫07 /scrapy图片爬取、中间件、selenium在scrapy中的应用、CrawlSpider、分布式、增量式

目录 爬虫07 /scrapy图片爬取.中间件.selenium在scrapy中的应用.CrawlSpider.分布式.增量式 1. scrapy图片的爬取/基于管道类实现 2. 中间件的使用 3. selenium在scrapy中的应用 4. CrawlSpider 5. 分布式 5. 增量式 爬虫07 /scrapy图片爬取.中间件.selenium在scrapy中的应用.CrawlSpider.分布式.增量式 1. scrapy图片的爬取/基于管道类实现 爬取流程: 爬虫类中将解析到的图片

Selenium Firefox 官方Webdriver -- Geckodriver 下载地址

Selenium Firefox 官方Webdriver -- Geckodriver 下载地址 https://github.com/mozilla/geckodriver/releases

Python3.x:Selenium中的webdriver进行页面元素定位

Python3.x:Selenium中的webdriver进行页面元素定位 页面上的元素就像人一样,有各种属性,比如元素名字,元素id,元素属性(class属性,name属性)等等.webdriver就是利用元素的这些属性来进行定位的. 可以用于定位的常用的元素属性: id name class name tag name link text partial link text xpath css selector 对应于webdriver中的定位一个元素方法分别是: driver.find_e

selenium跳过webdriver检测并爬取淘宝我已购买的宝贝数据

简介 上一个博文已经讲述了如何使用selenium跳过webdriver检测并爬取天猫商品数据,所以在此不再详细讲,有需要思路的可以查看另外一篇博文. 源代码 # -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.w

Selenium 2.0 WebDriver 使用指南

SeleniumWebDriver注意:我们正致力于完善帮助指南的每一个章节,虽然这个章节仍然存在需要完善的地方,不过我们坚信当前你看到的帮助信息是精确无误的,后续我们会提供更多的指导信息来完善帮助文档.1.WebDriver介绍Selenium2.0最主要的新特性就是集成了WebDriverAPI.我们设计WebDriver的初衷是提供更加简单明了的接口来弥补Selenium-RCAPI的不足.在动态网页中,通常只会更新局部的html元素,WebDriver会很好的帮助用户快速定位这些元素.我

selenium中的webdriver定位元素失败的常见原因

自动化测试中经常会出现无法定位元素的情况,报selenium.common.exceptions.NoSuchElementException错误 Frame/Iframe原因定位不到元素: 这个是最常见的原因,首先要理解下frame的实质,frame中实际上是嵌入了另一个页面,而webdriver每次只能在一个页面识别,因此需要先定位到相应的frame,对那个页面里的元素进行定位. 解决方案: 如果iframe有name或id的话,直接使用switch_to_frame("name值"

如何安装selenium以及scrapy,最重要的是pip?

pip一开始出现下图问题 无论是手动安装,还是自动安装,都是出现识别不了的问题: 包括conda  也显示不出来命令 就觉得应该是pip识别不了的问题. 直到我上网查如何安装pip, 才出现了转机, 原帖子如下: http://www.cnblogs.com/NanShan2016/p/5518235.html 尽管跟着照做,还是出现了这一幕: 直到看到这句话: 一直在想,我以前也装过Python3 的呀?为什么要卸载呢? 然后突然发现,一个问题: 我后来又重新装了anaconda,但是,根据帖

python selenium第一个WebDriver脚本

#coding=utf-8from selenium import webdriverimport timeimport osos.environ["webdriver.firefox.driver"]="C:\Program Files\Mozilla Firefox\firefox.exe" driver=webdriver.Firefox(executable_path='c:\\geckodriver')driver.get("http://www

Selenium学习之==>WebDriver驱动对照表

转自www.imdsx.cn 1.Chrome 对于chrome浏览器,有时候会有闪退的情况,也许是版本冲突的问题,我们要对照着这个表来对照查看是不是webdriver和chrome版本不对. chromedriver版本 支持的Chrome版本 v2.39 v66-68 v2.38 v65-67 v2.37 v64-66 v2.36 v63-65 v2.35 v62-64 v2.34 v61-63 v2.33 v60-62 v2.32 v59-61 v2.31 v58-60 v2.30 v58