selenium+java-查找页面中包含关键字的URL

package seleniumLearn1;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.List;

import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;

import com.gargoylesoftware.htmlunit.javascript.host.Element;

/**
 * 获取http://www.qyer.com页面中,所有</a>标签"href"属性值
 * 包含英文单词“place”的URL,并将结果保存到“/home/result.log”文件中。
 * @author 0
 *
 */
public class Search {

	static String baseUrl="http://www.qyer.com";
	public static void main(String[] args) {
		System.setProperty("webdriver.chrome.driver", "E:\\\\webDriver\\\\chromedriverV2.28.exe");
		File logFile = new File("d://logFile.txt");
		if(!(logFile.exists())) {
			try {
				logFile.createNewFile();
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
		}

		WebDriver driver = new ChromeDriver();
		driver.get(baseUrl);

		//获取所有a标签
		List<WebElement> aList = driver.findElements(By.tagName("a"));
		try {
			Thread.sleep(10000);
		} catch (Exception e) {
			e.printStackTrace();
		}
		//便利所有标签
		FileOutputStream fs = null;
		try {
			fs = new FileOutputStream(logFile);
			for (WebElement a : aList) {
				System.out.println(a.getAttribute("href"));//获取a标签中的URL

				//获取a标签href属性值
				String urlStr = a.getAttribute("href");
				if(urlStr.contains("place")) {
					urlStr +="\r\n";
					//将URL写入文件中
					fs.write(urlStr.getBytes());
				}

			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

  

时间: 2024-10-03 23:04:06

selenium+java-查找页面中包含关键字的URL的相关文章

表单中输入内容,搜索时,下面table中该列中包含关键字的高亮显示

有时候为了在搜索时清楚直观,需要关键字的高亮显示, 效果如下: 思想:在下面table中,本来应该是直接渲染数据,此时,可以先写一个方法,里面包含两个参数,分别是该显示的内容以及进行搜索时输入的关键字,在该方法中,进行判断,若是该列内容中包含关键字,则将关键字颜色改变,然后替换掉:若是没有,则还是原样显示. 表单中: table表格中: 此时需要写关键字高亮显示的方法: 在该方法中,可以使用if判断来进行替换,也可以使用正则来写. 原文地址:https://www.cnblogs.com/520

利用Java实现文件中的关键字查询

1 package com.sinsoft.fileSearch; 2 3 import java.io.BufferedReader; 4 import java.io.File; 5 import java.io.FileFilter; 6 import java.io.FileNotFoundException; 7 import java.io.FileOutputStream; 8 import java.io.FileReader; 9 import java.io.IOExcept

利用js查找页面中的内链,外链

起初没听说过内链外链,只有链接锚文本,在面试中被问到如何查找到页面中的内链和外链,就在想,什么是内链和外链啊??????? 后来面试官给我解释了一下他们的区别,自己稍微懂了,自己当时回答的是通过获取a标签的href属性,查找字符串中是否存在href,后来又被问到如果用选择器怎么用呢?自己不会.... 后来下来又想到这个问题,觉得自己猪啊,有属性选择器来匹配,但是当时为什么回答不上来,因为这个是css3中的,自己只知道,但是不太经常用,所以第一反应没有想到,归根结底还是个熟练度的问题,没有达到熟悉

Java和C++中final关键字的作用和区别

Java中final关键字的作用: a.作用于类:不允许扩展该类,即不能用该类来定义子类. b.作用于方法:子类不能覆盖这个方法,但是可以被继承. 早期Java中,有程序员利用final来避免动态绑定带来的系统开销.现在这个功能主要由编译器来实现. c.作用于域:构造对象之后不能改变该域的值. d.作用于函数参数:可以读取,但是不能改变该参数. 注意:final类的所有方法自动成为final的,不包括域. 将方法或类声明为final主要目的是确保它们在子类中不会改变语义. String类就是一个

通过QT查找Word中的关键字,并做高亮或删除操作

最近由于项目需要,要用QT操作Word文档.具体的工作需求:在指定的Word文档(*.doc文件/*.docx文件)中查找关键字,找到后做高亮操作或者直接删除操作,然后另存为到别的目录(表示这个文件被操作过了). 这个功能很简单,确实挺简单,但由于是第一次用QT操作Word文档,所以仍需要经过一番查找资料.网上用QT操作Word文档的资料不是很多(可能是我没找对地方),所以经过了一段时间的碰壁之后(没有现成的,哪怕是半成品),我决定还是从源头看起: 1.查看帮助文档:Microsoft Word

Java根据PDF中的关键字位置判定PDF文件是否合法

业务中需判定PDF文件是否为指定PDF文件,如果不是则不允许上传,并且提醒用户上传合法PDF文件 此贴需要参考我的上上篇帖子,定位PDF中关键字的位置 测试结果: maven配置 <!-- 引入pdf --> <dependency> <groupId>com.itextpdf</groupId> <artifactId>itextpdf</artifactId> <version>5.5.13</version&g

分别应用include指令和include动作标识在一个jsp页面中包含一个文件。

hello.jsp <%@ page language="java" import="java.util.*" pageEncoding="utf-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+"://"+request.getServerName()+":"+re

java 获取页面中的 a 标签 的 href 实例

Pattern p = Pattern.compile("<a\\s+href\\s*=\\s*(\"|\')?(.*?)[\"|\'|>]", Pattern.CASE_INSENSITIVE); Matcher m = p.matcher("<div class=\"related-tags\">\n" + " <span>相关主题推荐:</span>\n"

SHELL 查找字符串中包含字符的命令

1.通配符 string='My long string' if [[ $string == *"My long"* ]]; then echo "It's there!" fi 2.正则匹配 string='My long string' if [[ $string =~ .*My.* ]]; then echo "It's there!" fi 3.switch…case版本的通配符(速度最快……) string='My long strin