简单的图片抓取demo

原文:简单的图片抓取demo

源代码下载地址:http://www.zuidaima.com/share/1568741405854720.htm

昨天看到同学在一张张右键图片,感觉好麻烦,今天上午就查了一下资料,弄了个图片抓取器。

用到jsoup和 io包,我放在压缩文件里了。

新手刚刚弄,可能会有考虑不好的地方,欢迎大家多多指教。

主要代码:

01 //遍历保存
02 Iterator<String>
i = imgSrcSet.iterator();
03             while(i.hasNext()){
04                  
05                 String
imgSrc = (String)i.next();
06                 String
imgName = FilenameUtils.getName(imgSrc);
07                  
08                 if (imgName.indexOf(".")
!= -
1)
{
09                     if (imgName.indexOf("?")
> -
1)
{
10                         imgName
= imgName.substring(
0,
imgName.indexOf(
"?"));
11                     }
12                      
13                     Util
util = 
new Util();
14                     String
saveImagePath = filePath+
"/"+imgName;
15                     System.out.println("图片抓取开始:");
16                     util.download(imgSrc,saveImagePath);
17                     System.out.println("图片抓取结束:"+imgSrc+"
保存路径:"
+saveImagePath);
18                      
19                 }

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-27 18:24:57

简单的图片抓取demo的相关文章

arpspoof+driftnet+ ARP欺骗简单图片抓取

arpspoof+driftnet+ ARP欺骗简单图片抓取 driftnet是一款简单而使用的图片捕获工具,可以很方便的在网络数据包中抓取图片.该工具可以实时和离线捕获指定数据包中是图片 环境 受害ip:192.168.228.130 攻击ip:192.168.228.129 网关:192.168.228.2 条件 1,开启或关闭IP转发 2,向被攻击机器发送arp欺骗数据包,冒充网关 3,向网关发送arp数据欺骗网关,冒充被攻击机器 4,运行driftnet截取图片 开启IP转发功能 cat

[python应用]python简单图片抓取

前言 emmmm python简单图片抓取 1 import requests 2 import threading 3 import queue 4 from subprocess import Popen,PIPE 5 from bs4 import BeautifulSoup as bs 6 import urllib 7 import base64 8 9 10 queue=queue.Queue() 11 12 class Jiandan(threading.Thread): 13 d

python 利用 scrapy 实现3个爬虫简单入门数据抓取

执行可能会遇到报错 scrapy crawl itemSpiderScrapy 1.6.0 - no active project Unknown command: crawl Use "scrapy" to see available commandsPS E:\pyproject\scrapymingyan> 原因可能是 1.没有进入项目根目录 2. 可能是自己一个大项目命名的文件夹下有多个小项目, 执行具体的项目需要进入具体的小项目的根目录中去. 自己误以为大项目就是项目根

使用selenium实现简单网络爬虫抓取MM图片

撸主听说有个网站叫他趣,里面有个社区,其中有一项叫他趣girl,撸主点进去看了下,还真不错啊,图文并茂,宅男们自己去看看就知道啦~ 接下来当然就是爬取这些妹子的图片啦,不仅仅是图片,撸主发现里面的对话也很有意思,于是把对话也一并抓取下来好了. 那么问题来了,用什么工具呢?在之前的练习中已经用过urllib2,正则表达式匹配实在麻烦,这次来点稍微高级的,试试selenium: selenium是什么?其实它是一个web自动化测试的工具,运行起来就跟我们自己操作浏览器差不多,废话不多说,下面开始.

[Java]使用HttpClient实现一个简单爬虫,抓取煎蛋妹子图

  第一篇文章,就从一个简单爬虫开始吧. 这只虫子的功能很简单,抓取到”煎蛋网xxoo”网页(http://jandan.net/ooxx/page-1537),解析出其中的妹子图,保存至本地. 先放结果: 从程序来讲,步骤分为三步: 1.发起一个http请求,获取返回的response内容: 2.解析内容,分离出有效图片的url: 3.根据这些图片的url,生成图片保存至本地. 开始详细说明: 准备工作:HttpClient的Jar包,访问http://hc.apache.org/   自行下

百度贴吧图片抓取工具

本着周末逛贴吧看图片,发现电脑运行内存太小,网页加载太慢,一怒之下写个爬虫把图片都下载到本地慢慢看 得到结果如下: 千张内涵图随意浏览 程序第一个选项: 对应的贴吧是: 第二个选项: 对应的贴吧是 抓取的对象为楼主所发的图片: 好的,开搞: 下面是基于python3写的 通过观察,得到爬虫思路为: 思路1.搜索什么贴吧kw2.贴吧内的什么贴qw3.进入贴吧href="/p/4.图片<img src="5.页数pn= 第一步思路是构造网址,观察看到贴吧网址为: 代码为 # 输入的文

记录一个简单的HttpClient抓取页面内容

现如今的网络时代,HTTP协议如此重要,随着java的发展,也越来越多的人采用java直接通过HTTP协议访问网络资源,虽然java.net提供了基本的访问HTTP协议的基本功能,但是对于大部分应用程序来说,仍旧还有许多功能不能够灵活使用:HttpClient是Apache Jakarta Common 下的子项目,一个提供访问HTTP协议的java工具包,提供了更多.更快捷.丰富的方法,HttpClient主要常用的功能有:实现了所有 HTTP 的方法(GET,POST,PUT,HEAD,DE

frame框架中验证码图片抓取(VB2010)

今日写一个验证码识别自动登录的程序,发现网页中验证码图片是嵌在frame框架中,一时间遇到了问题无法搞定,网上搜了很多网页也没有具体的解决办法,今日偶然尝试居然搞定了,给大家分享一下. HTML的源程序模拟如下: <body> <iframe src="hello.jpg"></iframe> </body> 真实的场景SRC是一个类似于checkcode.ASP的链接,不能直接通过WEB地址抓取,不然图片就会变了,这个估计大家都知道,抓

图片抓取,根据关键字爬取淘宝或百度前4张图片

通过关键字查询淘宝网或者百度图片,并下载到本地前四张图片 1 private new string Capture(string productTitle) 2 { 3 string result = string.Empty; 4 try 5 { 6 string url = string.Empty; 7 //汉子转码 8 string contant = HttpUtility.UrlEncode(productTitle); 9 url = string.Format(@"https:/