Jmeter实例(三)_图片爬虫

今天教大家用元件组合，做一个网页图片爬虫。

需要用到的元件：循环控制器+计数器+xpath提前器+函数嵌套+beanshell代码

首先我们确定一下要爬取的图片网站：https://dp.pconline.com.cn/list/all_t5.html

通过F12观察一下他的html代码，发现这些图片都是通过href链接跳转之后，访问的src图片

那么我们可以考虑先对网站发起请求，通过xpath表达式提取到图片的src，也就是图片的访问链接

然后再通过xpath提取出这些图片的标题

因为考虑到每一组图片和标题都是一一对应的，因此这里提取出来的匹配数字也可以认为是一一对应。

在dubug中我们可以看到，url和标题都提取了50个，且一一对应。

下面我们添加一个循环控制器，循环次数就是debug中的matchNr

在循环控制器中添加一个计数器，用来计算需要执行爬取的次数

添加一个http请求，在循环控制器下，循环对debug中获取到的url发起请求，同时遍历写入图片标题

每一次发起请求之后，都把请求获取的图片通过代码写入本地，同时遍历写入图片名称

执行脚本观察响应结果，观察本地文件写入结果

友情提示：这一套爬虫脚本，摒弃了以往通过foreach控制器遍历进行爬虫的方法。转而通过函数嵌套的方式，同步遍历多个参数进行文件写入。难点就在于函数嵌套遍历的理解和xpath元素定位，希望大家好好研究，有问题可以和我进行探讨！

?点击这里，加入QQ群

可以添加微信：14751700162
或者联系QQ：1144890271

只需要分享博客任意两篇文章，截图通过以上任意方式联系，即可获取最新编写的《jmeter接口自动化与性能测试实战试读版》

扫描二维码关注我们的公众号，随时获取最新文章

我们专注于jmeter的接口自动化和性能专题研究，如果您在学习过程中遇到了难题，请及时联系我们，将给您一个满意的答案！

原文地址：https://www.cnblogs.com/Zfc-Cjk/p/10800997.html

时间： 2024-11-02 13:36:07

Jmeter实例(三)_图片爬虫的相关文章

java画图程序_图片用字母画出来

最近在研究怎样将图片用字母在文本编辑工具中“画”出来. 你看了这个可能还不知道我想说什么? 我想直接上图,大家一定就知道了第一张:小猫原图:http://www.cnblogs.com/hongten/gallery/image/143365.html 第二张:林允儿原图:http://images.cnblogs.com/cnblogs_com/hongten/356471/o_star.png 第三张:郭静原图:http://www.cnblogs.com/hongten/galle

java sql编辑器动态报表数据库备份还原 quartz定时任务调度自定义表单 java图片爬虫

获取[下载地址] QQ: 313596790 [免费支持更新] 三大数据库 mysql oracle sqlsever 更专业.更强悍.适合不同用户群体 [新录针对本系统的视频教程,手把手教开发一个模块,快速掌握本系统] A 集成代码生成器(开发利器)+快速构建表单; QQ:313596790 freemaker模版技术 ,0个代码不用写,生成完整的一个模块,带页面.建表sql脚本,处理类,service等完整模块 B 集成阿里巴巴数据库连接池druid;

python实现图片爬虫

#encoding:utf-8 import sys reload(sys) sys.setdefaultencoding('utf8') from sgmllib import SGMLParser import re import urllib class URLLister(SGMLParser): def start_a(self, attrs): url = [v for k, v in attrs if k=='href'] if url : urll = url[0] else :

java画图程序_图片用字母画出来_源码发布_版本二

在上一个版本:java画图程序_图片用字母画出来_源码发布基础上,增加了图片同比例缩放,使得大像素图片可以很好地显示画在Notepad++中. 项目结构: 运行效果1: 原图:http://images.cnblogs.com/cnblogs_com/hongten/356471/o_imagehandler_result1.png 运行效果2: 原图:http://images.cnblogs.com/cnblogs_com/hongten/356471/o_imagehandler_res

高效地加载图片(三) 缓存图片

如果只需要加载一张图片,那么直接加载就可以.但是,如果要在类似ListView,GridView或者ViewPager的控件中加载大量的图片时,问题就会变得复杂.在使用这类控件时,在短时间内可能会显示在屏幕上的图片数量是不固定的. 这类控件会通过子View的复用来保持较低的内存占用.而Garbage Collector也会在View被复用时释放对应的Bitmap,保证这些没用用到的Bitmap不会长期存在于内存中.但是为了保证控件的流畅滑动,在一个View再次滑动出现在屏幕上时,我们需要避免图片

java sql编辑器数据库备份还原 quartz定时任务调度自定义表单 java图片爬虫 java代码生成器

A代码编辑器,在线模版编辑,仿开发工具编辑器,pdf在线预览,文件转换编码B 集成代码生成器 [正反双向](单表.主表.明细表.树形表,快速开发利器)+快速表单构建器 freemaker模版技术 ,0个代码不用写,生成完整的一个模块,带页面.建表sql脚本,处理类,service等完整模块C 集成阿里巴巴数据库连接池druid 数据库连接池阿里巴巴的 druid.Druid在监控.可扩展性.稳定性和性能方面都有明显的优势D 集成安全权限框架shiro Shiro 是一个用 Java 语言

bootstrap后台框架源码 java图片爬虫自定义表单

获取[下载地址] [免费支持更新]三大数据库 mysql oracle sqlsever 更专业.更强悍.适合不同用户群体[新录针对本系统的视频教程,手把手教开发一个模块,快速掌握本系统] A 集成代码生成器 [正反双向(单表.主表.明细表.树形表,开发利器)+快速构建表单; freemaker模版技术 ,0个代码不用写,生成完整的一个模块,带页面.建表sql脚本,处理类,service等完整模块B 集成阿里巴巴数据库连接池druid; 数据库连接池阿里巴巴的 druid.Dr

Java全新高大尚HTML5 bootstrap后台框架源码 java图片爬虫

获取[下载地址] QQ: 313596790 [免费支持更新]三大数据库 mysql oracle sqlsever 更专业.更强悍.适合不同用户群体[新录针对本系统的视频教程,手把手教开发一个模块,快速掌握本系统]A 集成代码生成器(开发利器); 技术:313596790 增删改查的处理类,service层,mybatis的xml,SQL( mysql 和oracle)脚本, jsp页面