用phantomjs 进行网页整页截屏

写截取整个网页程序是一个做前台的哥们所托，要做一些漂亮的界面原形，参考一些不错的网站设计就帮他弄了个截屏的程序。

phantomjs 是一个基于js的webkit内核无头浏览器也就是没有显示界面的浏览器，这样访问网页就省去了浏览器的界面绘制所消耗的系统资源，比较适合用于网络测试等应用。我只是调用了其中的一个截取网页的小功能，可以完美的解析网页的js和css 而且兼容html5，不过最新的1.5版本不支持flash，所以我采用了1.4的版本，能够得到完整的网页体验。

先看看执行的效率（4M电信，22：30点测试）：

phantomjs的目录结构

dll挺多的都是必须的 codecs里面包含编码信息 qcncodecs4.dll 这个是中文支持里面还有韩文日文和台湾繁体中文这玩意必须有要不然会出现乱码的。

imageformats目录里面是qgif4.dll和qjpeg4.dll两个dll 是用于图片转换的默认png格式。

rasterize.js 就是官方写好的截屏的js代码

var page = require(‘webpage‘).create(),
    address, output, size;

if (phantom.args.length < 2 || phantom.args.length > 3) {
    console.log(‘Usage: rasterize.js URL filename [paperwidth*paperheight|paperformat]‘);
    console.log(‘  paper (pdf output) examples: "5in*7.5in", "10cm*20cm", "A4", "Letter"‘);
    phantom.exit();
} else {
    address = phantom.args[0];
    output = phantom.args[1];
    page.viewportSize = { width: 600, height: 600 };
    if (phantom.args.length === 3 && phantom.args[1].substr(-4) === ".pdf") {
        size = phantom.args[2].split(‘*‘);
        page.paperSize = size.length === 2 ? { width: size[0], height: size[1], border: ‘0px‘ }
                                           : { format: phantom.args[2], orientation: ‘portrait‘, border: ‘1cm‘ };
    }
    page.open(address, function (status) {
        if (status !== ‘success‘) {
            console.log(‘Unable to load the address!‘);
        } else {
            window.setTimeout(function () {
                page.render(output);
                phantom.exit();
            }, 200);
        }
    });
}

看这个js的意思貌似可以将pdf文件转换为图片文件，我没有测试。我调用的时候只是传了两个参数。

下面的就算调用的核心js代码直接输出图像文件。

page.render(output);

在C#中调用这玩意的代码是：

private void GetImage(string url) {

            string links = url.IndexOf("http://") > -1 ? url : "http://" + url;

            #region 启动进程
            Process p = new Process();
            p.StartInfo.FileName = Environment.CurrentDirectory+"//phantomjs.exe";
            p.StartInfo.WorkingDirectory = Environment.CurrentDirectory+"//pic//";
            p.StartInfo.Arguments = string.Format("--ignore-ssl-errors=yes --load-plugins=yes " + Environment.CurrentDirectory + "//rasterize.js  " + links + " "+url+".png");

            p.StartInfo.CreateNoWindow = true;
            p.StartInfo.WindowStyle = ProcessWindowStyle.Hidden;

            if (!p.Start())
                throw new Exception("无法Headless浏览器.");

            #endregion

        }

关键是这里

p.StartInfo.Arguments = string.Format("--ignore-ssl-errors=yes --load-plugins=yes " + Environment.CurrentDirectory + "//rasterize.js  " + links + " "+url+".png");

--ignore-ssl-errors=yes 忽视加密的ssl连接错误

--load-plugins=yes 载入插件
上面的两参数可以不用 ，加上了是为了体验真实的网页体验效果，比如，不载入插件的话 flash就不会加载的。

Environment.CurrentDirectory + "//rasterize.js  " 这里就是调用写好的js驱动代码，下面带上的参数是作用于这个js的。

links  访问的网址连接，最好加入http：//。

"+url+".png 输出的图片 默认是png格式 当包含了上面 imageformats里面的dll的话 就可以输出jpg格式和gif格式的图片。

所有代码就这样子的，用起来很简单，就像在代码中调用cmd一样的。这样就很容易在不错的机子上进行多线程的批量截图而不影响任何操作，效率方面还很不错！

后面附上截取 www.sina.com 网站效果：

默认png的图片效果还是很不错的

用phantomjs 进行网页整页截屏

时间： 2024-11-08 23:46:32

用phantomjs 进行网页整页截屏的相关文章

C#使用phantomjs 进行网页整页截屏

hantomjs 是一个基于js的webkit内核无头浏览器也就是没有显示界面的浏览器,这样访问网页就省去了浏览器的界面绘制所消耗的系统资源,比较适合用于网络测试等应用 .我只是调用了其中的一个截取网页的小功能,可以完美的解析网页的js和css 而且兼容html5,不过最新的1.5版本不支持flash,所以我采用了1.4的版本,能够得到完整的网页体验. 先看看执行的效率(4M电信,22:30点测试): phantomjs的目录结构 dll挺多的都是必须的 codecs里面包含编码信息 qcn

【MFC】截图编辑插件技术总结（4）：IE下网页整页截屏

现在大部分浏览器都已经实现了网页截图的功能,我要说的与这种情况稍有不同,浏览器是从内部获取,而因为我是ActiveX插件,需要从外部获取网页的document.但是,实现的思路基本一致,就是将Webbrowser放大到足够大,使滚动条不出现,然后调用IViewObject接口的Draw方法实现整页的截图.下面先给出代码实现,再对代码进行分析. 1 POINT pnt; 2 3 RECT rc; 4 5 HWND DeskHwnd = ::GetDesktopWindow(); //取得桌面句柄

js利用clipboardData在网页中实现截屏粘贴的功能

目前仅有高版本的 Chrome 浏览器支持这样直接粘贴,其他浏览器目前为止还无法粘贴,不过火狐和ie11浏览器在可编辑的div中能够粘贴截图的图片也是base64位和Chrome利用clipboardData的效果是一样的,只是在火狐和ie11浏览器中目前还无法实现类似用clipboardData直接获取图片的base64数据,它是自带的直接进去img数据完整实例: <!DOCTYPE HTML><html lang="en-US"><head>&

phantomjs介绍-(js网页截屏、javascript网页解析渲染工具)

phantomjs介绍-(js网页截屏.javascript网页解析渲染工具) phantomjs 是一个基于js的webkit内核无头浏览器也就是没有显示界面的浏览器,这样访问网页就省去了浏览器的界面绘制所消耗的系统资源,比较适合用于网络测试等应用 .利用这个工具,我们可以轻松的搭建一个接口用于获取我们想要的url的整页截屏. PhantomJS is a headless WebKit with JavaScript API. It has fast and native support

Snipaste强大离线/在线截屏软件的下载、安装和使用

步骤一: https://zh.snipaste.com/ ,去此官网下载. 步骤二:由于此是个绿色软件,直接解压即可. 步骤三:使用,见官网.ttps://zh.snipaste.com 按F1开始截屏感谢下面哥的精彩微信文章 http://mp.weixin.qq.com/s?__biz=MzIwNzYwODYwMw==&mid=2247483903&idx=1&sn=02121fe920320bbe7b2fae012a18e70a&chksm=970e8f8ba

Java实现网页截屏功能（基于phantomJs）

公司最近有个需求:把用户第一次的测量身体信息和最近一次测量信息进行对比,并且需要把对比的数据截成图片可以发给用户(需要在不打开网页的情况下实时对网页进行截图然后保存到服务器上,返回图片地址),通过网上的一些文章可以发现有以下几种实现方式:参考文章https://blog.csdn.net/wanglq0086/article/details/60761614 Robot 利用JNI,调用第三方C/C++组件 DJNativeSwing组件利用html2canvas 利用html2image p

网页html截屏转图片（二）PhantomJS

关于PhantomJS PhantomJS 是一个基于WebKit的服务器端 JavaScript API.它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG.PhantomJS可以用于页面自动化,网络监测,网页截屏,以及无界面测试等. 我们还可以用它来做爬虫哦,大家知道,网页上有些数据是通过执行js渲染出来的,这样的话爬虫去抓取数据的时候就会很麻烦,PhantomJS自带WebKit内核,我们可以利用Ph

Html5 实现网页截屏页面生成图片(图文)

html2canvas通过获取页面的DOM和元素的样式信息,并将其渲染成canvas图片,从而实现给页面截图的功能. 因为每个浏览器渲染页面的方式都不尽相同,所以生成的图片也不太一样. 环境要求: jQuery兼容性: Firefox 3.5+, Chrome, Opera, IE9 官网主页: http://html2canvas.hertzen.com/ 测试生成的图片效果有些元素的样式没有完全展示出来 1 <html> 2 <head> 3 <meta name=&q

nodejs+phantomjs+七牛实现截屏操作并上传七牛存储

近来研究了下phantomjs,只是初涉,还谈不上深入研究,首先介绍下什么是phantomjs. 官网上的介绍是:”PhantomJS is a headless WebKit scriptable with a JavaScript API. It has fast and native support for various web standards: DOM handling, CSS selector, JSON, Canvas, and SVG.”翻译过来就是:”PhantomJS