shell脚本获取网页快照并生成缩略图

获取网页快照并生成缩略图可分两步进行:

1、获取网页快照

2、生成缩略图

获取网页快照

这里我们用 phantomjs 来实现。关于 phantomjs 的详细用法可参考 官方网站 。

1、安装

我的环境是CentOS6.5,安装时直接下载 tarball 然后解压即可。

# wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.8-linux-i686.tar.bz2

# tar -jxvf phantomjs-1.9.8-linux-i686.tar.bz2

# cp phantomjs-1.9.8-linux-i686/bin/phantomjs /bin/phantomjs

第二步中解压后bin目录下的 phantomjs 二进制文件即是可调用命令。

第三步是为了在以后调用命令时不必输入命令全路径。

2、调用

phantomjs的调用需要一个js脚本。这个js脚本接收两个参数,分别是网址url和快照文件名称filename,脚本snap.js内容如下:

/*
 * desc: get snapshot from url
 * author: 十年后的卢哥哥(http://www.cnblogs.com/lurenjiashuo/)
 * example: phantomjs snap.js http://www.baidu.com baidu.png
 */

var page = require(‘webpage‘).create();
var args = require(‘system‘).args;

var pageW = 1024;
var pageH = 768;

page.viewportSize = {
  width: pageW,
  height: pageH
};

var url =  args[1];
var filename = args[2];
page.open(url, function (status) {
    if (status !== ‘success‘) {
        console.log(‘Unable to load ‘ + url + ‘ !‘);
        phantom.exit();
    } else {
        window.setTimeout(function () {
            page.clipRect = { left: 0, top: 0, width: pageW, height: pageH };
            page.render(filename);
            console.log(‘finish:‘, filename);
            phantom.exit();
        }, 1000);
    }
});

在这个脚本中还有个小小的设置,就是设置打开页面的浏览器可视区域的大小为1024*768,然后取第一屏内容。

调用命令如下:

phantomjs snap.js http://www.baidu.com baidu.png

注意:这里执行命令的用户需要对目录有写权限。

3、效果

获取的截图如下:

生成缩略图

生成缩略图用的是 ImageMagick 工具,ImageMagick是个非常强大的图片处理工具,可对图片进行转化(格式转换、缩放、剪切、模糊、反转等)、屏幕截图、图片显示等,详细用法可参考   我的ImageMagick使用心得 一文。

1、安装

redhat系列可使用yum安装:

# yum install ImageMagick ImageMagick-devel

其他平台安装请参考官方网站: http://www.imagemagick.org/script/binary-releases.php ,根据你的系统选择相应的包或自己编译源码。

2、调用

我们这里只使用图片缩放工具,语法为:

convert -resize 320x240 baidu.png baidu_thumbnail.png

3、效果

生成的缩略图如下:

时间: 2024-08-01 22:45:04

shell脚本获取网页快照并生成缩略图的相关文章

[转]Phantomjs实现获取网页快照并生成缩略图

Shell脚本实现获取网页快照并生成缩略图 这篇文章主要介绍了Shell脚本实现获取网页快照并生成缩略图,本文获取网页快照使用phantomjs.生成缩略图使用ImageMagick,需要的朋友可以参考下 获取网页快照并生成缩略图可分两步进行: 1.获取网页快照 2.生成缩略图 获取网页快照 这里我们用 phantomjs 来实现.关于 phantomjs 的详细用法可参考官方网站.http://phantomjs.org/ 1.安装 我的环境是CentOS 7,安装时直接下载源码,我下的版本是

shell脚本获取随机数random

用C提供的取随机数的方法srand和rand, 前者是给后者设置随机数种子seed. int rnd_num = 0; srand(seed); // time(NULL) 通常使用时间做种子 rnd_num = rand(); // 产生随机数 产生种子的方法: 1. 使用日期时间 时间作为种子很简单,取当前日期和时间,但是存在一个陷阱:当多台机器并发执行产生随机数时,出现相同随机数的概率非常高.不推荐这种方式 2. 使用$RANDOM 需要系统支持,通过echo来检测, 打印出一个随机数字,

linux shell 脚本获取和替换文件中特定内容

1.从一串字符串中获取特定的信息 要求1:获取本机IP:menu.lst为系统镜象的IP配置文件,需要从中获取到本机IP信息(从文件获取信息) 1 timeout 1 2 default 0 3 4 title live 5 find --set-root /casper/vmlinuz 6 kernel /casper/vmlinuz boot=casper ignore_uuid showmounts ip=eth0,10.0.66.66,255.255.240.0,10.0.64.3 7

对于shell脚本获取参数的一些小技巧

问题如下: 根据脚本参数的个数$#进行一个循环,在依次输出每个参数$1 $2 $3...... 我有一个循环变量i $i  取到这时的i为1,我想使用这个1再去调用$1,也是就是打印出第一个参数 就是$($i)的意思来取到第几个参数,当然$($i)是不好用的 当时纠结了好久,最后上百度提问,两位高手给出了答案: 1) #!/bin/sh NUMBER=$# echo $NUMBER i=1 while [ $i -le $NUMBER ] do a[$i]=$1 #将数组a[i]赋值为$1,即取

Linux下查看所有用户(shell脚本获取)

在Linux系统中,使用者账号管理最重要的两个文件是/etc/password和/etc/shadow.在/etc/password文件中,每一行都代表一个账号,但是有很多账号是系统账号.比如:bin.adm等,还有管理员账号root.其余的为一般用户账号.每一行的组成有(以:进行分割):1 账号名称:2 密码(与/etc/shadow结合):3 UID 使用者ID:其中0为root用户,1~499为系统用户账号:500+为一般使用者账号. 因此,可以按照UID的范围获取Linux下面所有的用户

通过shell脚本获取日期,并赋给变量

通过shell获取当前8位日期,并赋给变量,并且使用变量作为文件名,建立文件夹 代码如下: ls_date=`date +%Y%m%d` mkdir ${ls_date} 上面两句代码虽然简单 但是在应用中比较实用 获取日期注意事项:date +%Y%m%d 这个字符串是被英文状态下的ESC下面那个键 获取变量注意事项:必须有$与{变量名}组成

shell 脚本获取MySQL数据库中所有表记录总数

近期遇到一个需求,Mysql数据库中需要统计所有表的记录数据:查了下资料可以调取information_schema数据表中数据获取所有表记录数据,但是查询出来的数据,发现和手动统计的记录数据不一致,information_schema查询出来的数据部分不准确[原因应该是部分表数据没有自动同步].折腾了下,于是还是自己手动写个脚本,分享下也做下次备用.程序结构:#!/bin/bash Author:Jerry tb_name=mysql -u账号 -p密码 -h192.168.x.x -P端口

Shell脚本学习三:生成随机数

Linux中生成随机数可以使用$RANDOM这个变量. man bash命令查看对RANDOM的解释. RANDOM Each time this parameter is referenced, a random integer between 0 and 32767 is generated. 可以看出,$RANDOM生成的随机数范围在0到32767之间. 如果想要生成0到9之间的随机数,就可以对10取模运算,这样就可以得到0到9之间的随机数. [[email protected] ~]# 

shell脚本获取zabbix监控图

因为领导提出需要每天看几次服务器的流量图,今天早上9点上班开始截图,十多台服务器.指定时间12小时流量图,截完图反复对照好几遍,一是怕选错主机,二是怕搞错时间段.使用zabbix时间不长,一直感觉很别扭,容易出错.加上中间还做了一点其他东西的统计,最后等邮件发出的时候都已经是10点以后了. 这样下去,恐怕是影响仕途啊.若再加上有什么其他的事情,估计领导可以一边吃午饭一边看报表了,我只能选择吃土了... 网上教程比较多,python写的,perl写的,应为暂时没这方面基础,照搬过来运行报错就无解了