Linux之curl命令详解

url命令是一个功能强大的网络工具,它能够通过http、ftp等方式下载文件,也能够上传文件。其实curl远不止前面所说的那些功能,大家可以通过man curl阅读手册页获取更多的信息。类似的工具还有wget。

curl命令使用了libcurl库来实现,libcurl库常用在C程序中用来处理HTTP请求,curlpp是libcurl的一个C++封装,这几个东西可以用在抓取网页、网络监控等方面的开发,而curl命令可以帮助来解决开发过程中遇到的问题。

常用参数

curl命令参数很多,这里只列出我曾经用过、特别是在shell脚本中用到过的那些。

-v/--verbose 小写的v参数,用于打印更多信息,包括发送的请求信息,这在调试脚本是特别有用。

-m/--max-time <seconds> 指定处理的最大时长

-H/--header <header> 指定请求头参数

-s/--slient 减少输出的信息,比如进度

--connect-timeout <seconds> 指定尝试连接的最大时长

-x/--proxy <proxyhost[:port]> 指定代理服务器地址和端口,端口默认为1080

-T/--upload-file <file> 指定上传文件路径

-o/--output <file> 指定输出文件名称

-d/--data/--data-ascii <data> 指定POST的内容

--retry <num> 指定重试次数

-e/--referer <URL> 指定引用地址

-I/--head 仅返回头部信息,使用HEAD请求

使用示例

示例一 获取指定网页

[[email protected] ~]# curl http://www.sunrisecorp.net/  <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=gbk" /> <meta name="title" content="欢迎您 - 上海腾一" /> <meta name="keyword" content="上海腾一,融合通信,电子商务,语音通信,数据通信,基站工程外包托管,物联网,网站建设,电子商务解决方案,移动互联网,短信,彩信,呼叫中心,多方会议,PBX,IVR,电子商务策划方案,设备代维,网络优化,通信工程,电信增值,3G" /> <meta name="description" content="上海腾一信息技术有限公司专注于电信增值、通信工程、电子商务等领域,拥有近十年的经验。" /> <title> 欢迎您 - 上海腾一 </title>

插播一下广告:上海腾一信息技术有限公司是一家致力于通信工程、电子商务和电信增值业务的公司,请访问官方网址: http://www.sunrisecorp.net/ 。

此处省略掉网页内容 。

</body> </html>[[email protected] ~]#

示例二 查看响应头信息

[[email protected] ~]# curl -I http://www.sunrisecorp.net/ HTTP/1.1 200 OK Server: Apache-Coyote/1.1 Accept-Ranges: bytes ETag: W/"17801-1285643951000" Last-Modified: Tue, 28 Sep 2010 03:19:11 GMT Content-Type: text/html Content-Length: 17801 Date: Tue, 12 Oct 2010 12:49:20 GMT
[[email protected] ~]#

示例三 检查网页是否可正常访问

以下是一个tomcat监控脚本的部分内容。

Bash代码  

  1. # usage: check_once <port> <path>
  2. # 使用curl检查网页是否可以正常访问,如果不能访问就重启tomcat。
  3. check_once()
  4. {
  5. echo
  6. echo "$(date)  Tomcat check once"
  7. # 2008.08.21 -I/--head -s/--silent
  8. #if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/; then
  9. # 2010.02.16 add 200 OK test
  10. if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/$2 | grep -q ‘200 OK‘;
  11. then
  12. echo "$(date)  Tomcat maybe OK"
  13. else
  14. echo "$(date)  Tomcat maybe FAULT"
  15. restart
  16. fi
  17. }
  18. # usage: check_loop <port> <path>
  19. # 每隔一分钟检查一次网页是否正常
  20. check_loop()
  21. {
  22. while true;
  23. do
  24. sleep 60
  25. check_once $1 $2 >> $CATALINA_HOME/logs/check.$(date +%Y-%m-%d).log
  26. done
  27. }
  28. # usage: monitor <path>
  29. # 对path指定的本机网页进行监控
  30. # 2008.06.26
  31. # 2010.09.20 add path parameter
  32. monitor()
  33. {
  34. PORT=80
  35. if grep ‘Connector port="80"‘ $CATALINA_HOME/conf/server.xml; then
  36. PORT=80
  37. elif grep ‘Connector port="8080"‘ $CATALINA_HOME/conf/server.xml; then
  38. PORT=8080
  39. else
  40. echo "Cannot detect server port for Tomcat"
  41. return 12
  42. fi
  43. echo "Tomcat server port is $PORT"
  44. if status; then
  45. check_loop $PORT "$1" &
  46. #check_loop $PORT "$1"
  47. fi
  48. }

Bash代码  

  1. # usage: check_once <port> <path>
  2. # 使用curl检查网页是否可以正常访问,如果不能访问就重启tomcat。
  3. check_once()
  4. {
  5. echo
  6. echo "$(date)  Tomcat check once"
  7. # 2008.08.21 -I/--head -s/--silent
  8. #if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/; then
  9. # 2010.02.16 add 200 OK test
  10. if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/$2 | grep -q ‘200 OK‘;
  11. then
  12. echo "$(date)  Tomcat maybe OK"
  13. else
  14. echo "$(date)  Tomcat maybe FAULT"
  15. restart
  16. fi
  17. }
  18. # usage: check_loop <port> <path>
  19. # 每隔一分钟检查一次网页是否正常
  20. check_loop()
  21. {
  22. while true;
  23. do
  24. sleep 60
  25. check_once $1 $2 >> $CATALINA_HOME/logs/check.$(date +%Y-%m-%d).log
  26. done
  27. }
  28. # usage: monitor <path>
  29. # 对path指定的本机网页进行监控
  30. # 2008.06.26
  31. # 2010.09.20 add path parameter
  32. monitor()
  33. {
  34. PORT=80
  35. if grep ‘Connector port="80"‘ $CATALINA_HOME/conf/server.xml; then
  36. PORT=80
  37. elif grep ‘Connector port="8080"‘ $CATALINA_HOME/conf/server.xml; then
  38. PORT=8080
  39. else
  40. echo "Cannot detect server port for Tomcat"
  41. return 12
  42. fi
  43. echo "Tomcat server port is $PORT"
  44. if status; then
  45. check_loop $PORT "$1" &
  46. #check_loop $PORT "$1"
  47. fi
  48. }

这个脚本的执行方式是 monitor <path>,比如monitor main/index.html。下面是执行时输出的日志信息片段。

2010年 10月 09日 星期六 15:20:38 CST  Tomcat check once 2010年 10月 09日 星期六 15:20:46 CST  Tomcat maybe OK
2010年 10月 09日 星期六 15:21:46 CST  Tomcat check once 2010年 10月 09日 星期六 15:21:57 CST  Tomcat maybe FAULT Tomcat is now running, not stopped: 0 Tomcat is now running, not stopped: 1 Tomcat is now running, not stopped: 2 Tomcat is now running, not stopped: 3 Tomcat is now running, not stopped: 4 Tomcat is now running, not stopped: 5 Tomcat is now running, not stopped: 6 Tomcat is now running, not stopped: 7 Tomcat is now running, not stopped: 8 Tomcat is now running, not stopped: 9 Tomcat killed use SIGKILL Tomcat stopped       Starting tomcat
2010年 10月 09日 星期六 15:23:09 CST  Tomcat check once 2010年 10月 09日 星期六 15:23:09 CST  Tomcat maybe OK
2010年 10月 09日 星期六 15:24:09 CST  Tomcat check once 2010年 10月 09日 星期六 15:24:09 CST  Tomcat maybe OK

示例四 另一个检查网页是否正常的脚本

Bash代码  

  1. # 要检查的网页地址
  2. URL="http://www.sunrisecorp.net/"
  3. # usage:
  4. curlit()
  5. {
  6. curl --connect-timeout 15 --max-time 30 --head --silent "$URL" | grep ‘HTTP/1.1 200 OK‘
  7. }
  8. # 只有MIN_ALARM次访问失败时才告警
  9. MIN_ALARM=10
  10. #
  11. doit()
  12. {
  13. echo "===== $(now) ====="
  14. if ! curlit; then
  15. echo "$(now)  bbdx nss access failed"
  16. N=1
  17. if [ -e curlit_error ]; then
  18. N="$(cat curlit_error)"
  19. N=$[N+1]
  20. fi
  21. echo "$(now)  N=$N"
  22. echo $N >curlit_error
  23. if [ "$N" == "$MIN_ALARM" ]; then
  24. echo "$(now)  do notify"
  25. touch curlit_error
  26. notify_curlit_error
  27. fi
  28. else
  29. if [ -e curlit_error ]; then
  30. echo "$(now)  recovered"
  31. N=$(cat curlit_error)
  32. echo "$(now)  N=$N"
  33. rm -f curlit_error
  34. if [ "$N" -ge "$MIN_ALARM" ]; then
  35. notify_curlit_recovered
  36. fi
  37. fi
  38. fi
  39. }
  40. doit >>log/curlit.log 2>&1

Bash代码  

  1. # 要检查的网页地址
  2. URL="http://www.sunrisecorp.net/"
  3. # usage:
  4. curlit()
  5. {
  6. curl --connect-timeout 15 --max-time 30 --head --silent "$URL" | grep ‘HTTP/1.1 200 OK‘
  7. }
  8. # 只有MIN_ALARM次访问失败时才告警
  9. MIN_ALARM=10
  10. #
  11. doit()
  12. {
  13. echo "===== $(now) ====="
  14. if ! curlit; then
  15. echo "$(now)  bbdx nss access failed"
  16. N=1
  17. if [ -e curlit_error ]; then
  18. N="$(cat curlit_error)"
  19. N=$[N+1]
  20. fi
  21. echo "$(now)  N=$N"
  22. echo $N >curlit_error
  23. if [ "$N" == "$MIN_ALARM" ]; then
  24. echo "$(now)  do notify"
  25. touch curlit_error
  26. notify_curlit_error
  27. fi
  28. else
  29. if [ -e curlit_error ]; then
  30. echo "$(now)  recovered"
  31. N=$(cat curlit_error)
  32. echo "$(now)  N=$N"
  33. rm -f curlit_error
  34. if [ "$N" -ge "$MIN_ALARM" ]; then
  35. notify_curlit_recovered
  36. fi
  37. fi
  38. fi
  39. }
  40. doit >>log/curlit.log 2>&1

示例五 使用HttpPost上传数据

一个用于http post的脚本。

Bash代码  

  1. #!/bin/sh
  2. MS=1350514xxxx
  3. TM=$(date +"%Y%m%d%H%M%S")
  4. DT=$(date +"%Y%m%d")
  5. cat <<EOF >reqtmp.xml
  6. <?xml version="1.0" encoding="GBK" ?>
  7. <OwnPlatForm>
  8. <OrigDomain>QZT</OrigDomain>
  9. <HomeDomain>BOSS</HomeDomain>
  10. <ActivityCode>T5100001</ActivityCode>
  11. <ActionCode>0</ActionCode>
  12. <TransIDO>$TM</TransIDO>
  13. <TransIDH></TransIDH>
  14. <ProcessTime>$TM</ProcessTime>
  15. <CutOffDay>$DT</CutOffDay>
  16. <TestFlag>0</TestFlag>
  17. <Content>
  18. <![CDATA[
  19. <BizProcReq>
  20. <IDType>01</IDType>
  21. <IDValue>$MS</IDValue>
  22. <UserCity>14</UserCity>
  23. <UserCounty>1419</UserCounty>
  24. <OprCode>01</OprCode>
  25. <BizType>51</BizType>
  26. <OprTime>$TM</OprTime>
  27. <OprSrc>27</OprSrc>
  28. <ProductInfo>
  29. <PrdCode>510001</PrdCode>
  30. </ProductInfo>
  31. </BizProcReq>
  32. ]]>
  33. </Content>
  34. </OwnPlatForm>
  35. EOF
  36. cat reqtmp.xml
  37. URL="http://10.32.140.230:7092/fcgi-bin/UIG_NEWINT"
  38. curl --verbose --upload-file reqtmp.xml  --header "Content-Type: text/xml" "$URL" --output rsptmp.xml
  39. cat rsptmp.xml

Bash代码  

  1. #!/bin/sh
  2. MS=1350514xxxx
  3. TM=$(date +"%Y%m%d%H%M%S")
  4. DT=$(date +"%Y%m%d")
  5. cat <<EOF >reqtmp.xml
  6. <?xml version="1.0" encoding="GBK" ?>
  7. <OwnPlatForm>
  8. <OrigDomain>QZT</OrigDomain>
  9. <HomeDomain>BOSS</HomeDomain>
  10. <ActivityCode>T5100001</ActivityCode>
  11. <ActionCode>0</ActionCode>
  12. <TransIDO>$TM</TransIDO>
  13. <TransIDH></TransIDH>
  14. <ProcessTime>$TM</ProcessTime>
  15. <CutOffDay>$DT</CutOffDay>
  16. <TestFlag>0</TestFlag>
  17. <Content>
  18. <![CDATA[
  19. <BizProcReq>
  20. <IDType>01</IDType>
  21. <IDValue>$MS</IDValue>
  22. <UserCity>14</UserCity>
  23. <UserCounty>1419</UserCounty>
  24. <OprCode>01</OprCode>
  25. <BizType>51</BizType>
  26. <OprTime>$TM</OprTime>
  27. <OprSrc>27</OprSrc>
  28. <ProductInfo>
  29. <PrdCode>510001</PrdCode>
  30. </ProductInfo>
  31. </BizProcReq>
  32. ]]>
  33. </Content>
  34. </OwnPlatForm>
  35. EOF
  36. cat reqtmp.xml
  37. URL="http://10.32.140.230:7092/fcgi-bin/UIG_NEWINT"
  38. curl --verbose --upload-file reqtmp.xml  --header "Content-Type: text/xml" "$URL" --output rsptmp.xml
  39. cat rsptmp.xml

示例六 使用proxy的脚本

Bash代码  

  1. # usage: do_sync_once <mobile> <codes> <area_id> <opening>
  2. do_sync_once()
  3. {
  4. mobile=$1
  5. codes=$2
  6. area_id=$3
  7. opening=$4
  8. curl --silent --max-time 60 --proxy http://10.32.187.170:8080 "http://host/boss/sync.jsp?seq=1251747862492&mobile=$mobile&serviceCodes=$codes&areaId=$area_id&opening=$opening"
  9. }

Bash代码  

  1. # usage: do_sync_once <mobile> <codes> <area_id> <opening>
  2. do_sync_once()
  3. {
  4. mobile=$1
  5. codes=$2
  6. area_id=$3
  7. opening=$4
  8. curl --silent --max-time 60 --proxy http://10.32.187.170:8080 "http://host/boss/sync.jsp?seq=1251747862492&mobile=$mobile&serviceCodes=$codes&areaId=$area_id&opening=$opening"
  9. }

示例七 使用Google AJAX Search API进行搜索

Bash代码  

  1. # usage: google_search <STR>
  2. # Google搜索
  3. google_search()
  4. {
  5. REF="http://codingstandards.iteye.com/"
  6. KEY="ABQIAAAAHg_ENG5Yq9pOZd19v64gyxTMcdcN4KfyGCBxustvF1FXdNe4WBQOej_ZiBgIK6-a4M3hTxcVfSkt2g"
  7. STR="$1"
  8. # 采用网页搜索
  9. curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null
  10. # 采用博客搜索
  11. #curl -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null
  12. #curl --retry 5 -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null
  13. #curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null
  14. }

Bash代码  

  1. # usage: google_search <STR>
  2. # Google搜索
  3. google_search()
  4. {
  5. REF="http://codingstandards.iteye.com/"
  6. KEY="ABQIAAAAHg_ENG5Yq9pOZd19v64gyxTMcdcN4KfyGCBxustvF1FXdNe4WBQOej_ZiBgIK6-a4M3hTxcVfSkt2g"
  7. STR="$1"
  8. # 采用网页搜索
  9. curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null
  10. # 采用博客搜索
  11. #curl -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null
  12. #curl --retry 5 -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null
  13. #curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null
  14. }
时间: 2024-10-10 14:30:16

Linux之curl命令详解的相关文章

Linux Shell学习--curl命令详解

curl命令详解 (1).curl介绍 作为一款强力工具,curl支持包括HTTP.HTTPS.FTP在内的众多协议.它还支持POST.cookie.认证.从指定偏移处下载部分文件.参照页(referer).用户代理字符串.扩展头部.限速.文件大小限制.进度条等特性.如果要和网页访问序列(web page usagesequence)以及数据检索自动化打交道,那么curl定能助你一臂之力. (2).curl的help curl --help Usage: curl [options...] <u

(转)Linux下PS命令详解

(转)Linux下PS命令详解 整理自:http://blog.chinaunix.net/space.php?uid=20564848&do=blog&id=74654 要对系统中进程进行监测控制,查看状态,内存,CPU的使用情况,使用命令:/bin/ps (1) ps :是显示瞬间进程的状态,并不动态连续: (2) top:如果想对进程运行时间监控,应该用 top 命令: (3) kill 用于杀死进程或者给进程发送信号: (4) 查看文章最后的man手册,可以查看ps的每项输出的含义

Linux下chkconfig命令详解

Linux下chkconfig命令详解 chkconfig命令主要用来更新(启动或停止)和查询系统服务的运行级信息.谨记chkconfig不是立即自动禁止或激活一个服务,它只是简单的改变了符号连接. 使用语法:chkconfig [--add][--del][--list][系统服务] 或 chkconfig [--level <等级代号>][系统服务][on/off/reset] chkconfig在没有参数运行时,显示用法.如果加上服务名,那么就检查这个服务是否在当前运行级启动.如果是,返

转载的 Linux下chkconfig命令详解

Linux下chkconfig命令详解 chkconfig命令主要用来更新(启动或停止)和查询系统服务的运行级信息.谨记chkconfig不是立即自动禁止或激活一个服务,它只是简单的改变了符号连接. 使用语法: chkconfig [--add][--del][--list][系统服务] 或 chkconfig [--level <等级代号>][系统服务][on/off/reset] chkconfig 在没有参数运行时,显示用法.如果加上服务名,那么就检查这个服务是否在当前运行级启动.如果是

linux系统find命令详解

find命令 –用途:用于查找文件或目录 –格式:find  [查找范围]  [查找条件] 常用查找条件 –-name:按文件名称查找 –-size:按文件大小查找 –-user:按文件属主查找 –-type:按文件类型查找 –-print:以\n为换行符打印出文件(路径) 高级查找条件 –-perm:按权限查找 –-ctime(-cmin):按文件创建时间(天为单位)查找 –-atime(-amin):按访问时间查找 –-mtime(-mmin):修改时间查找 –-newer:查找比指定文件更

linux下scp命令详解

scp是 secure copy的缩写, scp是linux系统下基于ssh登陆进行安全的远程文件拷贝命令.linux的scp命令可以在linux服务器之间复制文件和目录. scp命令的用处: scp在网络上不同的主机之间复制文件,它使用ssh安全协议传输数据,具有和ssh一样的验证机制,从而安全的远程拷贝文件. scp命令基本格式: scp [-1246BCpqrv] [-c cipher] [-F ssh_config] [-i identity_file] [-l limit] [-o s

linux中ls命令详解

s 命令可以说是linux下最常用的命令之一. -a 列出目录下的所有文件,包括以 . 开头的隐含文件.-b 把文件名中不可输出的字符用反斜杠加字符编号(就象在C语言里一样)的形式列出.-c 输出文件的 i 节点的修改时间,并以此排序.-d 将目录象文件一样显示,而不是显示其下的文件.-e 输出时间的全部信息,而不是输出简略信息.-f -U 对输出的文件不排序.-g 无用.-i 输出文件的 i 节点的索引信息.-k 以 k 字节的形式表示文件的大小.-l 列出文件的详细信息.-m 横向输出文件名

Linux下ps命令详解 Linux下ps命令的详细使用方法

Linux下ps命令详解 1. 运行(正在运行或在运行队列中等待) 2. 中断(休眠中, 受阻, 在等待某个条件的形成或接受到信号) 3. 不可中断(收到信号不唤醒和不可运行, 进程必须等待直到有中断发生)4. 僵死(进程已终止, 但进程描述符存在, 直到父进程调用wait4()系统调用后释放)5. 停止(进程收到SIGSTOP, SIGSTP, SIGTIN, SIGTOU信号后停止运行运行)ps工具标识进程的5种状态码:D 不可中断 uninterruptible sleep (usuall

linux下alias命令详解

linux下alias命令详解 用途说明 设置命令的别名.在linux系统中如果命令太长又不符合用户的习惯,那么我们可以为它指定一个别名.虽然可以为命令建立"链接" 解决长文件名的问题,但对于带命令行参数的命令,链接就无能为力了.而指定别名则可以解决此类所有问题[1].常用别名来简化 ssh登录[见示例三],使长命令变短,使常用的长命令行变短,强制执行命令时询问等. 功能说明 :设置指令的别名. 语 法:alias[别名]=[指令名称] 参 数 : 若不加任何参数,则列出目前所有的别名