Nginx中 Rewrite学习笔记

路由重写是Web服务器中的一个很重要的基本功能。通过路由重写,可以结构化URL,更具语义化(对SEO有益)。另外,分享出去的URL可能会因程序路由变动而导致URL失效,而路由的重写可以很好的解决这类问题。

适当的使用Rewrite功能,可以更我们带来很多的好处。Nginx中Rewrite的功能是基于perl语言兼容的正则表达式,所以在编译安装nginx之前,需要安装PREC库。Nginx中Rewrite功能实现是基于ngx_http_rewrite_module,所以确保安装了此模块。

Rewrite 规则

Rewrite的核心在于正在表达式,所以想熟练运用Nginx的Rewrite需要对正则表达式比较熟悉。推荐一款比较好的正则表达式测试工具,Regex Match Tracer

除了正则之外,Nginx中还内置了一些Rewirte指令和相关变量,提供了一套比较完整的功能。

if指令

if指令支持条件判断,基本语法如下:

复制

  1. if(condition) {
  2. // do something
  3. }

以上代码中,花括号代表作用域,表示为条件为真的时候应用的配置。condition中支持变量名,如果变量为空或以"0"开头的任意字符串,都表示为false,否则为true

复制

  1. if($isTrue){
  2. //do something
  3. }

另外,也可以用"="和"!="来对比较变量和字符串,如下:

复制

  1. if($request_method = POST) {
  2. return 405;
  3. }

注意:与字符串对比时,不需要给字符串加上引号。

除了以上几种方式,也可以通过正则表达式来匹配处理,通常有如下几种表达符号:~表示区分大小写匹配;~*表示不区分大小写;!~表示区分大小写并把匹配结果取反;同理,!~*表示不区分大小写并把最终匹配结果取反。在正则表达式中,我们也可以通过小括号来捕获对应变量的值,并可以通过$1······$9得到对应变量值,

复制

  1. if($http_user_agent ~ MSIE) {
  2. ## 检测浏览器用户代理是否包含MSIE这个字符串
  3. }
  4. if($http_cookie ~* "id=([^;]+)(?:|$)"){
  5. ## Nginx 配置,可以使用$1, $2来获取对应匹配的值,如
  6. ## set $id $1; 将捕获的结果保存在$id中,以便后续使用
  7. }

注意:正则表达式一般是不需要加引号,但如果正则表达式中包含了`}`、`;`时,就必须给整个表达式加上引号。

判断请求文件或目录是否存在,在if语句中使用也是非常多的。通常代码如下:

复制

  1. if(-f $request_filename){
  2. ## 判断请求文件是否存在
  3. }
  4. if(!-f $request_filename){
  5. ## 判断请求的文件是否不存在
  6. }

如以上代码所示,-f是用来表示请求的文件是否存在,当然还有判断目录等,具体如下表:

参数名 功能 示例
-f 判断请求的文件是否存在,如果存在,则为true;在其前加上"!"即表示取反  
-d 请求的目录是否存在;在其前加上"!"即表示取反
复制

  1. if(-d $request_filename){
  2. ## 判断请求的目录是否存在
  3. }
-e 判断请求的目录或文件是否存在,如果存在,则为true。  
-x 判断当前请求文件是否为可执行文件。  

break 指令

break指令用来终止当前相同作用域下的其后的Nginx配置。Nginx服务器在根据配置处理请求的过程中遇到这个指令时,会回到上一层作用域,继续向下读取配置;也就是说在同一作用域下的Nginx配置,位于该指令之后,都将失效。

基本语法如下:

复制

  1. break;

示例如下:

复制

  1. location / {
  2. if ($slow){ ## 产生作用域
  3. set $id $1; ## 位于break之前,有效
  4. break;
  5. limit_rate 10k; ## 位于break之后,配置无效
  6. }
  7. ## Nginx其他配置(依旧有效)
  8. }

return 指令

return指令用于完成对请求的处理,可以直接向客户端返回响应状态代码。所有处理该指令后的Nginx都将无效。该指令通常在server块和location块配合if指令使用,具体语法如下:

复制

  1. return [text];
  2. return code URL;
  3. return URL;
  • code,返回给客户端的状态码。可以为0~999之前的任意HTTP状态码(非标准的444可以强制关闭服务器与客户端之间的连接)。
  • text, 为返回给客户端的响应体内容,支持使用变量。
  • URL,返回给客户端一个URL地址

通常会配置return指令来处理域名重定向,代码如下:

复制

  1. if ($true){
  2. return 301 http://www.lyblog.net
  3. }

rewrite 指令

该指令通过正则表达式的使用来改变URI。可以同时存在一个或多个指令,按照顺序依次对URL进行匹配和处理。

该指令可以在server块中或使用location中配置,其语法结构如下:

复制

  1. rewrite regex replacement [flag];
  • regex,用于匹配URI的正则表达式。使用括号"()"标记要截取的内容。

以下是错误示例:

复制

  1. rewrite myblog.net http://www.lyblog.net permanent;

提示:rewrite中接收到的URI是不包含host地址。因此,regex不可能匹配到URL的Host地址。

对于以上的例子,rewrite重写http://lyblog.net/source是办不到的,因为rewrite指令接收到的URI是"/source",是不包含"myblog.net"

另外,请求中的参数,也是不包含在rewrite所接收的URI中。如:

http://lyblog.net/source?arg1=value1&arg2=value2

rewrite中接收到的URI是"/source",不包含"arg1=value1&arg2=value2"

  • replacement,匹配成功后用于替换URI中被截取内容的字符串。默认情况下,如果该字符串是由"http://"或"https://"开头,则不会继续向下对URI进行其他处理,而是直接将重写后的URI返回给客户端。

如果你希望在匹配主机信息,可以在if条件中判断,

复制

  1. if ($host = ‘lyblog.net‘) {
  2. rewrite ^.*$ http://www.lyblog.net$request_uri? permanent;
  3. }
  • flag,用来设置rewrite对URI的处理行为,可以为以下标志中的任意一个。
  1. last,终止在本location块中处理接收到的URI,并将处理后的URI作为一个新的URI,使用各location块进行处理。该标志将重写后的URI重新在server块中执行,为重写后的URI提供了转入到其他location块的机会。通过如下例子来加深理解:

复制

  1. location / {
  2. rewrite ^(/lyblog/.*)/media/(.*)\..*$ $1/mp3/$2.mp3 last;
  3. rewrite ^(/lyblog/.*)/audio/(.*)\..*$ $1/mp3/$2.ra last;
  4. }

对于以上的rewrite代码,如果一个请求过来,被以上第2行规则匹配成功,则Nginx会以匹配后的URI再重新到所有的location中再执行一遍。

  1. break,将此处理重写的URI作为新的URI,在本块中继续进行处理。该标识将重写后的地址在当前的location块中执行,不会将新的URI转向其他location块中。请看如下示例:

复制

  1. location /lyblog/ {
  2. rewrite ^(/lyblog/.*)/media/(.*)\..*$ $1/mp3/$2.mp3 break;
  3. rewrite ^(/lyblog/.*)/audio/(.*)\..*$ $1/mp3/$2.ra break;
  4. }

如果URI在第2行匹配成功并处理,Nginx服务器将新的URI继续在location中执行第3行规则中匹配处理,新的URI始终在同一个location块中。

  1. redirect, 将重写后的URI返回给客户端,状态码为302,指明是临时重定向URI,主要用在replacement变量不是以"http://"或"https://"情况。
  2. permanent,将重写后的URI返回给客户端,状态码为301,表示永久跳转。

当使用flag指令时,需要注意各个标识之间的配合。再翻看以上的例子,如果我们把break改成了last会怎么样?因为重写后的URI也是包含lyblog,也就是说在location规则匹配可能会出现死循环。Nginx服务器遇到这种情况,会尝试10循环后,会返回500错误代码。

rewrite_log 指令

这个指令配置是否要开启URK重写日志的输出功能,具体语法如下:

复制

  1. rewrite_log on | off

默认值为off。如果配置为on,URL重写的相关日志将以notice级别输出到error_log指令的配置日志文件中。

set 指令

set指令主要是用来设置变量,其语法结构为:

复制

  1. set variable value
  • variable,变量名,必须以"$"符号作为变量的第一个字符,且不能与Nginx预设的变量同名
  • value,为变量赋值,可以为字符串,其他变量或变量组合

uninitialized_variable_warn 指令

该指令用于配置未初始化的变量时,是否记录警告日志(默认为on),其语法结构如下:

复制

  1. uninitialized_variable_warn on | off

Rewrite 常用全局变量

在Rewrite 功能配置的过程中,可能会使用到Nginx全局变量,方便查阅,特地记录一下(以下示例中均以"http://www.lyblog.net:8081/server/source?arg1=value1&arg2=value2"为例):

变量名 说明 示例
$args 变量中存放了请求URL中的请求参数。 如: arg1=value1&arg2=value2
$content_length http头部中存放了请求头中的Content-length字段  
$content_type http头部中的Content-type字段  
$document_root 存放了针对当前请求的根路径  
$document_uri 存放了当前请求的URI,并且不包含请求参数。 如:/server/source
$host 请求字段的主机字段 如:www.lyblog.net
$http_user_agent 存放请求的客户端的用户代理信息  
$http_cookie 客户端中存在的cookie信息  
$limit_rate 存放Nginx服务器对网络连接速率的限制,也就是Nginx配置limit_rate指令的配置值  
$remote_addr 客户端的ip地址  
$remote_port 客户端与服务器建立连接的端口 如:8081
$remote_user 存放客户端用户名  
$request_body_file 存放了发给后端服务器的本地文件资源的名称  
$request_method 存放客户端的请求方式 如:GET,POST,OPTION等
$request_filename 当前请求的资源文件的路径名  
$request_uri 当前请求的URI,并且附带请求参数 如:/server/source?arg1=value1&arg2=value2
$query_string 与$args含义相同  
$scheme 客户端与服务器请求所用的协议,比如,http,https,ftp等 如:http
$server_protocol 客户端请求的协议版本。如:"HTTP/1.0","HTTP/1.1"  
$server_addr 服务器的Ip地址  
$server_name 客户端请求到达服务器的名称  
$server_port 客户端请求到达服务器的端口号  
$uri 与$document_uri含义相同  

Rewrite 的使用

ngx_http_rewrite_module是Nginx服务器实现Rewrite的模块,通过Rewrite可以实现pathInfo,及常用的nginx的反向代理功能。下面我们通过一个个示例来说明以上指令的使用。

域名跳转

Rewrite可以实现一级域名或多级域名的跳转。示例如下:

复制

  1. ## 示例1
  2. ...
  3. server {
  4. listen 80;
  5. server_name lyblog.net;
  6. rewrite ^/ http://www.lyblog.net/; ## 域名跳转
  7. ...
  8. }
  9. ...
  10. ## 示例2
  11. ...
  12. server {
  13. listen 80;
  14. server_name lyblog.net www.lyblog.net;
  15. if ($host ~ myweb\.net){
  16. rewrite ^(.*) http://www.lyblog.org$1 permanent; ## 多域名跳转
  17. }
  18. }
  19. ## 示例3
  20. ...
  21. server {
  22. listen 80;
  23. server_name demo1.lyblog.net demo2.lyblog.net;
  24. if ($http_host ~* ^(.*)\.lyblog\.net$){
  25. rewrite ^(.*) http://demo.lyblog.net$1; ## 三级域名的跳转
  26. }
  27. }

域名镜象

镜像网站是指将一个完全相同的网站分别放置到几个服务器上,并分别使用独立的URL,其中一个服务器上的网站叫主站,其他的都为镜像网站。镜像站就可以看作是主站的一个副本。可以在主站存在问题时,作备份服务器使用。另外,也可以提高不同地区网站的响应速度。镜像网站可以响应网站流量负载,解决网络带宽封锁等问题。

Nginx中的Rewrite功能可以轻松实现域名镜像的跳转。实现原理很简单,也就是把不同镜像URL重写到指定的URL就可以了。以下是示例配置:

复制

  1. server {
  2. ...
  3. listen 80;
  4. server_name google.lyblog.net;
  5. rewrite ^(.*) http://www.google.com$1 last;
  6. }
  7. server {
  8. ...
  9. listen 81;
  10. server_name bings.lyblog.net;
  11. rewrite ^(.*) http://bings.cn$1 last;
  12. }

当然,我们也可以为某一个目录下镜像,实现如下:

复制

  1. server {
  2. listen 80;
  3. server_name cdn.lyblog.net;
  4. location ^~ /source {
  5. ...
  6. rewrite ^/source(.*) http://cdn.google.com/websrc2$1 last;
  7. }
  8. }
  9. server {
  10. listen 81;
  11. server_name cdn1.lyblog.net;
  12. rewrite ^(.*) http://cdn.baidu.com/
  13. location ^~ /source2 {
  14. ...
  15. rewrite ^/source2(.*) http://cdn.baidu.com/websrc2$1 last;
  16. }
  17. }

目录前自动添加"/"

如果网站设定了默认资源文件,那么客户端访问时可以不加具体的资源文件名。如,你访问:http://www.lyblog.net时,直接就可以访问到"/index.html"文件。

如果访问一个二级目录,如:http://www.lyblog.net/category/index.html;则如果直接输入http://www.lyblog.net/category可能无法访问,必须在后面加上斜线http://www.lyblog.net/category/。像这种情况,也不可能去要求用户这么输入,可以通过Rewrite功能为末尾没有斜杠"/":

复制

  1. server {
  2. ...
  3. listen 81;
  4. server_name www.lyblog.net;
  5. location ^~ /bbs {
  6. ...
  7. if (-d $request_filename){
  8. rewrite ^/(.*)([^/])$ http://$host/$1$2/ permanent;
  9. }
  10. }
  11. }

目录合并

搜索引擎优化是一种利用搜索引擎的索引规则来提高网站排名。其中目录也是增强SEO的一种手段。如一个网站的路径如下:

复制

  1. [root]/server/12/34/56/78/9.html

如果用户访问这个资源,则URL也必须写成http://www.lyblog.net/server/12/34/56/78/9.html;这非常利于SEO,并且对用户的输入也存在难度。对于以上URL,可以改写成http://www.lyblog.net/server/12-34-56-78-9.html,具体配置如下:

复制

  1. server {
  2. ...
  3. listen 80;
  4. server_name www.lyblog.net;
  5. location ^~ /server {
  6. ...
  7. rewrite ^/server-([0-9]+)-([0-9]+)-([0-9]+)-([0-9]+)-([0-9]+)\.html$ /server/$1/$2/$3/$4/$5.html last;
  8. break;
  9. }
  10. }

防盗链

盗链是一种损害原始网站合法利益,给原服务器造成额外负担。首先了解一下防盗链的原理。

客户端向服务器请求资源时,为了减少网络带宽,提高响应速度,服务器一般不会一次把所有资源完整的传给客户端。如,请求一个网页,首先传回网页文本文件,当服务器解析网页时,再开始下载资源文件,如图片,样式表,可执行脚本。如果这些资源文件不是放在该服务器上,而在其他服务器上。这就构成了盗链。

要防止盗链,需要了解HTTP协议中的请求头部的Referer头域和采用URL的格式表示访问当前网页或者文件的源地址。通过头域的值,可以检测到访问目标资源的源地址。这样,如果检测到Referer头域中的值并不是自己站点内的URL,就采取阻止措施,实现防盗链的目的。但是,Referer头域的值是可以更改的,因此该方法不能够完全阻止所有盗链。

Nginx配置中有一个指令 valid_referers,用来获取 Referer 头域中的值,并且根据该值的情况给$invalid_referer变量赋值。如果 Referer 头域中没有符合 valid_referers 指令配置的值,则$invalid_referer 变量将会被赋值为1。valid_referers 指令的语法结构为:

复制

  1. valid_referers none | blocked | server_names | string ...;
  • none,检测Referer头域不存在的情况
  • blocked,检测Referer头域的值被防火墙或代理服务器删除或伪装的情况。这种情况下,该头域的值不以"http://"或者"https://"开头
  • server_names,设置一个或多个URL,检测Referer头域的值是否是这些URL中的某个。在Nginx 0.5.33以后支持使用通配符"*"

有了valid_referers指令和$invalid_referer变量,配合Rewrite功能就可以实现防盗链。有两种实现方案:1、根据资源文件类型;2、根据请求的目录

以下是根据资源文件类型:

复制

  1. server {
  2. ...
  3. listen 80;
  4. server_name www.lyblog.net;
  5. location ~* ^.+\.(gif|jpg|png|swf|flv|rar|zip)$ {
  6. ...
  7. valid_referers none blocked server_names *.lyblog.net;
  8. if ($invalid_referer){
  9. rewrite ^/ http://www.lyblog.net/images/default.jpg;
  10. }
  11. }
  12. }

下面是根据目录实现防盗链的配置:

复制

  1. server {
  2. ...
  3. listen 80;
  4. server_name www.lyblog.net;
  5. location /file/ {
  6. ...
  7. root /server/file/;
  8. valid_referers none blocked server_names *.myblog.net;
  9. if($invalid_referer){
  10. rewrite ^/ http://www.lyblog.net/images/default.jpg;
  11. }
  12. }
  13. }

致谢

本文内容参考来自《Nginx高性能Web服务器详解》。

原创文章,转载请注明出处:小天地,大世界[http://www.lyblog.net]
文章地址:http://www.lyblog.net/2015/600.html

时间: 2024-10-25 02:47:17

Nginx中 Rewrite学习笔记的相关文章

Android中ActivityManager学习笔记(3)

在之前写过2篇关于ActivityManager的文章,如下所示.都是通过实战去了解里面的信息,现在感觉太繁琐,所以做一个api介绍比较详细.就像之前学习Telephony那样,对整体了解整个ActivityManager很有用. Android中ActivityManager学习笔记(1)-MemoryInfo Android中ActivityManager学习笔记(2)-RunningServiceInfo ActivityManager android.app包,含有6个内部类: Memo

VS2013中Python学习笔记[Django Web的第一个网页]

前言 前面我简单介绍了Python的Hello World.看到有人问我搞搞Python的Web,一时兴起,就来试试看. 第一篇 VS2013中Python学习笔记[环境搭建] 简单介绍Python环境的搭建过程,以及Hello World的实现. 第二篇 VS2013中Python学习笔记[基础入门] 我简单学习使用了Python的几个基础的知识点. 第一个Web页面 第一步:首先打开VS2013开发工具 ,新建项目,选择Django Project模版. 修改项目名称,可以查看到项目的文件结

nginx docker镜像学习笔记

最近在看nignx,在本地虚拟机使用docker nginx镜像搭建了nginx+php环境 学习笔记如下: 拉取nginx镜像docker pull nginx 创建一个容器,并挂载本地目录docker run --name some-nginx -v /some/content:/usr/share/nginx/html:ro -d nginx挂载的路径权限为只读(:ro),默认权限是读写. 指定端口docker run --name some-nginx -d -p 8080:80 som

Nginx Rewrite学习笔记

相关指令有if.rewrite.set.return.break等,其中rewrite是最关键的指令. 1.if指令 语法: if(confition){...} 默认值:none 使用环境:server,location 该指令用于检查一个条件是否符合,如果条件符合,则执行大括号内的语句.if指令不支持嵌套,不支持多个条件&&和||处理. 以下信息可以被指定为条件 (1)变量名,错误的值包括:空字符串"",或者任何以0开始的字符串 (2)变量比较可以使用"=

VS2013中Python学习笔记[环境搭建]

前言 Python是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构. Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节.类似于PHP和Perl语言. Python 是交互式语言: 这意味着,您可以在一个Python提示符,直接互动执行写你的程序. Python 是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的

nginx中rewrite用法

一.rewrite规则 rewrite功能就是使用nginx提供的全局变量或自己设置的变量,结合正则表达式和标志位实现url重写以及重定向. rewrite只能放在server{},location{},if{}中,并且只能对域名后边的除去传递的参数外的字符串起作用,例如http://seanlook.com/a/we/index.PHP?id=1&u=str 只对/a/we/index.php重写.语法rewrite regex replacement [flag]; 如果相对域名或参数字符串

linux+nginx+php搭建学习笔记

文章内内容均参考网络上各类文章后自行整理,感谢原文作者的分享. OS环境CentOS release 6.6 一,安装配置nginx 下载目前nginx最新的稳定版本nginx-1.8.0 # wget http://nginx.org/download/nginx-1.8.0.tar.gz 解压编译安装 # tar -xvf nginx-1.8.0.tar.gz# cd nginx-1.8.0# ./configure --prefix=/usr/local/nginx --with-http

Nginx中rewrite实现二级域名、三级域名、泛域名、路径的重写

最常见的: 静态地址重定向到带参数的动态地址 rewrite "^(.*)/service/(.*)\.html$" $1/service.php?sid=$2 permanent; 反过来: 带参数的动态地址重定向到静态地址 if ($query_string ~* id=(.*)) { set $id $1; rewrite "^(.*)/article.asp$" $1/article/$id.htm last; } 泛域名解析 view plaincopy

nginx反向代理学习笔记

Nginx安装比较简单,下面重点说一下关于反向代理功能的一些配置. upstream 指令必须放在 http的上下文当中,创建一个RealServer的服务器池,并给这个服务器池取一个名字,以便后面引用该服务器池. 那么引用方式主要有这几个,fastcgi_pass, proxy_pass, memcached_pass,uwsgi_pass 等. 这里,我们先说一下proxy_pass 这个指令的用法: 1.proxy_pass  URL  后面跟上一个URL,这个指令可以放在 locatio