nginx 正则表达式

1、nginx配置基础

1、正则表达式匹配

~ 区分大小写匹配

~* 不区分大小写匹配

!~和!~*分别为区分大小写不匹配及不区分大小写不匹配

^ 以什么开头的匹配

$ 以什么结尾的匹配

转义字符。可以转. * ?等

* 代表任意字符

2、文件及目录匹配

-f和!-f用来判断是否存在文件

-d和!-d用来判断是否存在目录

-e和!-e用来判断是否存在文件或目录

-x和!-x用来判断文件是否可执行

例:

location = /

#匹配任何查询,因为所有请求都已 / 开头。但是正则表达式规则和长的块规则将被优先和查询匹配

location ^~ /images/ {

# 匹配任何已/images/开头的任何查询并且停止搜索。任何正则表达式将不会被测试。

location ~* .(gif|jpg|jpeg)$ {

# 匹配任何已.gif、.jpg 或 .jpeg 结尾的请求

入门

1、if指令
所有的Nginx内置变量都可以通过if指令和正则表达式来进行匹配,并且根据匹配结果进行一些操作,如下:

 代码如下 复制代码
if ($http_user_agent ~ MSIE) {
  rewrite  ^(.*)$  /msie/$1  break;
}
 
if ($http_cookie ~* "id=([^;] +)(?:;|$)" ) {
  set  $id  $1;
}

使用符号~*和~模式匹配的正则表达式:

1.~为区分大小写的匹配。
2.~*不区分大小写的匹配(匹配firefox的正则同时匹配FireFox)。
3.!~和!~*意为“不匹配的”。
Nginx在很多模块中都有内置的变量,常用的内置变量在HTTP核心模块中,这些变量都可以使用正则表达式进行匹配。

2、可以通过正则表达式匹配的指令
location
查看维基:location
可能这个指令是我们平时使用正则匹配用的最多的指令:

 代码如下 复制代码

location ~ .*.php?$ {
        fastcgi_pass   127.0.0.1:9000;
        fastcgi_index  index.php;
        fastcgi_param  SCRIPT_FILENAME  /data/wwwsite/test.com/$fastcgi_script_name;
        include        fcgi.conf;
    }

几乎每个基于LEMP的主机都会有如上一段代码。他的匹配规则类似于if指令,不过他多了三个标识符,^~、=、@。并

且它没有取反运算符!,这三个标识符的作用分别是:

1.^~ 标识符后面跟一个字符串。Nginx将在这个字符串匹配后停止进行正则表达式的匹配(location指令中正则表达

式的匹配的结果优先使用),如:location ^~ /images/,你希望对/images/这个目录进行一些特别的操作,如增加

expires头,防盗链等,但是你又想把除了这个目录的图片外的所有图片只进行增加expires头的操作,这个操作可能

会用到另外一个location,例如:location ~* .(gif|jpg|jpeg)$,这样,如果有请求/images/1.jpg,nginx如何决

定去进行哪个location中的操作呢?结果取决于标识符^~,如果你这样写:location /images/,这样nginx会将1.jpg

匹配到location ~* .(gif|jpg|jpeg)$这个location中,这并不是你需要的结果,而增加了^~这个标识符后,它在匹

配了/images/这个字符串后就停止搜索其它带正则的location。
2.= 表示精确的查找地址,如location = /它只会匹配uri为/的请求,如果请求为/index.html,将查找另外的

location,而不会匹配这个,当然可以写两个location,location = /和location /,这样/index.html将匹配到后者

,如果你的站点对/的请求量较大,可以使用这个方法来加快请求的响应速度。
[email protected] 表示为一个location进行命名,即自定义一个location,这个location不能被外界所访问,只能用于Nginx产生的

子请求,主要为error_page和try_files。
注意,这3个标识符后面不能跟正则表达式,虽然配置文件检查会通过,而且没有任何警告,但是他们并不会进行匹配


综上所述,location指令对于后面值的匹配顺序为:

1.标识符“=”的location会最先进行匹配,如果请求uri匹配这个location,将对请求使用这个location的配置。
2.进行字符串匹配,如果匹配到的location有^~这个标识符,匹配停止返回这个location的配置。
3.按照配置文件中定义的顺序进行正则表达式匹配。最早匹配的location将返回里面的配置。
4.如果正则表达式能够匹配到请求的uri,将使用这个正则对应的location,如果没有,则使用第二条匹配的结果。
server_name
查看维基:server_name
server_name用于配置基于域名或IP的虚拟主机,这个指令也是可以使用正则表达式的,但是注意,这个指令中的正则

表达式不用带任何的标识符,但是必须以~开头:

 代码如下 复制代码
server {
  server_name   www.example.com   ~^wwwd+.example.com$;
}

server_name指令中的正则表达式可以使用引用,高级的应用可以查看这篇文章:在server_name中使用正则表达式

fastcgi_split_path_info
查看维基:fastcgi_split_path_info
这个指令按照CGI标准来设置SCRIPT_FILENAME (SCRIPT_NAME)和PATH_INFO变量,它是一个被分割成两部分(两个引用

)的正则表达式。如下:

 代码如下 复制代码
location ~ ^.+.php {
  (...)
  fastcgi_split_path_info ^(.+.php)(.*)$;
  fastcgi_param SCRIPT_FILENAME /path/to/php$fastcgi_script_name;
  fastcgi_param PATH_INFO $fastcgi_path_info;
  fastcgi_param PATH_TRANSLATED $document_root$fastcgi_path_info;
  (...)
}

第一个引用(.+.php)加上/path/to/php将作为SCRIPT_FILENAME,第二个引用(.*)为PATH_INFO,例如请求的完整

URI为show.php/article/0001,则上例中SCRIPT_FILENAME的值为/path/to/php/show.php,PATH_INFO则

为/article/0001。
这个指令通常用于一些通过PATH_INFO美化URI的框架(例如CodeIgniter)。

gzip_disable
查看维基:gzip_disable
通过正则表达式来指定在哪些浏览器中禁用gzip压缩。

gzip_disable     "msie6";rewrite
查看维基:rewrite
这个指令应该也是用的比较多的,它需要使用完整的包含引用的正则表达式:

 代码如下 复制代码

rewrite  "/photos/([0-9] {2})([0-9] {2})([0-9] {2})" /path/to/photos/$1/$1$2/$1$2$3.png;通常环境下我们

会把它和if结合来使用:

 代码如下 复制代码

if ($host ~* www.(.*)) {
  set $host_without_www $1;
  rewrite ^(.*)$ http://$host_without_www$1 permanent; # $1为‘/foo‘,而不是‘www.mydomain.com/foo‘
}

Nginx中的正则如何匹配中文
首先确定在编译pcre时加了enable-utf8参数,如果没有,请重新编译pcre,然后就可以在Nginx的配置文件中使用这

样的正则:”(*UTF8)^/[x{4e00}-x{9fbf}]+)$”注意引号和前面的(*UTF8),(*UTF8)将告诉这个正则切换为UTF8模

式。

 代码如下 复制代码

[[email protected] conf]# pcretest
PCRE version 8.10 2010-06-25

re> /^[x{4e00}-x{9fbf}]+/8
data> 测试
 0: x{6d4b}x{8bd5}
data> Nginx模块参考手册中文版
No match
data> 参考手册中文版
 0: x{53c2}x{8003}x{624b}x{518c}x{4e2d}x{6587}x{7248}

location顺序错误导致下载.php源码而不执行php程序的问题

看下面的例子片断(server段、wordpress安装到多个目录): 
=====================================

 代码如下 复制代码

location / { 
        try_files $uri $uri/ /index.html; 
}

location /user1/ { 
      try_files $uri $uri/ /user1/index.php?q=$uri&$args; 
}

location ~* ^/(user2|user3)/ { 
        try_files $uri $uri/ /$1/index.php?q=$uri&$args; 
}

location ~ .php$ { 
        fastcgi_pass 127.0.0.1:9000; 
        fastcgi_index index.php; 
        include fastcgi_params; 
}

=====================================

nginx.conf的配置代码看上去没有任何问题,而事实上: 
访问 /user1/会正常执行php程序。 
访问 /user2/ 或 /user3/ 都不会执行程序,而是直接下载程序的源代码。

原因在哪里?看到他们地区别了吗? 
/user1/是普通location写法 
而/user2/ 或 /user3/ 是正则表达式匹配的location

问题就出在了/user2/ 或 /user3/匹配location指令使用了正则表达式,所以必须注意代码段的先后顺序,必须把

location ~ .php$ {...}段上移、放到它的前面去。

正确的代码举例: 
=====================================

 代码如下 复制代码

location / { 
        try_files $uri $uri/ /index.html; 
}

location /user1/ { 
      try_files $uri $uri/ /user1/index.php?q=$uri&$args; 
}

location ~ .php$ { 
        fastcgi_pass 127.0.0.1:9000; 
        fastcgi_index index.php; 
        include fastcgi_params; 
}

location ~* ^/(user2|user3)/ { 
        try_files $uri $uri/ /$1/index.php?q=$uri&$args; 
}

=====================================

【注意】对于普通location指令行,是没有任何顺序的要求的。如果你也遇到了类似的问题,可以尝试调整使用正则

表达式的location指令片断的顺序来调试

时间: 2024-10-12 09:20:13

nginx 正则表达式的相关文章

Nginx正则表达式之匹配操作符详解

nginx可以在配置文件中对某些内置变量进行判断,从而实现某些功能.例如:防止rewrite.盗链.对静态资源设置缓存以及浏览器限制等等.由于nginx配置中有if指令,但是没有对应else指令,所以判断要分为匹配和不匹配. 字符串表达式支持正则表达式,能设定大小写是否敏感.因此共有四个操作符, 如下: ~     区分大小写(大小写敏感)匹配成功 ~*   不区分大小写匹配成功 !~    区分大小写匹配失败 !~*  不区分大小写匹配失败 1: 限制某些类型的客户端的访问if指令所有的Ngi

nginx正则表达式

$request_filename 当前请求的文件的路径名,由root或alias和URI request组合而成 nginx的rewrite指令中可以通过设置该条rewrite的flag来对该规则进行说明.一般可以设置的flag有:last,break,redirect,permanent四种. redirect说明,这条规则是一个临时的跳转,并且此时如果观察http请求的话,http的响应状态码为302. permanent说明,这条规则是一个永久性的跳转,并且此时,http的响应状态码为3

nginx正则表达式(上篇)

微信公众号:郑尔多斯 关注「郑尔多斯」公众号 ,回复「领取资源」,获取IT资源500G干货.升职加薪.当上总经理.出任CEO.迎娶白富美.走上人生巅峰!想想还有点小激动 关注可了解更多的Nginx知识.任何问题或建议,请公众号留言;关注公众号,有趣有内涵的文章第一时间送达! 前言 在Nginx中location, server_name,rewrite等模块使用了大量的正则表达式,通过正则表达式可以完整非常强悍的功能,但是这部分对我们阅读源码也产生了非常大的困惑.本文就集中精力来学习一下Ngin

Nginx rewrite 重写功能和Nginx的正则表达式

一. Rewrite 跳转实现服务协议功能模块url 资源定位路径 nginx----支持url重写.支持if条件判断,但不支持else 跳转----循环最多可以执行10次,超过后nginx将返回500代码错误 rewrite----使用nginx'全局变量或自己设置的变量,结合正则表达式和标志位实现url重写以及重定向二.Rewrite 使用场景 使用rewrite进行匹配跳转 使用if匹配全局变量后跳转 使用location匹配再跳转1.rewrite放在 server{},if{},loc

nginx正则说明

nginx正则说明 分类: nginx 2012-08-09 09:40 11758人阅读 评论(0) 收藏 举报 nginx正则表达式firefox ^~ 标识符后面跟一个字符串.Nginx将在这个字符串匹配后停止进行正则表达式的匹配(location指令中正则表达式的匹配的结果优先使用),如:location ^~ /images/,你希望对/images/这个目录进行一些特别的操作,如增加expires头,防盗链等,但是你又想把除了这个目录的图片外的所有图片只进行增加expires头的操作

nginx和lnmp架构

nginx的概述及常见Web服务器的介绍: Unix和Linux平台下的常用Web服务器有Apache. Nginx. Lighttpd. Tomcat. IBM WebSphere等.其中目前应用最广泛的Web服务器是Apache. Windows平台下最常用的服务器则是微软公司的IIS(Internet Information Server).1)Apache服务器 Apache 起初由 Illinois 大学 Urbana-Champaign 的国家高级计算程序中心开发.此后Apache

Nginx配置文件变量大全

$args # 这个变量等于请求行中的参数. $binary_remote_addr # 远程地址的二进制表示 $body_bytes_sent # 已发送的消息体字节数 $content_length # 请求头中的Content-length字段 $content_type # 请求头中的Content-Type字段 $document_uri # 与$uri相同 $document_root # 当前请求在root指令中指定的值 $host # 请求主机头字段,否则为服务器名称 $http

Nginx中rewrite实现二级域名、三级域名、泛域名、路径的重写

最常见的: 静态地址重定向到带参数的动态地址 rewrite "^(.*)/service/(.*)\.html$" $1/service.php?sid=$2 permanent; 反过来: 带参数的动态地址重定向到静态地址 if ($query_string ~* id=(.*)) { set $id $1; rewrite "^(.*)/article.asp$" $1/article/$id.htm last; } 泛域名解析 view plaincopy

【重要】Nginx模块之————Lua的Nginx API 常量以及参数介绍 (Lua-Nginx-Module 模块)

一.介绍 各种* _by_lua,* _by_lua_block和* _by_lua_file配置指令用作nginx.conf文件中Lua API的网关. 下面描述的Nginx Lua API只能在这些配置指令的上下文中运行的用户Lua代码中调用.API以两个标准软件包ngx和ndk的形式暴露给Lua. 这些软件包位于ngx_lua中的默认全局范围内,并且始终可在ngx_lua指令中使用. 这些包可以像这样引入外部Lua模块: local say = ngx.say local _M = {}