Apache HTTP Server 映射URL到文件系统

div.example { background-color: #e5ecf3; color: #000; padding: 0.5em; margin: 1em 2em 1em 1em }
div.warning { border: 1px solid #f00 }

本文解释了Apache HTTP Server如何应用请求的URL来决定获取文档的文件系统位置。

DocumentRoot

对于决定向一个请求响应什么内容,httpd的默认行为是取得请求的URL-Path(主机名和端口号后面的URL路径),然后把它加在配置文件中指定的DocumentRoot后面。因此,在DocumentRoot下面的文件和目录构成了web基本的文档树。

例如,如果DocumentRoot被设置为/var/www/html,那么请求 http://www.example.com/fish/guppies.html 将会获得/var/www/html/fish/guppies.html作为客户端响应。

如果请求的是一个目录(也就是 path以/结尾), 那么响应的文件是由 DirectoryIndex 指令指定的。例如如果DocumentRoot按照上面的设置,然后设置

DirectoryIndex index.html index.php

如果这些文件不存在,那么如果mod_autoindex模块被加载并且配置允许的话,就会尝试提供一个目录索引。

httpd还具有Virtual Hosting的能力,Virtual Hosting可以让httpd能够接受多个主机的请求。在这种情况下,可以为每一个虚拟主机指定一个DocumentRoot,mod_vhost_alias 模块提供的目录可以被用来根据请求的IP地址或者主机名动态决定提供文件的合适位置。

DocumentRoot指令可以被设置在主配置文件中(httpd.conf),但是更有可能的是,为每一个虚拟主机指定一个 DocumentRoot。

DocumentRoot之外的文件

经常会有这样的情况:我们需要web来访问DocumentRoot之外的文件。httpd提供了几种方式来实现这个需求。在Unix系统中,软连接(symbolic links)可以用来将其他位置的文件放到DocumentRoot之内。 为了安全考虑,httpd只有在相关目录的Options设置中包含有FollowSymLinks 或者SymLinksIfOwnerMatch时才会允许访问软连接。

或者我们可以使用Alias指令来将文件系统中的任意位置映射到web空间中。 例如,设置

Alias "/docs" "/var/web"

那么请求http://www.example.com/docs/dir/file.html将会被响应 /var/web/dir/file.html。 ScriptAlias 指令能够起到同样的效果,只不过请求访问的到目标文件会被作为CGI脚本看待。

对于需要更大灵活性的情况,我们可以使用AliasMatch 和ScriptAliasMatch 指令来指定基于匹配和替换的强大的正则表达式。例如:

ScriptAliasMatch "^/~([a-zA-Z0-9]+)/cgi-bin/(.+)" "/home/$1/cgi-bin/$2"

将会将请求 http://example.com/~user/cgi-bin/script.cgi 映射到文件系统中的 /home/user/cgi-bin/script.cgi, 并把这个映射到的目标文件作为CGI脚本看待。

用户目录(user-dir)

在传统的Unix系统中,一个特定的用户的家目录可以使用~user/来访问。mod_userdir 模块将这个用法扩展到了web中来: 我们可以使用下面的这样的URL来访问位于每个用户家目录中的文件。

http://www.example.com/~user/file.html

基于安全考虑,从web中直接访问用户的家目录是不合适的。因此, UserDir指令可以指定一个位于用户家目录下面的目录,用来存放web文件。UserDir的默认值为public_html, 所以上面的URL将被映射到/home/user/public_html/file.html。其中/home/user是在/etc/passwd中指定的用户家目录。

对于/etc/passwd中不存在用户家目录路径的系统,我们可以使用其他几种形式的UserDir。

有些人认为在URL中使用~符号(经常会被url转码为%7e)是不合适,他们更喜欢使用另外一个字符串来代表用户家目录。mod_userdir模块并不支持这个功能。但是,如果用户的家目录是按照一个有规律的方式组织的话,那么使用AliasMatch 指令是可能达到期待的效果的。例如,为了将 http://www.example.com/upages/user/file.html映射到/home/user/public_html/file.html,可以使用下面的AliasMatch指令:

AliasMatch "^/upages/([a-zA-Z0-9]+)(/(.*))?$" "/home/$1/public_html/$3"

URL重定向

上面讨论的配置指令用来让httpd从文件系统中的特定位置获得文件来响应客户端。 但是有时,我们期待能够告诉客户端请求的内容位于另一个URL中,从而使得客户端可以发送一个新的对于这个URL的请求。这种机制被称为 重定向(redirection), 可以使用Redirect 指令来实现。例如,如果DocumentRoot下的/foo/目录中的内容全部移到了另一个目录/bar/下面,你可以指示客户端重新发送一个请求来获取新目录下面的文件。

Redirect permanent "/foo/" "http://www.example.com/bar/"

上面的配置将会将以/foo/开头的URL-Path重定向到www.example.com下面的将/foo/替换为/bar/的相同路径上,例如 http://www.yousite.com/foo/fish/guppies.html 将会被重定向到 http://www.example.com/bar/fish/guppies.html。 就像上面的例子那样,我们可以将客户端重定向到任意的server,并不局限于原始的server。

httpd同样提供了RedirectMatch指令来应对更加复杂的重定向问题。例如,为了将站点的首页重定向到另一个站点,但是其他的访问并不重定向,可以使用下面的配置:

RedirectMatch permanent "^/$" "http://www.example.com/startpage.html"

或者,可以像下面这样将一个站点的所有页面全部重定向到另一个站点中:

RedirectMatch temp ".*" "http://othersite.example.com/startpage.html"

注释1: 上面两个配置中的 permanent 和 temp将会作用到客户端收到的重定向响应(301)的头信息中。

注释2: 下面将会讲到httpd的反向代理,在此我们首先需要明确重定向最重要的特性是: 服务端会主动让客户端接受到301 重定向响应,然后让客户端重新发起一个新的请求,也就是说客户端对于这个过程是了解的。而反向代理则正好相反,服务端会尽量将真实的资源来源(被代理服务器)隐藏起来,而让客户端感觉就像这些资源真的就来自于代理服务器一样。

反向代理(Reverse Proxy)

httpd同样允许我们将远程站点的文档放到本地站点的URL空间中。这种技术叫做反向代理(reverse proxying)。这是因为web服务器会像代理服务器那样从远程服务器中抓取文档并将它们响应到客户端。 但是它与普通代理(normal(forward) proxy)不同的是,反向代理会让这些远程文档看起来就像是来源自反向代理服务器自身中一样,换句话说也就是隐藏了这些文档的真实来源。

在下面的例子中,当客户端请求位于/foo/目录下面的文档时, 反向代理服务器会从internal.example.com的/bar/目录下面抓取文档并返回给客户端,对客户端来讲,这些文档就像是来自反向代理服务器一样。

ProxyPass "/foo/" "http://internal.example.com/bar/"
ProxyPassReverse "/foo/" "http://internal.example.com/bar/"
ProxyPassReverseCookieDomain internal.example.com public.example.com
ProxyPassReverseCookiePath "/foo/" "/bar/"

ProxyPass指令会让反向代理服务器去远程站点抓取文档(注释:实际上仅仅配置这个指令就可以达到最基本的代理)。
ProxyPassReverse 指令会让httpd调整在Location, Content-Location和URI 头信息中的URL,也就是将被代理站点发出的响应中的这三个头信息中的URL内容替换为反向代理站点。
ProxyPassReverseCookieDomain 调整set-cookie头信息中的domain内容。
ProxyPassReverseCookiePath 调整set-cookie头信息中的path内容。

非常值得注意的是: 在被代理的文档中的链接并不会被重写。所以任何绝对路径的链接最终还是会请求到被代理服务中去。更多相关的内容可以参考mod_substitute.和mod_proxy_html

注释: 说说我对正向代理的理解,比如我们无法直接访问外网,需要通过代理服务器来访问,那么客户端实际上会先将请求发送给代理,然后代理可能会再去访问请求中的目标,并将真实目标的响应回传到客户端,也可能利用自身的缓存(cache)直接响应给客户端。 无论哪种方式,客户端并不会意识到代理的存在,它会认为我请求的是站点a,那么我得到的响应同样来自单点a。我们在浏览器中配置的网络代理其实就是正向代理。

时间: 2024-08-19 17:17:29

Apache HTTP Server 映射URL到文件系统的相关文章

Apache HTTP Server 与 Tomcat 的三种连接方式介绍

Apache HTTP Server 与 Tomcat 的三种连接方式介绍 整合 Apache Http Server 和 Tomcat 可以提升对静态文件的处理性能.利用 Web 服务器来做负载均衡以及容错.无缝的升级应用程序.本文介绍了三种整合 Apache 和 Tomcat 的方式. 3 评论: 刘 冬 ([email protected]), 开发工程师, 2007 年 1 月 15 日 内容 首先我们先介绍一下为什么要让 Apache 与 Tomcat 之间进行连接.事实上 Tomca

apache httpd server

web 服务介绍 web服务时一种应用程序的服务,它所提供的最主要的信息是一种超文本标记语言(HTML).多媒体资源(如:视频.图片.音乐等).HTML是一种纯文字的文本信息,通过所谓的标签来规范所要显示的内容格式,在客户端通过浏览器的形式对HTML及多媒体资源进行解析,然后呈现在终端上.主要由http和https协议实现 http协议 HTTP是一个属于应用层的面向对象的协议,B/S架构,由于其简单.快速的方式,适用于分布式超媒体信息系统.它于1990年提出,经过几年的使用与发展,得到不断的完

怎样从外网访问内网Apache HTTP Server

本地安装了一个Apache HTTP Server,只能在局域网内访问,怎样从外网也能访问到本地的Apache HTTP Server呢?本文将介绍具体的实现步骤. 1. 准备工作 1.1 安装并启动Apache HTTP Server 默认安装的Apache HTTP Server端口是80. 2. 实现步骤 2.1 下载并解压holer软件包 Holer软件包:holer-xxx.tar.gz Holer支持各种OS系统平台,请选择跟本地OS类型匹配的holer软件包. 2.2 获取hole

Holer实现外网访问本地Apache HTTP Server

外网访问内网Apache HTTP Server 内网主机上安装了Apache HTTP Server,只能在局域网内访问,怎样从公网也能访问本地Apache HTTP Server? 本文将介绍使用holer实现的具体步骤. 1. 准备工作 1.1 安装并启动Apache HTTP Server 默认安装的Apache HTTP Server端口是80. 2. 实现步骤 2.1 下载并解压holer软件包 Holer软件包:holer-xxx.tar.gz Holer支持各种OS系统平台,请选

CentOS 7安装配置Apache HTTP Server

原文 CentOS 7安装配置Apache HTTP Server   RPM安装httpd # yum -yinstall httpd //安装httpd会自动安装一下依赖包: apr apr-util httpd-tools mailcap # rpm -qi httpd Name      : httpd Version    : 2.4.6 Release    : 18.el7.centos Architecture: x86_64 Install Date: Mon 11 Aug 2

CentOS7安装配置Apache HTTP Server

安装httpd 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 # yum -yinstall httpd //安装httpd会自动安装一下依赖包: apr apr-util httpd-tools mailcap # rpm -qi httpd Name       : httpd Version    : 2.4.6 Release    : 18.el7.centos Architecture: x8

Windows 下 Apache HTTP Server 安装、配置以及与 Tomcat 的整合(附图)

如果您能点开这篇文章,说明您已对熟悉Apache HTTP Server(下文用Apache简称)配置的重要性已很清楚了,本文不在赘述,直接介入正题,请往下阅读: 为便于阅读,列出文章目录: 一.Apache 的安装说明 二.Apache 的基本配置 三.Apache 整合 Tomcat 的配置 以下为正文内容: 一.Apache 的安装说明 1.首先打开Apache官网,进入Windows版本的下载地址页面:http://archive.apache.org/dist/httpd/binari

Apache HTTP Server .htaccess文件详解

本篇是对Apache httpd 2.2版.htaccess官方帮助文档的翻译,力求严谨准确 Apache HTTP Server 教程:.htaccess文件 .htaccess文件提供了的一种基于每目录进行配置修改的方法. .htaccess文件 相关模块                        相关指令 core                               AccessFileName mod authn file              AllowOverride

安装ATS(apache traffic server)正向代理

一 traffic server简介 Traffic Server是一种高性能Web代理缓存,可通过在网络边缘缓存频繁访问的信息来提高网络效率和性能.这使内容在物理上更接近最终用户,同时实现更快的交付和更少的带宽使用.Traffic Server旨在通过最大化现有和可用带宽来改善企业,Internet服务提供商(ISP),骨干提供商和大型Intranet的内容交付. 实现功能 作为Web代理缓存 作为Web代理缓存,Traffic Server会在这些请求前往目标Web服务器(源服务器)时接收用