haproxy简述

haproxy是免费、极速且可靠的用于为TCP和基于HTTP应用程序提供高可用、负载均衡和代理服务的解决方案,尤其适用于高负载且需要持久连接或者7层处理机制的web站点,这些站点通常又需要会话保持或七层处理,HAProxy运行在当前硬件上,完全可以支持数以万讲的并发连接。并且它的运行模式使得它可以很简单安全的整合进行您当前的架构中

HAProxy目前主要有两个版本:

1.4----提供较好的弹性,衍生于1.2版本,并提供了额外的新特性,其中大多数是期待己久的

客户端侧的长连接(client-side keep-alive)

TCP加速(TCP speedups)

响应池(response buffering)

RDP协议

基于源的粘性(source-based stickness)

可支持基于URI地址将客户端的请求调度到同一个后端服务器,适用于缓存服务器,提高缓存服务器的命中率

更好的统计数据接口(a much better stats interfaces)

更详细的健康状态检测机制(more verbose health checks)

基于流量的健康评估机制(traffic-based health)

支持HTTP认证

服务器管理命令行接口(server managerment from CLI)

基于ACL的持久性连接(ACL-based persistence)

日志分析器

1.3---------内容交换和超强负载:衍生于1.2版本,并提供了额外的新特征

内容交换(content switching):基于任何请求标准挑选服务器池

ACL:编写内容交换规则

负载均衡算法(load-balancing algorithms):更多算法的支持

内容探测(content inspection):阻止非授权协议

透明代理(transparent proxy):在Linux系统上允许使用客户端IP直接连入服务器

内核TCP拼接(kernel TCP splicing):无copy方式在客户端和服务器间转发数据以实现G级别的数据速率

分层设计(layered design):分别实现套接字、TCP、HTTP处理以提供更好的健壮性、更快的处理机制及便捷的演进能力

快速、公平调度器(fast and fair scheduler):为某些任何指定优先级可实现更好的QOS

会话速率限制(session rate limiting):适用于托管环境

支持的平台及OS:

x86,x86_64,Alpha,SPARC,MIPS及PARISC平台上的linux 2.4

x86,x86_64,ARM(ixp245)及PPC64平台上的Linux 2.6

UltraSPARC 2和3上的Sloaris 8/9

Opteron和UltraSPARC平台上的Sloaris 10;

x86平台上的FreeBSD 4.1-8

i386,amd64,macppc,alpha,sparc64和VAX平台上的OpenBSD 3.1-current

若要获得最高性能,需要在Linux 2.6或打了epoll补丁的Linux 2.4上运行haproxy 1.2.5以上的版本,haproxy 1.1默认使用的polling系统为select(),其处理的文件数达数千 个时性能便会急剧下降。1.2和1.3版本的默认为poll(),在有些操作系统上可能会有性能方面的问题,但在Sloaris上表现相当不错。Haproxy 1.3在Linux 2.6及打了epoll补丁的Linux 2.4上默认使用epoll,在FreeBSD上使用kqueue,这两种机制在任何负载上都能提供恒定的性能表现

在较新版本的Linux 2.6(>=2.6.27.19)上,HAProxy还能够使用splice()系统调用在接口间无复制地转发任何数据,这甚至可以达到10Gbps的性能。

基于以上事实,在x86或x86_64平台上,要获取最好性能的负载均衡器,建议按顺序考虑以下方案:

Linux 2.6.32及之后版本上运行HAProxy 1.4;

打了epoll补丁的Linux 2.4运行HAProxy 1.4

FreeBSD上运行HAProxy 1.4

Sloaris 10上运行HAProxy 1.4

性能

HAProxy借助于OS上几种常见的技术来实现性能的最大化

单进程、事件驱动模型显著降低了上下文切换的开销及内存占用

O(1)事件检查器(event checker)允许其在高并发连接中对任何连接的任何事件实现即时探测

O(1):随着队列增长,挑选下一个程序运行的标准规范

在任何可用的情况下,单(single buffering)机制能以不复制任何数据的方式完成读写操作,这会节约大量的CPU时钟周期以及内存带宽

借助于Linux 2.6上的splice()系统调用 ,HAProxy可以实现零复制转发(zero-copy forwarding),Linux 3.5及以上的OS中还可以实现零复制启动(zero-starting)

MRU内存分配器在固定大小的内存池中可实现即时内存分配,这能够显著减少创建一个会话的时长

树型存储:侧重于使用作者多年前开发的弹性二叉树,实现为o(log(N))的低开销来保持计时器命令、保持运行队列命令及管理轮询及最少连接队列

优化的HTTP首部分析:优化的首部分析功能避免了在HTTP首部分析过程中重读任何内存区域

精心地降低了昂贵的系统调用,大部分工作都在用户空间完成,如时间读取、缓冲聚合及文件描述符的启用和禁用等

所有的这些细微之处的优化实现了在中等规模负载之上依然有着相当低的CPU负载,甚至于在非常高的负载场景中,5%的用户空间占用率和95%的系统空间占用率也是非常普遍的现象,这意味着HAProxy进程消耗比系统空间消耗低20倍以上,因此,对OS进行性能调优是非常重要的。即使用户空间的占用率提高一倍,其CPU占用率也仅为10%,这也解释了为何7层处理对性能影响有限这一现象。由此,在高端系统上HAProxy的7层性能可轻易超过硬件负载均衡设备。

在生产环境中,在7层处理上使用HAProxy作为昂贵的高端硬件负载均衡设备故障时的紧急解决方案也时长可见。硬件负载均衡设备在"报文"级别处理请求,这在支持跨报文请求(request across multiple packets)有着较高的难度,并且它们不缓冲任何数据,因此有着较长的响应时间。对应地,软件负载均衡设备使用TCP缓冲,可建立极长的请求,且有着较大的响应时间

Haproxy:

1、具有一定的高可用性能,可以检查后端服务器的健康状况

2、可靠的、高性能 的TCP/HTTP的反向代理服务器

3、提供功能丰富的GUI界面

4、基于事件驱动、单进程响应多个请求

可以从三个因素评估负载均衡器的性能:

会话率:单位时间内完成的会话数

会话并发能力:同时持有的会话数

数据率:单位时间内所能进行数据交换的能力

haproxy配置文件格式

最优先处理的命令行参数

"global"配置段,设置全局参数

进程定义相关配置

优化相关配置

"proxy"配置段,如"default" "listen" "frontend" "backend"

时间格式:

us:微秒

ms:毫秒

s:秒

m:分钟

h:小时

d:天

配置文件例子:

global

daemon

maxconn 25600

defaults

mode http

timeout connect 5000ms

time client 5000ms

time server 5000ms

frontend http-in

bind *:80

default_backend servers

backend servers

server server1 127.0.0.1:8000 maxconn 32

全局配置项

进程管理及安全相关的参数

chroot <dir>:修改haproxy的工作目录到指定的目录并在放弃权限前执行chroot()操作,可以提升haproxy的安全级别,注意要确保指定的目录为空目录且任何用户都不能有写权限

daemon:让haproxy以守护进程的方式工作于后台,也可以在命令行中以"--db"选项将其禁用

gid <number>:指定运行haproxy的GID,建议使用专用于运行haproxy的GID,以免因权限问题带来风险

group <group_name>:同gid,只不过用的是组名

log <address> <facility> [max level [min level]]:定义全局的syslog服务器,最多可以定义两个

log-send-hostname [<string>]:在syslog信息的首部添加当前主机名,可以为"string"指定的名称,也可以缺少使用当前主机名

nbproc <number>: 指定启动的harpoxy进程个数,只能用于守护进程模式的haproxy;默认只启动一个进程,鉴于调试困难等多方面原因,一般只在单进程仅能打开少数据文件描述符的场景中才使用多进程模式

pidfile:

uid:以指定的UID身份运行haproxy进程

user:同uid,只不过使用的是用户名

ulimit-n:设置每进程所能够打开的最大文件描述符数目,默认情况下其会自动计算,因此不推荐修改此选项

stats:

node:定义当前节点的名称,用于HA场景中多haproxy进程共享同一个IP地址时

description:当前实例的描述信息

性能调整相关的参数:

maxconn <number>:设定每个haproxy进程所接受的最大并发连接数,其等同于命令行选项"-n";"ulimit -n"自动计算的结果正是参照此参数设定的

maxpipes <number>:haproxy使用pipe完成基于内核的tcp报文重组,此选项用于设定每进程所允许使用的最大pipe个数;每个pipe会打开两个文件描述符,因此,"ulimit -n"自动计算时会根据需要调大此值,默认为maxconn/4,其通常会显得过大

noepoll:在Linux系统上禁用epoll机制

nokqueue:在BSE系统上禁用kqueue机制

nopoll:禁用poll机制

nosepoll:在Linux禁用启发式epoll机制

nosplice:禁止在Linux套接字上使用内核tcp重组,这会导致更多的recv/send系统调用;不过在Linux 2.6.25--28系列的内核上,tcp重组功能有bug存在

spread-check <0..50,inpercent>

在haproxy后端有着众多服务器的场景中,在精确的时间间隔后统一对众多服务器进行健康状况检查可能会带来意外问题; 此选项用于将其检查的时间间隔长度上增加或者减少一定的随机时长;

tune.chksize <number>: 设定检查缓冲区的大小 ,单位为字节;更大的值有助于在较大的页面中完成基于字符串或者模式的文本查找,但也会占用更多的系统资源;不建议修改

tune.maxaccept <number>:

设定haproxy进程内核调度运行时一次性可以接受的连接的个数;较大的值可以带来较大的吞吐率,默认在单进程模式下为100,多进程模式下为8;设置为-1可以禁止此限制;一般不建议修改

tune.maxpollevents <number>:

设定一次系统调用可以处理的事件最大数,默认值取决于OS;其值小于200时可节约带宽,但会略微增大网络延迟,而大于200时会降低延迟,但会稍微增加网络带宽的占用量

tune.maxrewrite <number>:

设定为首部重写或追加而预留的缓冲空间,建议使用1024左右的大小; 在需要使用更大的空间时,haproxy会自动增加其值;

tune.rcvbuf.client <number>

tune.rcvbuf.server <number>:

设定内核套接字中服务器端或者客户端接收缓冲的大小 ,单位为字节;强烈推荐使用默认值

tune.sndbuf.client

tune.sndbuf.server

Debug相关参数:

debug

quiet

代理段配置项:

defaults <name>

frontend <name>

backend  <name>

listen   <name>

"defaults"段用于为所有其它配置段提供默认参数,这配置默认配置参数可由下一个"defaults"重新设定

"frontend"段用于定义一系列监听的套接字,这些套接字可接受客户端请求并与之建立连接

"backend"段用于定义一系列"后端"服务器,代理将会将对应客户端的请求转发到这些服务器

"listen"段通过关联"前端"和"后端"定义了一个完整的代理,通常只对TCP流量有用

所有代理的名称只能使用大小写字母、数字,-,_,.和:冒号。此外,ACL名称会区分大小写

配置文件中的关键字参考

1、balance

balance <algorithms> [ <arguments> ]

balance url_param <param> [ check_post [ <max_wait> ]]

定义负载均衡算法,可用于"defaults","listen","backend"

用于在负载均衡场景中挑选一个server,其仅应用于持久信息不可用的条件下或需要一个连接重新派发到另一个服务器时。支持的算法有:

roundrobin:基于权重进行轮叫,在服务器的处理时间保持均匀分布时,这是最平衡、最公平的算法。此算法是动态的,这表示权重可以在运行时进行调整,不过,在设计上,每个后端服务器仅能最多接受4128个连接;

static-rr:基于权重进行轮叫,与roundrobin类似,但是为静态方法,在运行时调整其服务器权重不会生效;不过,其在后端服务器连接数上没有限制

leastconn:新的连接请求被派发到具有最少连接数的后端服务器;在有着较长时间会话的场景中推荐使用此算法,如LDAP SQL等,其并不太适用于较短会话的应用层协议,如HTTP;此算法是动态的,可以在运行时调整其权重

source:将请求的源地址进行hash运算,并由后端服务器的权重总数相除后派发到某匹配的服务器;这可以使得同一个客户端的IP的请求始终被派发到某特定的服务器;不过,当服务器权重总数发生变化时,如某服务器宕机或添加了新的服务器,许多客户端的请求可能会被派发到与此前请求不同的服务器;常用于负载均衡无cookie功能的基于TCP的协议;其默认为静态,不过也可以使用hash-type修改此特性

uri:对URI的左半部分或者整个URI进行hash运算,并由服务器的总权重相除后派发到某匹配的服务器;这可以使得对同一个URI的请求总是被派发到某特定的服务器,除非服务器的权重总数发生了变化;此算法常用于代理缓存或反病毒代理以提高缓存的命中率;需要注意的是,此算法仅应用于HTTP后端服务器场景;其默认为静态算法,不过也可以使用hash-type修改此特性

url_param:通过<arguments>为URL指定的参数在每个HTTP GET请求中将会被检索;如果找到了指定参数且其通过等于号"="被赋予了一个值,那么此值将被执行hash运算并被服务器的总权重相除后派发至某匹配的服务器;此算法可以通过追踪请求中的用户标识进而确保同一个用户ID的请求将被送往同一个特定的服务器,除非服务器的总权重发生了变化,如果某请求中没有出现指定的参数或其没有有效值,则使用轮叫算法对相应请求进行调度;此算法默认为静态,不过其也可以使用hash-type进行调整

hdr(<name>):对于每个HTTP请求,通过<name>指定的HTTP首部会被检索;如果相应的首部没有出现或其没有有效值,则使用轮叫算法对相应请求进行调度;其有一个可选选项"use_domain_only",可在指定检索类似Host类的首部时仅计算域名部分以降低hash算法的运算量;此算法默认为静态的,不过也可以通过hash-type进行调整

rdp-cookie

rdp-cookie(name)

2、bind

bind [<address>]:<port_range> [,...]

bind [<address>]:<port_range> [,...] interface <interface>

此指令仅能用于frontend和listen区段,用于定义一个或几个监听的套接字

<address>:可选选项,其可以为主机名,IPV4、IPV6地址;省略此选项,将其指定为*或者0.0.0.0时,将监听当前系统的所有IPV4地址

<port_range>:可以是一个特定的TCP端口,也可是一个端口范围(5000-10240),代理服务器将通过指定的端口来接收客户端请求;需要注意的是,每组监听的套接字<address:port>在同一个实例上只能使用一次,而且小于1024的端口需要有特定权限的用户才能使用,这可能需要通过uid参数来定义

<interface>:指定物理接口的名称,仅能在Linux系统上使用;其不能使用接口别名,而仅能使用物理接口名称,而且只有管理员有权限绑定的物理接口;

3、mode

mode { tcp | http | health }

设定实例的运行模式或协议,当实现内容交换时,前端和后端必须工作于同一个模式(一般来说都是HTTP模式),否则将无法启动实例

tcp:实例运行于纯TCP模式,在客户端和服务器端间将建立一个全双工的连接,且不会对7层报文做任何类型的检查;此为默认模式,通常用于SSL, SSH,SMTP等应用

http:实例运行于HTTP模式,客户端请求在转发到后端服务器之前将被深度分析,所有不与RFC格式兼容的请求都会被拒绝

health:实例运行于health模式,其对入站请求仅响应"OK"信息并关闭连接,且不会记录任何日志信息;此模式将用于响应外部组件的健康状态检查请求;目前来讲,此模式已经废弃,因为tcp或者http模式中的monitor关键字可完成类似功能

4、hash-type

hash-type <method>

定义用于将hash码映射至后端服务器的方法;其不能用于frontend段;可用方法有map-based和consistent,在大多数场景下推荐使用默认的map-based方法

map-based:hash表是一个包含了所有在线服务器的静态数组。其hash值将会非常平滑,会将权重考虑在列,但其为静态方法,对在线服务器的权重进行调整将不会生效,这意味着其不支持慢速启动。此外,挑选服务器是根据其在数组中的位置进行的,因此,当一台服务器宕机或添加了一台新的服务器时,大多数连接将会被重新派发至一个与此前不同的服务器上,对于缓存服务器的工作场景来说,此方法不甚适用。

consistent:hash表是一个由各服务器填充而成的树状结构;基于hash键在hash树中查找相应的服务器时,最近的服务器将被选中。此方法是动态的,支持在运行时修改服务器权重,因此兼容慢速启动的特性。添加一个新的服务器时,仅会对一小部分请求产生影响,因此,尤其适用于后端服务器为cache的场景。不过,此算法不甚平滑,派发至各服务器的请求未必能达到理想的均衡效果,因此,可能需要不时的调整服务器的权重以获得更好的均衡性。

5、log

log global

log <address> <facility> [<level> <minlevel>]

为每个实例启用事件和流量日志,因此可用于所有区段。每个实例最多可以指定两个log参数,不过,如果使用了"log global"且"global"段已经定了两个log参数时,多余的log参数将被忽略。

global:当前实例的日志系统参数同"global"段中的定义时,将使用此格式;每个实例仅能定义一次"log global"语句,且其没有任何额外参数

<address>:定义日志发往的位置,其格式之一可以为<ipv4 <address:port>,其中的port为UDP协议的端口,默认为514;格式之二为unix套接字文件路径,但需要留心chroot应用及用户的读写权限;

<facility>:可以为syslog系统的标准facility之一

<level>:定义日志级别,即输出信息过滤器,默认为所有信息;指定级别时,所有等于或高于此级别的日志信息将会被发送

6、maxconn

maxconn <conns>

设定一个前端的最大并发连接数,因此,其不能用于backend区段。对于大型站点来说,可以尽可能提高此值以便让haproxy管理连接队列,从而避免无法应答用户请求。当然,此最大值不能超出"global"段中的定义。此外,需要留心的是,haproxy会为每个连接维持两个缓冲,每个缓冲的大小为8KB,再加上其它的数据,每个连接将大约占用17KB的RAM空间。这意味着经过适当优化后,有着1GB的可用RAM空间时将能维护40000-50000并发连接。

如果为<conns>指定了一个过大值,极端场景中,其最终占据的空间可能会超出当前主机的可用内存,这可能会带来意想不到的结果;因此,将其设定了一个可接受值方为明智决定。其默认为2000

7、default_backend

default_backend <backend>

在没有匹配的"use_backend"规则时为实例指定使用的默认后端,因此,其不可应用于backend段。在"frontend"和"backend"之间进行内容交换时,通常使用"use_backend"定义其匹配规则;而没有被规则匹配到的请求将由此参数指定的后端接收

<backend>:指定使用的后端名称

使用案例:

use_backend dynamic if url_dyn

use_backend static  if url_class  url_img  extension_img

default_backend  dynamic

8、server

server <name> <address>[:port] [param*]

为后端声明一个server,因此,不能用于defaults和frontend段。

<name>:为此服务器指定的名称,其将出现在日志及警告信息中;如果设定了"http-send-server-name",它还将被添加至发往此服务器的请求首部中

<address>:为此服务器的IPV4地址,也支持使用可解析的主机名;只不过在启动时需要解析主机名至相应的IPV4地址

[:port]:指定将连接请求所发往的此服务器时的目标端口,其为可选项;未设定时,将使用客户端请求时的同一个端口

[param*]:为此服务器设定的一系列参数;其可用的参数非常多,常用的如下:

服务器或默认服务器参数:

backup:设定为备用服务器,仅在负载均衡场景中的其它server均不可用于启用此server

check:启动对此server执行健康状态检查,其可以借助于额外的其它参数完成更精细的设定。如:

inter <delay>:设定健康状态检查的时间间隔,单位为毫秒,默认为2000;也可以使用fastinter和downinter来根据服务器端状态优化此时间延迟

rise <delay>:设定健康状态检查中,某离线的server从离线状态转换到正常状态需要成功检查的次数

fall <delay>:确认server从正常状态转换为不可用状态需要检查的次数

cookie <value>:为指定server设定cookie值,此处指定的值将在请求入站时被检查,第一次为此值挑选的server将在后续的请求中被选中,其目的在于实现持久连接的功能

maxconn <maxconn>:指定此服务器接受的最大并发连接数;如果发往此服务器的连接数目高于此处指定的值,其将被放置于请求队列,以等待其它连接被释放

maxqueue <maxqueue>:设定请求队列的最大长度

observe <mode>:通过观察服务器的通信状况来判定其健康状态,默认为禁用,其支持的类型有"layer4"和"layer7","layer7"仅能用于http代理场景

redir <prefix>:启用重定向功能,将发往此服务器的GET和HEAD请求均为302状态码响应;需要注意的是,在prefix后面不能使用/,且不能使用相对地址,以免造成循环;例如

server srv1 10.1.1.1:80 redir http://test.bj.com check

weight <weight>:权重,默认为1,最大值为256,0表示不参与负载均衡

检查方法:

option httpchk

option httpchk <uri>

option httpchk <method> <uri>

option httpchk <method> <uri> <version> :不能用于frontend段,例如:

backend https_relay

mode tcp

option httpchk OPTIONS * HTTP/1.1\r\nHost:\ www

server apache1 10.1.1.1:443 check port 80

使用案例:

server first 10.1.1.1:80 cookie first check inter 1000

server second 10.1.1.2:80 cookie second check inter 1000

9、capture request header

capture request header <name> len <length>

捕获并记录指定的请求首部最近一次出现时的第一个值,仅能用于"frontend"和"listen"区段。捕获的首部值使用花括号{}括起来后添加进日志中。如果需要捕获多个首部值,它们将以指定的次序出现在日志文件中,并以竖线|作为分隔符。不存在的首部记录为空字符串,最常需要捕获的首部包括在虚拟主机环境中使用的"Host",上传请求首部中的"Content-length"、快速区别真实用户和网络机器人的"User-agent",以及代理环境中记录真实请求来源的"X-Forward-For"

<name>:要捕获的首部名称,此名称不区分大小写,但建议与它们出现在首部中的格式相同,比如大写首字母。需要注意的是,记录在日志中的是首部对应的值,而非首部名称

<length>:指定记录首部值时所记录的精确长度,超出的部分将会被忽略

可以捕获的请求首部的个数没有限制,但每个捕获最多只能记录64个字符。为了保证同一个frontend中日志格式的统一性,首部捕获仅能在fronted中定义。

10、capture response header

capture response header <name> len <length>

捕获并记录响应首部,其格式和要点同请求首部。

11、stats enable

启用基于程序编译时默认设置的统计报告,不能用于"fronted"区段。只要没有别外的其它设定,它们就会使用如下的配置:

stats uri : /haproxy?stats

stats realm : "HAProxy Statistics"

stats auth : no authentication

stats scope : no restriction

尽管"stats enable"一条就能够启用统计报告,但还是建议设定其它所有的参数,以免其依赖于默认设定而带来非期后果。下面是一个配置案例:

backend public_www

server websrv 10.1.1.1:80

stats enable

stats hide-version

stats scope

stats uri /haproxyadmin?stats

stats realm Haproxy\ Statistics

stats auth  statsadmin:password

stats auth statsmaster:password

12、stats hide-version

stats hide-version

启用统计报告并隐藏HAProxy版本报告,不能用于"frontend"区段。默认情况下,统计页面会显示一些有用信息,包括haproxy版本,然而,向所有人公开haproxy的精确版本号是非常有风险的,因为它能帮助恶意用户快速定位版本的缺陷和漏洞。尽管"stats hide-version"一条就能够启用统计报告,但还是建议设定其它所有的参数,以免其依赖于默认设定而带来的非期后果。

13、stats realm

stats realm <realm>

启用统计报告并高精认证领域,不能用于"frontend"段。haproxy在读取realm时会将其视作一个单词,因此,中间的任何空白字符都必须使用反斜线进行转义。此参数仅在与"stats auth"配置使用时才有意义

14、stats scope

stats scope { <name> | "." }

启用统计报告并限定报告的区段,不能用于"fronted"区段。当指定此语句时,统计报告将仅显示其列举出区段的报告消息,所有其它区段的信息将被隐藏。如果需要显示多个区段的统计报告,此语句可以定义多次。需要注意的是,区段名称检测仅仅是以字符串比较的方式进行,它不会真检测指定的区段是否真正存在。

<name>:可以是一个"listen"、"fronted"或"backend"区段的名称,而"."则表示stats scope语句所定义的当前区段

尽管"stats scope"一条就能够启用统计报告 ,但还是建议设定其它的参数,以免其依赖于默认设定而带来非期后果。下面是一个配置案例:

backend private_monitoring

stats enable

stats uri /haproxyadmin?stats

stats refresh 10s

15、stats auth

stats auth <user>:<password>

启用带认证的统计报告功能并授权一个用户账号,其不能用于"frontend"段

<user>:授权进行访问的用户名

<password>:此用户的访问密码,明文格式

此语句将基于默认设定启用统计报告功能,并仅允许其定义的用户访问,其也可以定义多次以授权多个用户账号。可以结合"stats realm"参数在提示用户认证时给出一个领域说明信息。在使用非法用户访问统计功能时,其将会响应一个"401 Forbidden"页面。其认证方式为HTTP Basic认证,密码传输会以明文方式进行,因此,配置文件中也使用明文方式存储以说明其非保密信息故此不能相同于其它关键性账号的密码

尽管"stats auth "一条就能够启用统计报告,但还是建议设定其它所有的参数,以免其依赖于默认设定而带来非期后果。

16、stats admin

stats admin { if | unless } <condition>

在指定的条件满足时启用统计报告页面的管理级别功能,它允许通过web接口启用或禁用服务器,不过基于安全考虑,统计报告页面应该尽可能为只读的。此外,如果启用了haproxy的多进程模式,启用此管理级别将有可能导致异常行为。

目前来说,POST请求方法被限制于仅能使用缓冲区减去保留部分之外的空间,因此,服务器列表不能过长,否则,此请求将无法正常工作。因此,建议一次仅调整少数几个服务器。下面是两个案例,第一个限制了仅能在本机打开报告页面时启用管理级别功能;第二个定义了仅允许通过认证的用户使用管理级别功能

backend stats_localhost

stats enable

stats admin if LOCALHOST

backend stats_auth

stats enable

stats auth haproxyadmin:password

stats admin if TRUE

17、option httplog

option httplog [ clf ]

启用记录HTTP请求、会话状态和计时器的功能

clf:使用CLF格式来代替haproxy默认的HTTP格式,通常在使用仅支持CLF格式的特定日志分析器时才需要使用此格式

默认情况下,日志输入格式非常简陋,因为其仅包括源地址、目标地址和实例名称,而"option httplog"参数将会使得日志格式变得丰富许多,其通常包括但不限于HTTP请求、连接计时器、会话状态、连接数、捕获的首部及cookie、"frontend"、"backend"及服务器名称,当然也包括源地址和端口号等

18、option logasap

no option logasap

启用或禁用提前将HTTP请求记入日志,不能用于"backend"区段

默认情况下,HTTP请求是在请求结束时进行记录以便能将其整体传输时长和字节数记入日志,由此,传较大的对象时,其记入日志的时长可能会略有延迟。"option logasap"参数能够在服务器发送complete首部时即时记录日志,只不过,此时将不记录整体传输时长和字节数。此情形下,捕获"Content-length"响应首部来记录传输的字节数是一个较好选择。下面是一个例子

listen http_proxy 0.0.0.0:80

mode http

option httplog

option logasap

log 10.1.1.10 local2

19、option forwardfor

option forwardfor [ except <network> ] [ header <name> ] [ if-none ]

允许在发往服务器的请求首部中插入"X-Forward-For"首部

<network>:可选参数,在指定时,源地址为匹配至此网络中的请求都禁用此功能

<name>:可选参数,可使用一个自定义的首部,如"X-Client"来替代"X-Forward-For"。有些独特的web服务器的确需要用于一个独特的首部。

if-none:仅在此首部不存在时才将其添加至请求报文中

haproxy工作于反向代理模式,其发往服务器的请求中的客户端IP均为haproxy主机的地址而非真实客户端的地址,这会使得服务器端日志信息记录不了真正的请求来源,"X-Forward-For"首部则可用于解决此问题。haproxy可以向每个发往服务器的请求上添加此首部,并以客户端IP为其value

需要注意的是,haproxy工作在隧道模式,其仅检查每一个连接的第一个请求,因此,仅第一个请求报文被附加此首部。如果想为每一个请求都附加此首部,请确保同时使用了"option httpclose" 、 "option forceclose"和"option http-server-close"几个option

下面是一个例子:

frontend www

mode http

option forwardfor except 127.0.0.1

20、errorfile

errorfile <code> <file>

在用户请求不存在的页面时,返回一个页面文件给客户端而非由haproxy生成的错误代码;可用于所有段中

<code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有200,400,403,408,500,502,503和504

<file>:指定用于响应的页面文件

例如:

errorfile 400 /etc/haproxy/errorpages/400badreq.http

errorfile 403 /etc/haproxy/errorpages/403forbid.http

errorfile 503 /etc/haproxy/errorpages/503sorry.http

21、errorloc和errorloc302

errorloc <code> <url>

errorloc302 <code> <url>

请求错误时,返回一个HTTP重定向至某URL的信息;可用于所有配置段中

<code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有200,400,403,408,500,502,503和504

<url>:location首部中指定的页面位置的具体路径,可以是在当前服务器上的页面的相对路径,也可以使用绝对路径;需要注意的是,如果URI自身错误时产生某特定状态码信息的话,有可能会导致循环定向

需要注意的是,这两个关键字都会返回302状态码,这将使得客户端使用同样的HTTP方法获取指定的URL,对于非GET的场景来说会产生问题,因为返回客户的URL是不允许使用GET以外的其它方法的。如果的确有这种问题,可以使用errorloc303状态码给客户端

22、errorloc303

errorloc303 <code> <url>

请求错误时,返回一个HTTP重写向至某URL的信息给客户端;可用于所有配置段

<code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有200,400,403,408,500,502,503和504

<url>:location首部中指定的页面位置的具体路径,可以是在当前服务器上的页面的相对路径,也可以使用绝对路径;需要注意的是,如果URI自身错误时产生某特定状态码信息的话,有可能会导致循环定向

例如:

backend webserver

server 10.1.1.1 10.1.1.1:80 check maxconn 3000 cookie srv01

server 10.1.1.2 10.1.1.2:80 check maxconn 3000 cookie srv02

errorloc 403 /etc/haproxy/errorpages/sorry.htm

errorloc 503 /etc/haproxy/errorpages/sorry.htm

配置示例:

global

log 127.0.0.1 local2

chroot /var/lib/haproxy

pidfile /var/run/haproxy.pid

maxconn 4000

user haproxy

group haproxy

daemon

defaults

mode http

log global

option httplog

option dontlognull

option http-server-close

option forwardfor except 127.0.0.0/8 header X-Client

option redispatch

retries 3

timeout http-request 10s

timeout queue 1m

timeout connect 10s

timeout client 1m

timeout server  1m

timeout http-keep-alive  10s

timeout check 10s

maxconn 30000

listen stats

mode http

bind 0.0.0.0:1080

stats enable

stats hide-version

stats uri /haproxyadmin?stats

stats realm Haproxy\ Statistics

stats auth  admin:admin

stats admin if TRUE

frontend http-in

bind *:80

mode http

log global

option httpclose

option logasap

option dontlognull

capture request header Host len 20

capture request header Referer len 60

default_backend servers

frontend healthcheck

bind *:1099

mode http

option httpclose

option forwardfor

default_backend servers

backend servers

balance roundrobin

server webser1 10.1.1.1:80 check maxconn 2000

server webser2 10.1.1.2:80 check maxconn 2000

时间: 2024-08-07 15:34:41

haproxy简述的相关文章

HAproxy(二)动静分离

(一)简述 在现实的应用环境中,往往根据业务请求的不同将相关的请求指定到不同的后端服务器中,例如客户是静态资源的请求,haproxy就将请求转发给静态服务器,如果是动态的请求就转发给静态服务器,haproxy实现动静分离是通过acl匹配规则来实现这一目的. 服务器名称 IP 说明 HAProxy 192.168.180.23 web服务器 Static Server 192.168.180.4 静态资源服务器(nginx代理) PHP Server 192.168.180.9 php服务器(ng

系统优化与lvs详解配置、haproxy

涉及内容比较杂乱,请耐心阅读,为自己阅读实践过程中摘要 设备: 服务器IBM x3850 x6 戴尔 R720 防火墙,华为 USG5120 交换机 (机房) 华为5700 二层,48GE电口 路由器 H3c ER3180G 交换机 s1048(办公司网络) 报错集合: 一.程序僵死:获取url或者是业务记忆,找出nginx的出口和location.看nginx.comf和upstream,获取真实的real server.原来是server问题(1.数据库用户改密码报错.2.) 二.nginx

haproxy负载均衡器及反向代理(一)

haproxy原理简述 haproxy提供高可用性.负载均衡以及基于TCP(第四层)和HTTP(第七层)应用的代理,支持虚拟主机,它是免费.快速并且可靠的一种解决方案. haproxy特别适用于那些负载特别大的web站点,这些站点通常又需要会话保持或七层处理.haproxy运行在时下的硬件上,完全可以支持数以万计的并发连接,并且它的运行模式使得它可以很简单安全的整合进您当前的架构中,同时可以保护你的web服务器不被暴露到网络上. haproxy实现了一种事件驱动.单一进程模型,此模型支持非常大的

LVS,Nginx及HAProxy三种负载均衡器比较

一. 简述:目前,在线上环境中应用较多的负载均衡器硬件有F5 BIG-IP,软件有LVS,Nginx及HAProxy,apache,高可用软件有Heartbeat.Keepalived,成熟的架构有LVS+Keepalived.Nginx+Keepalived.HAProxy+hearbeat二.  三种负载均衡器的优缺点:lvs优点:1.抗负载能力强,工作在第4层仅作分发之用没有流量的产生.这个特点也决定了它在负载均衡软件里的性能最强的:无流量,同时保证了均衡器IO的性能不会受到大流量的影响.

Hibernate简述及入门实例

一.Hibernate简述 总的概括,Hibernate是一个ORM的轻量级持久层框架,解决了对象和关系数据库中表的不匹配问题(阻抗不匹配)以及拥有开发代码不用去继承hibernate类或接口的优势(无侵入性).hibernate框架实现使得开发人员可以避免反复地编写javajdbc部分代码,应用面向对象的思维操作关系型数据库. 二.使用myeclipse创建hibernate实例两种方法(以hibernate3.5.2及mysql为例) a)手动编写hibernate.cfg.xml及*.hb

HAProxy 高级应用(一)

HAProxy 高级应用 ================================================================================ 概述:   本章将继续上章的内容介绍haprosy代理配置段的相关参数,具体如下: ACL控制访问列表: 4层检测机制:dst,dst_port,src,src_port 7层检查机制:path.req.hdr.res.hdr: http层访问控制相关的参数: block,http-request TCP层的访

Struts2基本使用(二)--配置文件简述

配置文件简述 引入Struts2框架之后项目中多了一个struts.xml,以及web.xml也多了一些代码 web.xml只要的功能就是拦截用户的请求其多出的代码如下: <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.struts2.dispatcher.ng.filter.StrutsPrepareAndExecuteFilter</filter-class&

HAProxy+mongos搭建高可用负载均衡mongodb

在生产环境中,搭建的mongodb分片,提供了三个mongos接口.但mongodb中没有failover机制,官方建议是将mongos和应用服务器部署在一起,多个应用服务器就要部署多个mongos实例,这样很是不方便.查了一下,有几种方法可以使这三个mongos接口都利用起来,减少单个接口的压力.常用的有LVS和HAProxy.于是尝试用HAProxy做负载均衡. HAProxy是一款提供高可用性.负载均衡以及基于TCP和HTTP应用的代理软件,HAProxy是完全免费的.借助HAProxy可

haproxy,tomcat.apache记录用户真实IP

Haproxy配置: default加入: option httpclose option forwardfor Tomcat配置: server.xml中添加 prefix="localhost_access_log." suffix=".txt" pattern="%{X-FORWARDED-FOR}i %l %u %t %r %s %b %D %q %{User-Agent}i %T" resolveHosts="false&qu