haproxy相关概念及原理

1、 Haproxy介绍

HaProxy是一个特别适用于高可用性环境的TCP/HTTP开源的反向代理和负载均衡软件。在七层负载均衡方面的功能很强大(支持cookie track,header rewrite等等),支持双机热备,支持虚拟主机,支持健康检查,同时还提供直观的监控页面,可以清晰的监控服务集群的运行状况。同时支持Linux2.6内核中System Epoll,通过简化系统调用,大幅的提高了网络I/O性能。

Haproxy包括以下一些特征:

  • 根据静态分配的cookie分配HTTP请求
  • 分配负载到各个服务器,同时保证服务器通过使用HTTP Cookie实现连接保持;
  • 当主服务器宕机时切换到备服务器,允许特殊端口的服务监控;
  • 做维护时通过配置可以保证业务的连续性,更加人性化;
  • 添加修改删除HTTP Request和Respone头;
  • 通过特定表达式Block HTTP请求;
  • 根据应用的cookie做连接保持;
  • 常有用户验证的详细的HTML监控报告。

1.1 Haproxy支持的平台

HaProxy可以运行在如下这些平台上:

  • Linux2.4 on x86,x86_64,Alpha,Sparc,MIPS,PARISC
  • Linux2.6/3.x on x86,x86_64,ARM,Sparc,PPC64
  • Solaris 8/9 on UltraSparc 2 and 3
  • Solaris 10 Opteron and UltraSPARC
  • FreeBSD 4.10 - 10 on x86
  • OpenBSD 3.1-current on i386,amd64,alpha,spare64 and VAX (check the ports)
  • AIX 5.1-5.3 on Power architechare

1.2 Haproxy负载均衡算法

HaProxy的负载均衡算法现在具体有如下8种:
1、 roundrobin:简单的轮询
2、 static-rr:权重轮询
3、 leastconn:最少连接者优先
4、 source:根据请求源IP,这个跟Nginx的ip_hash机制类似
5、 ri:根据请求的URI
6、 rl_param:表示根据请求的URI参数‘balance url_param’requires an URL parameter name;
7、 hdr(name):根据HTTP请求头来锁定每一次HTTP请求
8、 rdp-cookie(name):根据cookie来锁定并哈希每一次TCP请求

2.HAPROXY的配置

HAProxy的配置过程分为3个主要部分:

  • 命令行参数,这是最优先的;
  • global(全局)段,设置进程级参数;
  • 代理配置段,通常位于default,listen,backend这样的形式内。
    配置文件的语法是由关键字后跟可选的一个或者多个参数(参数之间有空格)组成。如果字符串中包含空格,必须用’\’进行转义。

HAPROXY配置中分五大部分:

  1. global:全局参数配置,进程级的,用来控制Haproxy启动前的一些进程及系统设置。
  2. defaults:配置一些默认的参数,可以被frontend,backend,listen段集成使用
  3. frontend:用来匹配接收客户所请求的域名,uri等,并针对不同的匹配,做不同的请求处理;
  4. backend:定义后端服务器集群,以及对后端服务器集群的一些权重、队列、连接数等选项的设置,类似于nginx中的upstream模块;
  5. listen:可以理解为frontend和backend的组合体。
    Haproxy配置文件的配置方法主要有两种,一种是由前端(frontend)和后端(backend)配置块组成,前端和后端都可以有多个。第二种方法是只有一个listen配置块来同时实现前端和后端。最常用也是推荐的方法为第一种,即frontend和backend的模式。

2.1 配置参数

配置参数及详解:

global                                                 # 全局参数global模块的设置
    log         127.0.0.1 local2                      # log语法:log <address_1>[max_level_1] # 全局的日志配置,使用log关键字,指定使用127.0.0.1上的syslog服务中的local0日志设备,记录日志等级为info的日志
    chroot      /var/lib/haproxy              #工作目录
    pidfile     /var/run/haproxy.pid          #进程pid文件
    maxconn     4000                          #最大连接数
    user        haproxy                       #所属用户
    group       haproxy                       #所属用户组
    daemon                                    #以守护进程方式运行haproxy
stats socket /var/lib/haproxy/stats       #定义socket套接字,针对在线维护很有帮助

defaults                                      # defaults模块的设置
    mode                    http              #默认的模式{ tcp|http|health},health只会返回OK
    log                     global            #应用全局的日志配置
    option                  httplog           #启用日志记录HTTP请求,默认不记录HTTP请求日志
    option                 dontlognull        # 启用该项,日志中将不会记录空连接。所谓空连接就是在上游的负载均衡器者监控系统为了探测该 服务是否存活可用时,需要定期的连接或者获取某一固定的组件或页面,或者探测扫描端口是否在监听或开放等动作被称为空连接;官方文档中标注,如果该服务上游没有其他的负载均衡器的话,建议不要使用该参数,因为互联网上的恶意扫描或其他动作就不会被记录下来
    option http-server-close                  #每次请求完毕后主动关闭http通道
    option forwardfor       except 127.0.0.0/8   #如果服务器上的应用程序想记录发起请求的客户端的IP地址,需要在HAProxy上配置此选项, 这样 HAProxy会把客户端的IP信息发送给服务器,在HTTP                                                                            请求中添加"X-Forwarded-For"字段。 启用  X-Forwarded-For,在requests                                                                            头部插入客户端IP发送给后端的server,使后端server获取到客户端的真实IP。
    option                  redispatch       # 当使用了cookie时,haproxy将会将其请求的后端服务器的serverID插入到cookie中,以保证会话的SESSION持久性;而此时,如果后端的服务器宕掉                                                                            了, 但是客户端的cookie是不会刷新的,如果设置此参数,将会将客户的请                                                                            求强制定向到另外一个后端server上,以保证服务的正常。
    retries                 3              # 定义连接后端服务器的失败重连次数,连接失败次数超过此值后将会将对应后端服务器标记为不可用
    timeout http-request    10s             #http请求超时时间
    timeout queue           1m              #一个请求在队列里的超时时间
    timeout connect         10s             #连接超时
    timeout client          1m              #客户端超时
    timeout server          1m              #服务器端超时
    timeout http-keep-alive 10s             #设置http-keep-alive的超时时间
    timeout check           10s             #检测超时
maxconn                 3000            #每个进程可用的最大连接数

listen stats                                #定义一个listen模块,用于状态检测
mode http                               #模式采用http
bind 0.0.0.0:8888                       #绑定本机的地址及端口
stats enable                            #启用状态检测功能
stats uri     /haproxy-status           #状态检测的URI
stats auth    haproxy:123456            #访问检测界面的用户名和密码

frontend  main *:80                         #frontend模块的设置,定义了一个前端
    acl url_static       path_beg       -i /static /images /javascript /stylesheets
    acl url_static       path_end       -i .jpg .gif .png .css .js      #这里定义了一个acl规则
    use_backend static   if  url_static     #如果匹配到了acl,则访问后端的static模块
default_backend             my_webserver #如果没有匹配到acl,则将请求丢给默认的模块

backend static                          #定义第一个后端模块,static
    balance     roundrobin              #负载均衡算法为轮询
server      static 127.0.0.1:80 check         #后端服务器地址

backend my_webserver                    #定第二个后端,my_wenserver
balance     roundrobin              #负载均衡算法
    server  web01 172.31.2.33:80  check inter 2000 fall 3 weight 30              #定义的多个后端
    server  web02 172.31.2.34:80  check inter 2000 fall 3 weight 30              #定义的多个后端
    server  web03 172.31.2.35:80  check inter 2000 fall 3 weight 30              #定义的多个后端

2.2 健康检查

Haproxy作为Loadblance,支持对backend的健康检查,以保证在后端backend不能服务时,把从frontend进来的request分配至其他可以服务的backend,从而保证整体服务的可用性。

2.2.1 相关配置

相关配置:

httpchk <method><uri><version>
option httpchk HEAD / HTTP/1.0
check:启动健康检测
inter:健康检测时间间隔
rise:检测服务可用的连接次数
fall:检测服务不可用的连接次数
error-limit:往server写数据连续失败次数的上限,执行on-error的设定
observe<mode>:把正常服务过程作为健康检测请求,即实时检测
on-error<mode>:满足error-limit后执行的操作(fastinter、fail-check、sudden-death、mark-down)。其中fastinter表示立即按照fastinter的检测延时进行。fail-check表示改次error作为一次检测;sudden-death表示模仿一次fatal,如果紧接着一次fail则server为down;mark-down表示直接把server设置为down状态。
server web-node2 192.168.56.22:8080 check inter 2000 rise 30 fall 15

2.2.2检测方式

3.3.2 检测方式
1、通过监听端口进行健康检测
这种检测方式,haproxy只会去检查server的端口,并不能保证服务真正可用。

listen http_proxy 0.0.0.0:80
mode http
cookie SERVERID
balance roundrobin
option httpchk
server web1 192.168.1.1:80 cookie server01 check
server web2 192.168.1.2:80 cookie serve02 check inter 500 rise 1 fall 2

2、通过URI进行健康检测
这种检测方式,是用去GET后端server的web页面,基本可以代表后端服务的可用性。

listen http_proxy 0.0.0.0:80
mode http
cookie SERVERID
balance roundrobin
option httpchk GET /index.html
server web1 192.168.1.1:80 cookie server01 check
server web2 192.168.1.2:80 cookie serve02 check inter 500 rise 1 fall 2

3、通过request获取的头部信息进行匹配进行健康检测
这种检测方式,是基于一些高级、精细的监测需求,通过对后端头部访问的头部信息进行匹配检测。

listen http_proxy 0.0.0.0:80
mode http
cookie SERVERID
balance roundrobin
option httpchk HEAD /index.jsp HTTP/1.1\r\n\Host:\www.xxx.com
server web1 192.168.1.1:80 cookie server01 check
server web2 192.168.1.2:80 cookie serve02 check inter 500 rise 1 fall 2

原文地址:https://blog.51cto.com/13178102/2354236

时间: 2024-10-14 16:08:30

haproxy相关概念及原理的相关文章

MySQL数据切分的相关概念和原理详解

对于数据切分,我们可能还不是很熟悉,但是它对于MySQL数据库来说也是相当重要的一门技术,本文我们就详细介绍一下MySQL数据库的数据切分的相关知识,接下来就让我们一起来了解一下这部分内容. 什么是数据切分 "Shard" 这个词英文的意思是"碎片",而作为数据库相关的技术用语,似乎最早见于大型多人在线角色扮演游戏中."Sharding" 姑且称之为"分片".Sharding 不是一门新技术,而是一个相对简朴的软件理念.众所周

你真的掌握 LVS、Nginx 及 HAProxy 的工作原理吗

你真的掌握 LVS.Nginx 及 HAProxy 的工作原理吗 当前大多数的互联网系统都使用了服务器集群技术,集群是将相同服务部署在多台服务器上构成一个集群整体对外提供服务,这些集群可以是 Web 应用服务器集群,也可以是数据库服务器集群,还可以是分布式缓存服务器集群等等. 在实际应用中,在 Web 服务器集群之前总会有一台负载均衡服务器,负载均衡设备的任务就是作为 Web 服务器流量的入口,挑选最合适的一台 Web 服务器,将客户端的请求转发给它处理,实现客户端到真实服务端的透明转发. 最近

HAProxy负载均衡原理及企业级实例部署haproxy集群

一 HAProxy简介   HAProxy是一种高效.可靠.免费的高可用及负载均衡解决方案,非常适合于高负载站点的七层数据请求.客户端通过HAProxy代理服务器获得站点页面,而代理服务器收到客户请求后根据负载均衡的规则将请求数据转发给后端真实服务器. 同一客户端访问服务器,HAProxy保持回话的三种方案: 1 HAProxy将客户端ip进行Hash计算并保存,由此确保相同IP访问时被转发到同一真实服务器上. 2 HAProxy依靠真实服务器发送给客户端的cookie信息进行回话保持. 3 H

Haproxy相关概念解析

一.Haproxy概述 haproxy是一款功能强大.灵活好用反向代理软件,提供了高可用.负载均衡.后端服务器代理的功能,它在7层负载均衡方面的功能很强大(支持cookie track, header rewrite等等),支持双机热备,支持虚拟主机,拥有非常不错的服务器健康检查功能,当其代理的后端服务器出现故障, HAProxy会自动将该服务器摘除,故障恢复后再自动将该服务器加入;同时还提供直观的监控页面,可以清晰实时的监控服务集群的运行状况. HAProxy提供高可用性.负载均衡以及基于TC

DNS相关概念和原理

一.DNS查询 1.整个查询过程(PC和DNS都没有缓存的情况): 0.1)PC在浏览器上访问http://www.benet.com: 0.2)PC先查询本地hosts文件,如果没有hosts文件没有解析,则进行下一步: 1)PC向自己设置的localdns发起解析www.benet.com的请求: 2)localdns先向全球13台根dns中的一台发起请求:www.benet.com=?: #localdns怎么知道根dns的ip地址呢?一般dns本地都会存放全球13台根dns的ip地址 3

JavaScript模板引擎原理与用法

这篇文章主要介绍了JavaScript模板引擎原理与用法,结合实例形式详细分析了javascript模版引擎相关概念.原理.定义及使用方法,写的十分的全面细致,具有一定的参考价值,对此有需要的朋友可以参考学习下 一.前言 什么是模板引擎,说的简单点,就是一个字符串中有几个变量待定.比如: var tpl = 'Hei, my name is <%name%>, and I\'m <%age%> years old.'; 通过模板引擎函数把数据塞进去, var data = { &q

马哥linux2014|2015全套教程

1.本课程全程将基于集成了Openstack云环境.支持高精度时间(PTP)及虚拟化性能大大提升的RHEL 6.5或CentOS 6.6,间或介绍CentOS 7系统的使用: 2.此文章给出的只是个课程知识点框架,实际讲解过程相当精细:另外,知识点讲授的次序未必同此文章所标示的顺序相同: 3.第15期面授班定于2015年3月24号开课:本期将会是马哥教育数年来"直通车"式授课方式的最后一次,自16期开始,整体课程将会被分割为两个甚至是多个不同产品,"直通车"式课程将

2013马哥linux全套视频教程,高清不加密

2013马哥linux全套视频教程,高清不加密,转让.非诚勿扰! 联系人:lovelinux  QQ:3109523055 课程目录:一.Linux系统基础及系统管理1.操作系统发展史,系统架构平台概览: Linux起源.理念.发展历史及各发行版:2.Linux基础知识.基本命令.获得使用帮助及文件系统组织结构等:3.Linux用户.组及权限的基础及相关高级话题,详细讲解useradd/userdel/chmod/chown/usermod/chage/umask等相关命令:4.Bash基础及配

[下篇] 一篇文章详解性能评估难点

在这个娱乐明星频频出轨.奇葩热文爆炸的时代,你却能抽空关注IT技术,请为你这份难能可贵和对技术的执着点个赞吧!请搜索"ICT_Architect"关注微信公众号,获取更多精彩内容. 在上篇文章[收藏] 深入浅出存储性能评估方法论中,我们介绍了性能评估相关概念和原理,但是在项目实战中,要根据业务真实诉求给出切合实际的性能配置,还需要针对业务模型进行最佳实践分析和洞察,从主机端口.存储系统.后端磁盘等端到端进行分析和评估,在本文中把常见的性能评估过程中的难点依次罗列,希望对大家有所帮助.