HAProxy安装及搭建tidb数据库负载均衡服务实战

原创
2023/10/23 00:00
阅读数 44

作者: 随缘天空 原文来源:https://tidb.net/blog/88e78888

作为一名开发人员,随着经验的增加和技术的沉淀,需要提高自己架构方面的知识,同时对于一个企业来说,搭建一套高可用、高性能的技术架构,对于公司的业务开展和提高服务的性能也是大有裨益的。本文重点从软件安装和搭建tidb负载均衡数据库服务介绍下HAProxy的使用

1、概述上篇文章我们讲解了tidb集群服务的搭建流程,由于涉及到2个节点,我们在正式对外提供服务时,应该有一个统一的入口,而不是将所有节点对应的ip和端口暴露出去,一方面增加服务的安全性,另一方面通过负载均衡代理,提高数据库的性能。本文将通过实战的过程演示下HAProxy搭建tidb负载均衡的完整过程。HAProxy是由 C 语言编写的自由开放源码的软件,提供高可用性、负载均衡和代理服务,它是免费、快速并且可靠的一种解决方案。HAProxy 特别适用于那些负载特大的 web 站点,完全可以支持数以万计的并发连接,同时可以保护你的 web 服务器不被暴露到网络上。其最常见的用途是将客户端请求分发到多个服务器上,从而实现高并发和高可用性。## 2、负载均衡常用软件及对比常用的负载均衡软件有LVS、Nginx和HAProxy,区别如下- LVS基于Linux操作系统内核实现软负载均衡,而HAProxy和Nginx是基于第三方应用实现的软负载均衡;

  • LVS是可实现4层的IP负载均衡技术,无法实现基于目录、URL的转发。而HAProxy 和Nginx都可以实现4层和7层技术,HAProxy可提供TCP和HTTP应用的负载均衡综合解决方案;
  • LVS因为工作在ISO模型的第四层,其状态监测功能单一,而HAProxy在状态监测方面功能更丰富、强大,可支持端口、URL、脚本等多种状态检测方。
  • HAProxy功能强大,单纯从效率上来讲HAProxy会比Nginx有更出色的负载均衡速度,在并发处理上也是优于Nginx的。但整体性能低于4层模式的LVS负载均衡;
  • Nginx主要用于web服务器或缓存服务器。Nginx的upstream模块虽然也支持群集功能,但是对群集节点健康检查功能不强,性能没有Haproxy好。对网络带宽要求不高,安装配置简单,不支持session,需要ip_hash和cookie解决保持会话## 3、软件安装 1、硬件要求,如下图HAProxy硬件要求.png 2、安装依赖包 yum -y install epel-release gcc systemd-devel 3、下载软件源码包 以下文件是2.8版本的软件包 [HaProxy2.8网盘链接] (https://pan.baidu.com/s/11WAYKPeasOW8pvuHC0W0mw 提取码:yqsy) 4、解压 tar -zxvf haproxy-x.x.x.tar.gz 5、从源码编译 HAProxy 应用 ,分别执行如下命令 cd haproxy-x.x.x make clean make -j 8 TARGET=linux-glibc USE_THREAD=1 make PREFIX=${/app/haproxy} SBINDIR=${/app/haproxy/bin} install # 将 `${/app/haproxy}` 和 `${/app/haproxy/bin}` 替换为自定义的实际路径。比如/usr/local/haprox 6、重新配置profile文件 echo 'export PATH=/app/haproxy/bin:$PATH' >> /etc/profile . /etc/profile 7、检查是否安装成功 which haproxy 至此安装步骤已完成。## 4、使用haproxy搭建tidb负载服务 1、编写haproxy配置文件,比如haproxy.conf,内容如下```markdown global # 全局配置。 log 127.0.0.1 local2 # 定义全局的 syslog 服务器,最多可以定义两个。 chroot /var/lib/haproxy # 更改当前目录并为启动进程设置超级用户权限,从而提高安全性。 pidfile /var/run/haproxy.pid # 将 HAProxy 进程的 PID 写入 pidfile。 maxconn 4096 # 单个 HAProxy 进程可接受的最大并发连接数,等价于命令行参数 "-n"。 nbthread 48 # 最大线程数。线程数的上限与 CPU 数量相同。 user haproxy # 同 UID 参数。 group haproxy # 同 GID 参数,建议使用专用用户组。 daemon # 让 HAProxy 以守护进程的方式工作于后台,等同于命令行参数“-D”的功能。当然,也可以在命令行中用“-db”参数将其禁用。 stats socket /var/lib/haproxy/stats # 统计信息保存位置。

defaults # 默认配置。 log global # 日志继承全局配置段的设置。 retries 2 # 向上游服务器尝试连接的最大次数,超过此值便认为后端服务器不可用。 timeout connect 2s # HAProxy 与后端服务器连接超时时间。如果在同一个局域网内,可设置成较短的时间。 timeout client 30000s # 客户端与 HAProxy 连接后,数据传输完毕,即非活动连接的超时时间。 timeout server 30000s # 服务器端非活动连接的超时时间。

listen admin_stats # frontend 和 backend 的组合体,此监控组的名称可按需进行自定义。 bind 0.0.0.0:8080 # 监听端口。 mode http # 监控运行的模式,此处为 http 模式。 option httplog # 开始启用记录 HTTP 请求的日志功能。 maxconn 10 # 最大并发连接数。 stats refresh 30s # 每隔 30 秒自动刷新监控页面。 stats uri /haproxy # 监控页面的 URL。 stats realm HAProxy # 监控页面的提示信息。 stats auth admin:pingcap123 # 监控页面的用户和密码,可设置多个用户名。 stats hide-version # 隐藏监控页面上的 HAProxy 版本信息。 stats admin if TRUE # 手工启用或禁用后端服务器(HAProxy 1.4.9 及之后版本开始支持)。

listen tidb-cluster # 配置 database 负载均衡。 bind 0.0.0.0:3390 # 浮动 IP 和 监听端口。 mode tcp # HAProxy 要使用第 4 层的传输层。 balance leastconn # 连接数最少的服务器优先接收连接。leastconn 建议用于长会话服务,例如 LDAP、SQL、TSE 等,而不是短会话协议,如 HTTP。该算法是动态的,对于启动慢的服务器,服务器权重会在运行中作调整。 server tidb-1 xxxxx:4000 check inter 2000 rise 2 fall 3 # 检测 4000 端口,检测频率为每 2000 毫秒一次。如果 2 次检测为成功,则认为服务器可用;如果 3 次检测为失败,则认为服务器不可用。 server tidb-2 xxxxx:4000 check inter 2000 rise 2 fall 3 # xxxx为服务器ip ``` 2、启动服务 进入到配置文件目录,执行命令 haproxy -f haproxy.conf 如果执行报错,可能是没有创建配置文件中haproxy的用户和组信息,以及/var/lib/haproxy/stats文件, useradd haproxy 然后创建stats文件 touch /var/lib/haproxy/stats 重新执行haproxy -f haproxy.conf命令即可 3、访问服务 http://ip:8080/haproxy 对应的uri和配置文件中保持一致,然后输入用户密码即可 同时可以使用数据库客户端(比如navicat)进行连接,查看能否连接上,ip为服务器ip,端口为3390 4、 验证负载均衡策略 在haproxy服务器上执行如下命令(前提是安装mysql客户端:命令为 yum -y install mysql,安装成功使用mysql -V命令查看是否成功),就可以输出查询的是哪个节点实例信息,10.0.0.1换成服务器实际的ip地址mysql -uroot -h10.0.0.1 -P 3390 -p -e "select instance from INFORMATION_SCHEMA.CLUSTER_PROCESSLIST where id=(select connection_id());" 5、停止服务 killall -9 haproxy 或者使用ps -ef | grep haproxy命令,然后使用kill -9 pid命令参考链接:https://docs.pingcap.com/zh/tidb/stable/haproxy-best-practices

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部