FE 负载均衡
用户通过 FE 的查询端口(query_port,默认 9030)使用 MySQL 协议连接 Doris。当部署多个 FE 节点时,可以在 FE 之上部署负载均衡层,实现 Doris 查询入口的高可用与连接分发。
本文档介绍四种适用于 Doris 的负载均衡方案,并说明如何通过 Proxy Protocol 在代理层后透传客户端真实 IP。
适用场景
| 场景 | 推荐方案 | 说明 |
|---|---|---|
| 应用通过 JDBC 直连 Doris,无独立运维代理 | JDBC URL | 客户端侧负载均衡,无需额外组件 |
| 已有 Nginx 基础设施,需要 TCP 层反向代理 | Nginx | 通用 TCP 反向代理,配置简单 |
| 需要高性能 TCP 代理与健康检查 | HAProxy | 专业 TCP/HTTP 负载均衡,支持丰富的健康检查策略 |
| 需要 MySQL 协议感知的代理(连接管理、读写分离等) | ProxySQL | 面向 MySQL 协议的数据库代理 |
| 需要在负载均衡后保留客户端真实 IP | Proxy Protocol | 配合 Nginx 或 HAProxy 使用 |
前置条件
- 已部署至少 2 个 FE 节点,且 FE 进程正常监听
query_port(默认9030)。 - 代理服务器与所有 FE 节点之间的网络互通。
- 已规划用于代理服务的端口(本文以
6030为示例)。 - 若需启用 Proxy Protocol,Doris 版本需支持 Proxy Protocol V1(自 2.1.1 版本起)。
集群拓扑示例
本文使用以下三个 FE 节点作为演示:
192.168.1.101:9030
192.168.1.102:9030
192.168.1.103:9030
代理服务器所在节点:
192.168.1.100
负载均衡方案
方案一:JDBC URL
使用 JDBC URL 自带的负载均衡能力,由 MySQL Connector/J 在客户端实现 FE 节点的连接分发与故障切换。
jdbc:mysql:loadbalance://192.168.1.101:9030,192.168.1.102:9030,192.168.1.103:9030/test_db
详细配置可参考 MySQL 官网文档。
方案二:Nginx
使用 Nginx 的 TCP 反向代理(stream 模块)实现 Doris 的负载均衡。
安装 Nginx
请参看 Nginx 官方安装文档 完成安装。下面以 Ubuntu 系统中编译安装 Nginx 1.18.0 为例:
-
安装编译依赖:
sudo apt-get install build-essential
sudo apt-get install libpcre3 libpcre3-dev
sudo apt-get install zlib1g-dev
sudo apt-get install openssl libssl-dev -
下载并编译 Nginx:
sudo wget http://nginx.org/download/nginx-1.18.0.tar.gz
sudo tar zxvf nginx-1.18.0.tar.gz
cd nginx-1.18.0
sudo ./configure --prefix=/usr/local/nginx --with-stream --with-http_ssl_module --with-http_gzip_static_module --with-http_stub_status_module
sudo make && make install提示编译时务必带上
--with-stream,否则 Nginx 不支持 TCP 反向代理。
配置反向代理
-
新建配置文件:
vim /usr/local/nginx/conf/default.conf -
写入以下内容:
events {
worker_connections 1024;
}
stream {
upstream mysqld {
hash $remote_addr consistent;
server 192.168.1.101:9030 weight=1 max_fails=2 fail_timeout=60s;
server 192.168.1.102:9030 weight=1 max_fails=2 fail_timeout=60s;
server 192.168.1.103:9030 weight=1 max_fails=2 fail_timeout=60s;
}
server {
# Proxy port
listen 6030;
proxy_connect_timeout 300s;
proxy_timeout 300s;
proxy_pass mysqld;
}
}关键配置说明:
配置项 说明 streamTCP 反向代理上下文,需 Nginx 启用 stream 模块 upstream mysqld后端 FE 节点池, hash $remote_addr consistent表示按客户端 IP 做一致性哈希weight节点权重,权重越高分配的连接越多 max_fails/fail_timeout健康检查参数:在 fail_timeout内失败次数超过max_fails则节点被标记为不可用listen 6030代理服务监听端口 proxy_connect_timeout/proxy_timeout连接与会话超时时间
启动 Nginx
指定配置文件启动:
cd /usr/local/nginx
/usr/local/nginx/sbin/nginx -c conf.d/default.conf
验证
使用代理端口连接:
mysql -uroot -P6030 -h192.168.1.100
mysql> show databases;
+--------------------+
| Database |
+--------------------+
| information_schema |
| mysql |
| test |
+--------------------+
2 rows in set (0.00 sec)
方案三:HAProxy
HAProxy 是一个使用 C 语言编写的高性能 TCP/HTTP 负载均衡器。
安装 HAProxy
-
下载 HAProxy(下载地址:https://src.fedoraproject.org/repo/pkgs/haproxy/)。
-
解压:
tar -zxvf haproxy-2.6.15.tar.gz -C /opt/
mv haproxy-2.6.15 haproxy
cd haproxy -
编译安装:
yum install gcc gcc-c++ -y
make TARGET=linux-glibc PREFIX=/usr/local/haproxy
make install PREFIX=/usr/local/haproxy
配置 HAProxy
-
配置 syslog 日志规则。
打开配置文件:
vim /etc/rsyslog.d/haproxy.conf内容如下:
$ModLoad imudp
$UDPServerRun 514
local0.* /usr/local/haproxy/logs/haproxy.log
&~ -
开启远程日志:
vim /etc/sysconfig/rsyslog添加内容:
SYSLOGD_OPTIONS="-c 2 -r -m 0"参数说明:
参数 说明 -c 2使用兼容模式,默认是 -c 5-r开启远程日志 -m 0标记时间戳,单位是分钟,为 0时表示禁用该功能使修改生效:
systemctl restart rsyslog -
编辑负载均衡配置文件:
vim /usr/local/haproxy/haproxy.cfg内容如下:
global
maxconn 2000
ulimit-n 40075
log 127.0.0.1 local0 info
uid 200
gid 200
chroot /var/empty
daemon
group haproxy
user haproxy
defaults
log global
mode http
retries 3
option redispatch
timeout connect 5000
timeout client 5000
timeout server 5000
timeout check 2000
frontend agent-front
bind *:6030
mode tcp
default_backend forward-fe
backend forward-fe
mode tcp
balance roundrobin
server fe-1 192.168.1.101:9030 weight 1 check inter 3000 rise 2 fall 3
server fe-2 192.168.1.102:9030 weight 1 check inter 3000 rise 2 fall 3
server fe-3 192.168.1.103:9030 weight 1 check inter 3000 rise 2 fall 3关键配置说明:
配置项 说明 frontend agent-front前端入口,绑定 6030端口,使用 TCP 模式backend forward-fe后端 FE 节点池,使用轮询( roundrobin)算法check inter 3000 rise 2 fall 3每 3000ms健康检查一次,连续2次成功视为上线,连续3次失败视为下线
启动 HAProxy
-
启动服务:
/opt/haproxy/haproxy -f /usr/local/haproxy/haproxy.cfg -
查看服务状态:
netstat -lnatp | grep -i haproxy
验证
mysql -h 192.168.1.100 -uroot -P6030 -p
方案四:ProxySQL
ProxySQL 是基于 MySQL 的开源数据库代理软件,用 C 语言编写。它能实现连接管理、读写分离、负载均衡、故障切换等功能,具有高性能、可配置、动态管理等优势,常用于 Web 服务、大数据平台、云数据库等场景。
安装 ProxySQL
请参考 ProxySQL 官方文档 完成安装。
配置 ProxySQL
ProxySQL 包含配置文件 /etc/proxysql.cnf 与配置数据库文件 /var/lib/proxysql/proxysql.db。
若 /var/lib/proxysql 目录下存在 proxysql.db 文件,ProxySQL 服务仅在首次启动时读取并解析 proxysql.cnf,后续启动不再读取。
若要使 proxysql.cnf 配置在重启后生效,需先删除 /var/lib/proxysql/proxysql.db 再重启服务。这相当于初始化启动,会生成新的 proxysql.db 文件,原配置规则将被清除。
以下是配置文件 proxysql.cnf 的主要内容:
datadir="/var/lib/proxysql" #数据目录
admin_variables=
{
admin_credentials="admin:admin" # Admin databse username and password.
mysql_ifaces="0.0.0.0:6032" # Admin database port, used for connecting admin database of ProxySQL
}
mysql_variables=
{
threads=4
max_connections=2048
default_query_delay=0
default_query_timeout=36000000
have_compress=true
poll_timeout=2000
interfaces="0.0.0.0:6030"
default_schema="information_schema"
stacksize=1048576
server_version="5.7.99"
connect_timeout_server=3000
monitor_username="monitor"
monitor_password="monitor"
monitor_history=600000
monitor_connect_interval=60000
monitor_ping_interval=10000
monitor_read_only_interval=1500
monitor_read_only_timeout=500
ping_interval_server_msec=120000
ping_timeout_server=500
commands_stats=true
sessions_sort=true
connect_retries_on_failure=10
}
mysql_servers =
(
)
mysql_users:
(
)
mysql_query_rules:
(
)
scheduler=
(
)
mysql_replication_hostgroups=
(
)
连接 ProxySQL 管理数据库
通过管理端口(6032)连接 ProxySQL:
mysql -uadmin -padmin -P6032 -hdoris01
查看内置数据库与表:
ProxySQL > show databases;
+-----+---------------+-------------------------------------+
| seq | name | file |
+-----+---------------+-------------------------------------+
| 0 | main | |
| 2 | disk | /var/lib/proxysql/proxysql.db |
| 3 | stats | |
| 4 | monitor | |
| 5 | stats_history | /var/lib/proxysql/proxysql_stats.db |
+-----+---------------+-------------------------------------+
5 rows in set (0.000 sec)
ProxySQL > use main;
ProxySQL > show tables;
+--------------------------------------------+
| tables |
+--------------------------------------------+
| global_variables |
| mysql_collations |
| mysql_group_replication_hostgroups |
| mysql_query_rules |
| mysql_query_rules_fast_routing |
| mysql_replication_hostgroups |
| mysql_servers |
| mysql_users |
| proxysql_servers |
| runtime_checksums_values |
| runtime_global_variables |
| runtime_mysql_group_replication_hostgroups |
| runtime_mysql_query_rules |
| runtime_mysql_query_rules_fast_routing |
| runtime_mysql_replication_hostgroups |
| runtime_mysql_servers |
| runtime_mysql_users |
| runtime_proxysql_servers |
| runtime_scheduler |
| scheduler |
+--------------------------------------------+
20 rows in set (0.000 sec)
配置后端 Doris FE
使用 INSERT 语句将需要被代理的 FE 节点和端口添加到 mysql_servers 表中。
hostgroup_id 为 10 表示写组,为 20 表示读组。这里不需要读写分离,可以任意设置。
-
连接管理端口:
mysql -uadmin -padmin -P6032 -h127.0.0.1 -
插入 FE 节点:
ProxySQL > insert into mysql_servers(hostgroup_id,hostname,port) values(10,'192.168.0.101',9030);
Query OK, 1 row affected (0.000 sec)
ProxySQL > insert into mysql_servers(hostgroup_id,hostname,port) values(10,'192.168.0.102',9030);
Query OK, 1 row affected (0.000 sec)
ProxySQL > insert into mysql_servers(hostgroup_id,hostname,port) values(10,'192.168.0.103',9030);
Query OK, 1 row affected (0.000 sec) -
查看插入结果:
ProxySQL > select hostgroup_id,hostname,port,status,weight from mysql_servers;
+--------------+---------------+------+--------+--------+
| hostgroup_id | hostname | port | status | weight |
+--------------+---------------+------+--------+--------+
| 10 | 192.168.0.101 | 9030 | ONLINE | 1 |
| 20 | 192.168.0.102 | 9030 | ONLINE | 1 |
| 20 | 192.168.0.103 | 9030 | ONLINE | 1 |
+--------------+---------------+------+--------+--------+
3 rows in set (0.000 sec) -
若插入时遇到唯一约束错误:
ERROR 1045 (#2800): UNIQUE constraint failed: mysql_servers.hostgroup_id, mysql_servers.hostname, mysql_servers.port说明之前已经定义过相同配置,可以清空表或删除对应 host 的配置:
ProxySQL > select * from mysql_servers;
ProxySQL > delete from mysql_servers;
Query OK, 6 rows affected (0.000 sec) -
保存配置到运行时与磁盘:
ProxySQL > load mysql servers to runtime;
Query OK, 0 rows affected (0.006 sec)
ProxySQL > save mysql servers to disk;
Query OK, 0 rows affected (0.348 sec)
配置 Doris FE 节点监控
添加 Doris FE 节点之后,还需要监控这些后端节点。
-
在 Doris 中创建一个用于监控的用户:
mysql -uroot -P9030 -h192.168.0.101Doris > create user monitor@'192.168.0.100' identified by 'P@ssword1!';
Query OK, 0 rows affected (0.03 sec)
Doris > grant ADMIN_PRIV on *.* to monitor@'192.168.0.100';
Query OK, 0 rows affected (0.02 sec) -
回到 ProxySQL 代理层节点上配置监控:
mysql -uadmin -padmin -P6032 -h127.0.0.1ProxySQL > set mysql-monitor_username='monitor';
Query OK, 1 row affected (0.000 sec)
ProxySQL > set mysql-monitor_password='P@ssword1!';
Query OK, 1 row affected (0.000 sec) -
保存配置:
ProxySQL > load mysql servers to runtime;
Query OK, 0 rows affected (0.006 sec)
ProxySQL > save mysql servers to disk;
Query OK, 0 rows affected (0.348 sec)
验证监控结果
ProxySQL 监控模块的指标都保存在 monitor 库中。
查看连接监控日志:
ProxySQL > select * from mysql_server_connect_log;
+---------------+------+------------------+-------------------------+---------------+
| hostname | port | time_start_us | connect_success_time_us | connect_error |
+---------------+------+------------------+-------------------------+---------------+
| 192.168.0.101 | 9030 | 1548665195883957 | 762 | NULL |
| 192.168.0.102 | 9030 | 1548665195894099 | 399 | NULL |
| 192.168.0.103 | 9030 | 1548665195904266 | 483 | NULL |
| 192.168.0.101 | 9030 | 1548665255883715 | 824 | NULL |
| 192.168.0.102 | 9030 | 1548665255893942 | 656 | NULL |
| 192.168.0.101 | 9030 | 1548665495884125 | 615 | NULL |
| 192.168.0.102 | 9030 | 1548665495894254 | 441 | NULL |
| 192.168.0.103 | 9030 | 1548665495904479 | 638 | NULL |
| 192.168.0.101 | 9030 | 1548665512917846 | 487 | NULL |
| 192.168.0.102 | 9030 | 1548665512928071 | 994 | NULL |
| 192.168.0.103 | 9030 | 1548665512938268 | 613 | NULL |
+---------------+------+------------------+-------------------------+---------------+
20 rows in set (0.000 sec)
查看心跳监控日志:
ProxySQL > select * from mysql_server_ping_log;
+---------------+------+------------------+----------------------+------------+
| hostname | port | time_start_us | ping_success_time_us | ping_error |
+---------------+------+------------------+----------------------+------------+
| 192.168.0.101 | 9030 | 1548665195883407 | 98 | NULL |
| 192.168.0.102 | 9030 | 1548665195885128 | 119 | NULL |
...........
| 192.168.0.102 | 9030 | 1548665415889362 | 106 | NULL |
| 192.168.0.103 | 9030 | 1548665562898295 | 97 | NULL |
+---------------+------+------------------+----------------------+------------+
110 rows in set (0.001 sec)
客户端 IP 透传(Proxy Protocol)
多数情况下,客户端通过代理服务连接到后端 Doris 服务后,客户端 IP 信息会丢失,Doris 服务端只能获取到代理服务器的 IP 地址。
自 2.1.1 版本开始,Doris 支持 Proxy Protocol 协议。利用该协议,可以在经过负载均衡后,Doris 依然获取到客户端的真实 IP,从而实现基于客户端 IP 的白名单、审计等权限控制。
下文分别介绍如何在 Doris、Nginx 和 HAProxy 中开启 Proxy Protocol。
在 Doris 中开启 Proxy Protocol
在 FE 的 fe.conf 中添加:
enable_proxy_protocol = true
- 仅支持 Proxy Protocol V1。
- 仅支持并作用于 MySQL 协议端口,不支持也不影响 HTTP、ADBC 等其他协议端口。
- 在 Doris 3.1 版本之前,开启后必须使用 Proxy Protocol 协议进行连接,否则连接失败。3.1 版本开始,开启 Proxy Protocol 后,依然可以使用标准的 MySQL 连接协议进行连接。
在 Nginx 中开启 Proxy Protocol
在配置文件的 server 部分新增 proxy_protocol on;:
events {
worker_connections 1024;
}
stream {
upstream mysqld {
hash $remote_addr consistent;
server 192.168.1.101:9030 weight=1 max_fails=2 fail_timeout=60s;
server 192.168.1.102:9030 weight=1 max_fails=2 fail_timeout=60s;
server 192.168.1.103:9030 weight=1 max_fails=2 fail_timeout=60s;
}
server {
# Proxy port
listen 6030;
proxy_connect_timeout 300s;
proxy_timeout 300s;
proxy_pass mysqld;
# Enable Proxy Protocol to the upstream server
proxy_protocol on;
}
}
在 HAProxy 中开启 Proxy Protocol
在 haproxy.cfg 的 backend 部分为每个 server 行新增 send-proxy 参数:
backend forward-fe
mode tcp
balance roundrobin
server fe-1 192.168.1.101:9030 weight 1 check inter 3000 rise 2 fall 3 send-proxy
server fe-2 192.168.1.102:9030 weight 1 check inter 3000 rise 2 fall 3 send-proxy
server fe-3 192.168.1.103:9030 weight 1 check inter 3000 rise 2 fall 3 send-proxy
验证 IP 透传是否成功
-
通过代理连接 Doris:
mysql -uroot -P6030 -h192.168.1.100 -
执行
show processlist,观察Host列:mysql> show processlist;
+------------------+------+------+-------------------+---------------------+----------+------+---------+------+-------+-----------------------------------+------------------+
| CurrentConnected | Id | User | Host | LoginTime | Catalog | Db | Command | Time | State | QueryId | Info |
+------------------+------+------+-------------------+---------------------+----------+------+---------+------+-------+-----------------------------------+------------------+
| Yes | 1 | root | 192.168.1.101:34390 | 2024-03-17 16:32:22 | internal | | Query | 0 | OK | 82edc460d93f4e28-8bbed058a068e259 | show processlist |
+------------------+------+------+-------------------+---------------------+----------+------+---------+------+-------+-----------------------------------+------------------+
1 row in set (0.00 sec) -
如果
Host列显示真实的客户端 IP,则说明验证成功;否则只能看到代理服务的 IP 地址。同时,在
fe.audit.log中也会记录真实的客户端 IP。
常见问题
Q: 通过代理端口连接报 Connection refused?
代理服务未启动,或监听端口与配置不一致。检查代理进程是否运行;用 netstat -lnatp 确认监听端口。
Q: 连接成功但偶发超时?
后端 FE 节点异常,或代理超时设置过短。检查 proxy_timeout / timeout server 配置;通过健康检查日志确认后端节点状态。
Q: Nginx 启动报 unknown directive "stream"?
编译时未启用 stream 模块。重新编译 Nginx,添加 --with-stream 编译选项。
Q: ProxySQL 修改 proxysql.cnf 重启后不生效?
proxysql.db 已存在,配置文件仅在首次启动时读取。先删除 /var/lib/proxysql/proxysql.db 再重启服务。
Q: ProxySQL 插入 mysql_servers 报 UNIQUE constraint failed?
表中已存在相同 hostgroup_id + hostname + port 的记录。清空表或先删除对应记录后再插入。
Q: 开启 Proxy Protocol 后客户端连接失败(3.1 之前的版本)?
Doris 版本要求所有连接都使用 Proxy Protocol,普通 MySQL 客户端不兼容。升级到 3.1 及以上版本,或始终通过支持 Proxy Protocol 的代理连接。
Q: show processlist 看到的仍是代理 IP?
Doris 未启用 enable_proxy_protocol,或代理侧未配置 proxy_protocol on / send-proxy。检查 FE 配置与代理侧 Proxy Protocol 开关。