Doris 支持对数据库、表或分区进行备份与恢复操作,可将数据以快照形式保存到远程存储(S3、Azure、GCP、OSS、HDFS 等),并在需要时恢复至任意 Doris 集群。
适用场景
| 场景 | 说明 | 推荐操作 |
|---|
| 数据误删恢复 | 某张表或分区被误删,需要恢复到特定时间点 | 恢复指定表或分区 |
| 定期容灾备份 | 定期备份整个数据库,应对集群故障或硬件损坏 | 备份整库 |
| 跨集群数据迁移 | 将数据从源集群迁移到目标集群 | 备份 → 恢复 |
| 测试环境数据准备 | 将生产数据的部分表或分区恢复至测试集群 | 备份指定表 → 恢复 |
| 近似增量备份 | 仅备份新增或变更的分区,近似实现增量备份效果 | 备份指定分区 |
核心概念
| 概念 | 定义 |
|---|
| 快照(Snapshot) | 数据库、表或分区在某一时间点的数据捕获。创建时需指定快照 Label,完成后生成时间戳;通过 Repository、Label 和时间戳可唯一标识一个快照。 |
| 仓库(Repository) | 存储备份文件的远程位置。支持 S3、Azure、GCP、OSS、COS、MinIO、HDFS 及其他 S3 兼容存储。 |
| 备份操作 | 对目标对象创建快照,将快照文件上传至 Repository,并存储相关元数据。 |
| 恢复操作 | 从 Repository 下载快照,并将其还原到目标 Doris 集群。 |
前提条件
- 权限:执行账号需具备 ADMIN 权限。
- 部署模式:仅支持存算一体模式,存算分离模式不支持备份与恢复。
使用限制
| 限制项 | 说明 |
|---|
| 存算分离不支持 | 存储与计算解耦的部署模式下,备份和恢复功能不可用。 |
| 不支持异步物化视图(MTMV) | 异步物化视图不在备份范围内,恢复后需手动重建。 |
| 不支持含存储策略的表 | 使用了存储策略的表不支持备份与恢复。 |
| 仅支持全量备份 | 暂不支持增量备份;可通过备份特定分区近似实现增量备份效果。 |
colocate_with 属性不保留 | 恢复后需重新配置共置表的 colocate_with 属性。 |
| 动态分区需手动启用 | 恢复后需通过 ALTER TABLE 手动启用动态分区属性。 |
| 单并发限制 | 同一数据库下同时只能运行一个备份或恢复任务。 |
操作指南
- 备份:创建 Repository,对数据库、表或分区执行全量备份。
- 恢复:从 Repository 快照恢复数据库、表或分区到目标集群。