跳到主要内容

概述

概览

CCR (Cross Cluster Replication) 是一种跨集群数据同步机制,能够在库或表级别将源集群的数据变更同步到目标集群。它主要用于提升在线服务的数据可用性、读写负载隔离和建设两地三中心架构。CCR 目前不支持存算分离模式。

适用场景

CCR 适用于以下几种常见场景:

  • 容灾备份:将企业数据备份到另一集群和机房,确保在业务中断或数据丢失时能够恢复数据,或快速实现主备切换。金融、医疗、电子商务等行业通常需要这种高 SLA 的容灾备份。

  • 读写分离:通过将数据的查询操作与写入操作分离,减小读写之间的相互影响,提升服务稳定性。对于高并发或写入压力大的场景,采用读写分离可以有效分散负载,提升数据库性能和稳定性。

  • 数据集中:集团总部需统一管理和分析分布在不同地域的分公司数据,避免因数据不一致导致的管理混乱和决策错误,从而提升集团管理效率和决策质量。

  • 隔离升级:在进行系统集群升级时,使用 CCR 可以在新集群中进行验证和测试,避免因版本兼容问题导致的回滚困难。用户可以逐步升级各个集群,同时保证数据一致性。

  • 集群迁移:在进行 Doris 集群的机房搬迁或设备更换时,使用 CCR 可以将老集群的数据同步到新集群,确保迁移过程中的数据一致性。

任务类别

CCR 支持两种任务类型:

  • 库级任务:同步整个数据库的数据。
  • 表级任务:仅同步指定表的数据。注意,表级同步不支持重命名表或替换表操作。此外,Doris 每个数据库只能同时运行一个快照任务,因此表级同步的全量同步任务需要排队执行。

原理与架构

名词解释

  • 源集群:数据源所在的集群,通常为业务数据写入的集群。
  • 目标集群:跨集群同步的目标集群。
  • binlog:源集群的变更日志,包含了 schema 和数据变更。
  • Syncer:一个轻量级的进程,负责同步数据。
  • 上游:在库级任务中指上游库,在表级任务中指上游表。
  • 下游:在库级任务中指下游库,在表级任务中指下游表。

架构说明

CCR 架构说明

CCR 主要依赖一个轻量级进程:SyncerSyncer 负责从源集群获取 binlog,并将元数据应用到目标集群,通知目标集群从源集群拉取数据,从而实现全量同步和增量同步。

原理

  1. 全量同步

    • CCR 任务会首先进行全量同步,将上游数据一次性完整地复制到下游。
  2. 增量同步

    • 在全量同步完成后,CCR 任务会继续进行增量同步,保持上游和下游数据的一致性。
  3. 重新开始全量同步的情况

    • 遇到当前不支持增量同步的 DDL 操作时,CCR 任务会重新启动全量同步。具体哪些 DDL 操作不支持增量同步,请参见功能详情
    • 如果上游的 binlog 因为过期或其他原因中断,增量同步会停止,并触发全量同步的重新开始。
  4. 同步过程中

    • 在全量同步进行期间,增量同步会暂停。
    • 全量同步完成后,下游的数据表会进行原子替换,以确保数据一致性。
    • 全量同步完成后,会恢复增量同步。

同步方式

CCR 支持四种同步方式:

同步方式原理触发时机
Full Sync上游进行全量备份,下游进行恢复。DB 级任务触发 DB 备份,表级任务触发表备份。首次同步或特定操作触发。触发条件请参见功能详情
Partial Sync上游表或分区级别备份,下游表或分区级别恢复。特定操作触发,触发条件请参见功能详情
TXN增量数据同步,上游提交后,下游开始同步。特定操作触发,触发条件请参见功能详情
SQL在下游回放上游操作的 SQL。特定操作触发,触发条件请参见功能详情