English中文日本語dev性能与调优查询性能高效去重本页总览高效去重去重是分析场景中最消耗资源的操作之一。Apache Doris 提供两种专门的数据类型来替代 COUNT DISTINCT,以更低的内存与延迟代价完成去重:需要精确结果时选择 BITMAP,可以接受 1%–2% 误差以换取更小存储时选择 HLL。 精准去重 BITMAP 精准去重使用 BITMAP 类型替代 COUNT DISTINCT,实现精确去重,同时提升查询速度并降低内存与磁盘占用。 近似去重 HLL 近似去重基于 HyperLogLog 的近似去重,误差控制在 1%–2%,存储占用小,适合大规模 UV 与基数统计场景。