跳到主要内容

数据正确性问题

本文档主要用于记录 Doris 使用过程中关于数据正确性的常见问题。会不定期更新。

表格中的“表出现重复 key 数据”均指在 merge-on-write Unique 表中出现重复 key 数据。merge-on-write Unique 表上的重复 key 问题都可以通过触发full compaction来进行修复,其他类型的正确性问题可能需要根据情况来确定修复方案,如有需要,请联系社区支持。

问题现象发生条件影响版本Fix 版本影响范围Fix PR
使用 Stream Load 向 merge-on-write Unique 导入数据时,对于满足delete参数所指定的删除条件的数据,导入后没有被删除掉使用 Stream Load 导入数据时,设置了merge_type: MERGE, partial_columns: truedelete参数<2.0.15>=2.0.15部分列更新#40730
表出现重复 key 数据用户使用ALTER TABLE tbl ENABLE FEATURE "SEQUENCE_LOAD" WITH ...语句给一个不支持 sequence 列的 merge-on-write Unique 表添加了 sequence 列功能并且之后有新的导入<2.0.15>=2.0.15#39958
使用部分列更新导入后,merge-on-write Unique 表中部分数据错乱merge-on-write Unique 表上有并发的部分列更新导入,并且导入过程中有 BE 重启<2.0.15>=2.0.15部分列更新#38331
表出现重复 key 数据merge-on-write Unique 表上有 sequence 列,表上存在单次数据量很大的导入,且触发了 segment compaction<2.0.15>=2.0.15#38369
表出现重复 key 数据存算一体模式下 merge-on-write Unique 表上有失败的 full clone<2.0.13>=2.0.13#37001
merge-on-write Unique 表上多副本数据不一致merge-on-write Unique 表上有过指定了__DORIS_DELETE_SIGN__列的部分列更新导入,且在导入的时候不同副本上 Base Compaction 进度不一致<2.0.15>=2.0.15部分列更新#36210
表出现重复 key 数据merge-on-write Unique 表上有并发的部分列更新导入,并且导入过程中有 BE 重启<2.0.11>=2.0.11部分列更新#35739