跳到主要内容

APPROX_COUNT_DISTINCT

描述

APPROX_COUNT_DISTINCT 函数基于 HyperLogLog 算法实现,使用固定大小的内存估算列基数。 该算法基于尾部零分布假设进行计算,具体精确程度取决于数据分布。基于 Doris 使用的固定桶大小,该算法相对标准误差为 0.8125% 更详细具体的分析,详见相关论文

语法

APPROX_COUNT_DISTINCT(<expr>)

参数说明

参数说明
<expr>需要获取值的表达式

返回值

返回 BIGINT 类型的值。

举例

select approx_count_distinct(query_id) from log_statis group by datetime;
+-----------------+
| approx_count_distinct(`query_id`) |
+-----------------+
| 17721 |
+-----------------+