APPROX_COUNT_DISTINCT
更新时间:2025-10-16
描述
APPROX_COUNT_DISTINCT 函数基于 HyperLogLog 算法实现,使用固定大小的内存估算列基数。 该算法基于尾部零分布假设进行计算,具体精确程度取决于数据分布。基于 PALO 使用的固定桶大小,该算法相对标准误差为 0.8125%
语法
SQL
1APPROX_COUNT_DISTINCT(<expr>)
参数说明
参数 | 说明 |
---|---|
<expr> |
需要获取值的表达式 |
返回值
返回 BIGINT 类型的值。
举例
SQL
1select approx_count_distinct(query_id) from log_statis group by datetime;
Text
1+-----------------+
2| approx_count_distinct(`query_id`) |
3+-----------------+
4| 17721 |
5+-----------------+