CORR
更新时间:2025-10-16
描述
计算两个随机变量的皮尔逊系数
语法
SQL
1CORR(<expr1>, <expr2>)
参数
| 参数 | 说明 |
|---|---|
<expr1> |
数值型表达式(列) |
<expr2> |
数值型表达式(列) |
返回值
返回值为 DOUBLE 类型,expr1 和 expr2 的协方差,除 expr1 和 expr2 的标准差乘积,特殊情况:
- 如果 expr1 或 expr2 的标准差为 0, 将返回 0。
- 如果 expr1 或者 expr2 某一列为 NULL 时,该行数据不会被统计到最终结果中。
举例
SQL
1select * from test_corr;
Text
1+------+------+------+
2| id | k1 | k2 |
3+------+------+------+
4| 1 | 20 | 22 |
5| 1 | 10 | 20 |
6| 2 | 36 | 21 |
7| 2 | 30 | 22 |
8| 2 | 25 | 20 |
9| 3 | 25 | NULL |
10| 4 | 25 | 21 |
11| 4 | 25 | 22 |
12| 4 | 25 | 20 |
13+------+------+------+
SQL
1select id,corr(k1,k2) from test_corr group by id;
Text
1+------+--------------------+
2| id | corr(k1, k2) |
3+------+--------------------+
4| 4 | 0 |
5| 1 | 1 |
6| 3 | NULL |
7| 2 | 0.4539206495016019 |
8+------+--------------------+
