VAR_SAMP,VARIANCE_SAMP
更新时间:2025-10-16
描述
VAR_SAMP 函数计算指定表达式的样本方差。与 VARIANCE(总体方差)不同,VAR_SAMP 使用 n-1 作为除数,这在统计学上被认为是对总体方差的无偏估计。
别名
- VARIANCE_SAMP
语法
SQL
1VAR_SAMP(<expr>)
参数
| 参数 | 描述 |
|---|---|
<expr> |
要计算样本方差的列或表达式 |
返回值
返回一个 DOUBLE 类型的值,表示计算得到的样本方差。
举例
SQL
1-- 创建示例表
2CREATE TABLE student_scores (
3 student_id INT,
4 score DECIMAL(4,1)
5) DISTRIBUTED BY HASH(student_id)
6PROPERTIES (
7 "replication_num" = "1"
8);
9
10-- 插入测试数据
11INSERT INTO student_scores VALUES
12(1, 85.5),
13(2, 92.0),
14(3, 78.5),
15(4, 88.0),
16(5, 95.5),
17(6, 82.0),
18(7, 90.0),
19(8, 87.5);
20
21-- 计算学生成绩的样本方差
22SELECT
23 VAR_SAMP(score) as sample_variance,
24 VARIANCE(score) as population_variance
25FROM student_scores;
Text
1+------------------+---------------------+
2| sample_variance | population_variance |
3+------------------+---------------------+
4| 29.4107142857143 | 25.73437500000001 |
5+------------------+---------------------+
