质量报告
更新时间:2023-08-16
质量评价指标体系
1、评价对象
评价对象分为EDAPDataLake和其他数据源链接(MySql、Hive等)
- EDAP的评价对象包括主题、库、表、字段;
- 其他数据源的评价对象包括数据源链接、库、表、字段;
2、评分
默认采用百分制,满分为100分,75-100 优秀、50-75 良好、25-50 合格、0-25 不合格;
3、计算公式
字段评分 = ∑ 规则设置率评分 * 评分系数 / 规则的数量;
- 规则设置率评分:未设置规则,得25分,每设置一项规则,加25分,加满为止(设置3项即可得满分);
- 评分系数:无告警为1,提示为0.75,告警为0.5,严重为0.25;
表评分 = ∑ 表所有字段的评分 / 字段的数量;
库评分 = ∑ 库下所有表的评分 / 表的数量;
主题/数据源链接评分 = ∑ 主题/数据源链接下所有库的评分 / 库的数量;
查看质量报告
查看技术报告
操作步骤
- 登录并进入百度智能云数据湖管理与分析EasyDAP。
- 在左侧导航栏,单击“数据治理-数据质量”。
- 单击上方“质量报告”,在左侧目录中选中“技术报告”,从左侧各数据源类型中选择一个,可查看对应主题/源连接或库的评分。
- 点击“表评分”部分中,“告警状况”列下的蓝字按钮,可跳转至运维管理列表页。
名称 | 描述 |
---|---|
主题/源连接得分、库得分 | 如果选择的是一个主题/源连接,则显示当前主题/源连接的整体得分,即所有库评分的平均值。如果选择的是一个数据库,则显示当前数据库的整体得分,即库下所有表评分的平均值。 |
历史得分趋势 | 选中的主题/源连接或者库的历史得分趋势。 |
库评分、表评分 | 如果选择的是一个主题/源连接,则显示当前主题/源连接的所有库的得分详情。如果选择的是一个数据库,则显示当前数据库的所有表的得分详情。 配置规则数是当天该库或表已有的所有规则总数。告警规则数和告警状态数量是仅当天的告警数据统计,不包含历史告警数量。 |
导出报告
点击库评分或表评分下的导出报告,可以导出当前评分详情为word格式。word内容如下:
报告更新周期:
质量报告按周期定时更新,默认更新周期为4小时。
极端情况说明:
- 如果库下没有一个表设置质量规则,则评分全部为默认25分。
- 对于设置了质量规则的表评分,使用最近一次运行完的实例结果计算字段评分。如果运行一次后没有再运行该表相关的质量任务,该表的评分会一直为本次运行结果计算出的评分。
- 质量报告是周期性更新的,对于当天最后一个周期内执行的质量任务,可能会第二天才更新。
查看业务报告
1、单击“数据质量”模块中的“质量报告”,在左侧目录中选中“业务报告”,从左侧各数据源类型中选择一个,可查看对应主题域或主题的评分。
2、点击“主题评分”部分中,“告警状况”列下的蓝字按钮,可跳转至运维管理列表页。
3、点击“主题评分”下“导出报告”按钮,即可完成业务报告的word格式导出,导出内容与上文“技术报告”内容格式类似。