湖概览
更新时间:2024-12-04
- 进入百度数据湖管理与分析平台EasyDAP控制台,单击页面中数据湖模块进入湖概览界面,或者单击侧边导航数据湖>湖管理>湖概览。
- 湖概览是对数据湖统计的展示,展示存储信息。新增数据在次日统计更新。
图一 湖概览界面
表一 展示指标说明
指标名称 | 指标说明 |
---|---|
存储总数 | 元数据管理下表的存储总量(仅含BOS) |
存储总量-日环比 | 日环比 =(当日存储总量 − 昨日存储总量 )/昨日存储总量 *100% |
存储总量-月环比 | 月环比 =(当月存储总量 −上月存储总量 )/上月存储总量 *100% |
存储总量-日新增 | 日新增 =当日存储总量 − 昨日存储总量 |
存储总量-月新增 | 月新增 =当月最后一日存储总量 −上月最后一日存储总量 |
文件总数 | 元数据管理下表的文件总数(仅含HDFS) |
文件总数-日环比 | 日环比=(当日文件总数−昨日文件总数)/昨日文件总数*100% |
文件总数-月环比 | 月环比=(当月文件总数−上月文件总数)/上月文件总数*100% |
文件总数-日新增 | 日新增=当日文件总数−昨日文件总数 |
文件总数-月新增 | 月新增=当月文件总数−上月文件总数 |
库总数 | 元数据管理中的总库数量 |
库总数-日环比 | 日环比=(当日库总数−昨日库总数)/昨日库总数*100% |
库总数-月环比 | 月环比=(当月库总数−上月库总数)/上月库总数*100% |
库总数-日新增 | 日新增=当日库总数−昨日库总数 |
库总数-月新增 | 月新增=当月最库总数−上月库总数 |
表总数 | 元数据管理中的总表数量 |
表总数-日环比 | 日环比=(当日表总数−昨日表总数)/昨日表总数*100% |
表总数-月环比 | 月环比=(当月表总数−上月表总数)/上月表总数*100% |
表总数-日新增 | 日新增=当日表总数−昨日表总数 |
表总数-月新增 | 月新增=当月表总数−上月表总数 |
总存储变化趋势 | 历史存储总量变化趋势。时间筛选默认:近7天、近1月、近3月 |
文件数量变化趋势 | 历史文件数量变化趋势。时间筛选默认:近7天、近1月、近3月 |
库数量变化趋势 | 历史数据库数量变化趋势。时间筛选默认:近7天、近1月、近3月 |
数据存储格式分布统计 | 元数据管理中的表存储格式占比。支持根据数据库进行筛选,默认全部库。具体类型有Iceberg、PARQUET、ORC、Hudi、TEXTFILE、Delta Lake |
大小文件分布 | 当前目录下文件总数、以及文件分布。小文件:小于等于1MB中文件:小于等于128MB大文件:大于128MB |