行业最佳实践
更新时间:2024-09-20
电商场景DEMO
DEMO简介
1 | 内容 | 备注 |
---|---|---|
2 | 计算资源 | 需要用户手动选择一个资源类型 |
3 | 数据消费存储 | 基于用户选择的资源属性,自动创建存储路径 |
4 | 数据源 | 基于EDAP内置MySQL自动创建示例数据库 |
内置电商行业最佳实践DEMO,支持用户一键导入,用于产品教学体验。
存储路径
- 类型:HDFS
- 名称:电子商务示例存储路径
- 集群名称:所选BMR资源集群
- HDFS地址:需根据建模选择demo_ecommerce_db
数据源
- 名称:电子商务示例数据库
- Catalog名称:demo_ecommerce_connection
- 主机、端口:默认填充
- 数据库名称:demo_ecommerce_db
- 用户名、密码:默认填充
- 数据源版本:默认选择
规范设计
1.主题设计
主题域名称:电子商务示例主题域,主题域编码:demo_ecommerce_subject
主题名称:电子商务示例主题,主题编码:demo_ecommerce_topic
2.数据标准
- 目录名称:一级目录与主题域名称相同,二级目录与主题名称相同
- 编码格式统一为:demoecommerce_standard/code{四位数字编号}
数据落标需要自动生成质量任务。
3.数据模型
需要包含关系模型、维度模型,默认为已发布、已同步状态。
关系模型(参考)
维度模型(参考)
模型物化
- 物化数据库:EDAPDataLake
-
物化数据库:demo_ecommerce_db
4.数据指标
包含原子指标、衍生指标、复合指标的设计,默认为已发布状态。
Demo导入
最佳实践DEMO导入者为项目管理员角色,如果其他用户想访问项目,需要项目管理员将其添加到项目中。
我的项目
左侧导航栏选择“数据加工-我的项目”,可查看导入的“电子商务示例项目”。
数据集成
离线数据同步:Mysql——>EDAPDataLake ODS层,每天进行T-1增量更新;同步的数据库、表范围为关系建模中所有的模型。
数据开发
脚本作业开发:脚本作业类型为HiveSQL,内容为DWR、DWD、DWS、ADS层数据ETL逻辑
作业组开发:需包含数据同步任务、数据开发任务、质量探查任务
作业运维
配置天级别调度,每天0点0分开始执行;导入时先手动执行一次,生成当天任务实例。
Demo暂不支持数据分析和数据服务。