常见问题
产品售卖类问题
1、产品目前支持哪几种交付形态?
- 公有云SaaS版
- 私有化本地部署
- 行业云ABCstack
2、产品如何计费?
- 公有云:目前功能可免费使用,仅对计算资源进行计费,Serverless资源组计费说明:https://cloud.baidu.com/doc/EDAP/s/Slfvycwj6
- 私有化:支持一次性买断/按年订阅制购买,详情请联系ACG SA。
产品部署类问题
1、产品部署的硬件要求?
12核cpu+64G内存+200GB*2系统盘+centos>=7.3,最小部署3节点。
2、是否支持分模块部署?
支持,通过前端部署配置文件可控制功能模块的显示/隐藏。
3、是否支持国产化适配?
已适配麒麟V10操作系统和国产ARM CPU。
产品概念类问题
1、数据仓库、数据湖、湖仓一体?
- 数据湖 vs 数据仓库:存储和计算资源分离,半结构化和非结构化数据存储,计算资源资源弹性扩缩容。
- 湖仓一体 vs 数据湖:利用hudi、iceberg等数据湖格式,补齐实时场景下数据写入、更新的能力,降低事后数据治理的难度,提升实时数据读写性能。
2、项目是什么概念?
项目是使用EDAP进行数据集成、开发、运维的最小单位,可以按照项目管理、组织机构等方式进行划分。
3、什么是Serverless资源组?
Serverless资源组是一种云上免运维的、弹性伸缩的计算资源,为用户屏蔽复杂的底层Trino、Spark、Flink组件,可以低门槛、低成本地进行数据开发、分析。
4、EDAP数据治理体系?
EDAP数据治理体系包括数据标准、数据建模、数据指标、数据质量、数据血缘、数据服务等功能模块,面向企业的数据治理和管理人员,可以结合数据治理咨询和实施服务,在EDAP中实现数据治理的落地和数据资产的沉淀。
产品使用类问题
1、EDAP支持哪几种角色?如何使用IAM进行用户角色和权限控制?
https://cloud.baidu.com/doc/EDAP/s/hl64tgyjq
2、EDAP支持哪几种计算资源集群?
百度mapreduce(BMR)Hadoop集群、客户自建第三方Hadoop集群、Serverless资源组。
3、EDAP支持哪几种数据湖选型?
EDAPDataLake、Hadoop-Hive
4、EDAP支持接入哪些数据源?
- 关系型数据库:mysql、oracle、sqlserver、hana、postgresql、doris、greenplum、tidb
- 非关系型数据库:redis、mongodb、elasticsearch、memcached
- 大数据存储:hbase、hive、clickhouse
- 半结构化存储:ftp
5、规范设计模块的作用?
规范设计是在数据开发工作前对数据架构的整体规划,主要内容包括:业务主题设计、数据标准制定、数据模型构建、数据指标定义,一方面可以提升数据开发的规范性,完成数据落标和数据资产沉淀,另一方面通过数仓分层建设,提升模型的复用性,提升业务数据开发的响应效率。
6、数据建模支持哪几种建模方法论?
关系建模、维度建模。
7、EDAP如何实现数据引标、落标?
EDAP支持通过数据标准自动生成或手动添加落标规则,并且通过数据模型字段引用标准,实现元数据与标准的映射,根据映射关系自动创建质量任务进行探查,发现数据问题并生成落标报告,指导用户进行数据整改。
8、EDAP数据集成支持的源端、目标端有哪些?
数据集成源端支持Mysql、SQLServer、Oracle、PostgreSQL、达梦,目标端支持Hive、Doris、EDAP_Datalake,可视化ETL支持范围参照数据源管理。
9、EDAP是否支持离线作业和实时作业开发?
支持,离线作业开发支持MR、Spark引擎,实时作业开发支持SparkStreaming、Flink引擎。
10、EDAP支持哪几种调度场景?
支持单次调度和周期性调度,调度周期支持分钟级、小时级、天级别、周级别、月级别。 支持进行调度依赖配置,例如时间依赖、任务依赖。
11、EDAP如何进行作业告警?
公有云对接BCM实现作业告警,告警事件支持成功、失败、超时,告警方式支持短信、邮件、电话。
12、EDAP是否支持数据血缘的自动解析?
支持,针对SQL脚本作业、可视化ETL作业、数据集成等作业类型,可以进行血缘关系自动解析,针对Shell、Jar包等作业类型,提供手动填报的入口,实现数据血缘覆盖率100%。
13、EDAP具备哪些数据安全能力?
细粒度的数据权限管理,库、表、字段级别,可以添加行过滤规则; 隐私数据保护,支持哈希、遮掩、变换、加密等多种脱敏算法,支持进行数据静态和动态脱敏。
14、是否支持日志审计?
支持,公有云通过对接云审计产品,实现用户操作日志的保存和查看。