databricks数据湖  内容精选
  • 文件管理 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    文件管理 通过EDAP前端完成对文件的上传、管理等能力 文件管理 上传文件 进入文件管理列表后,默认选择第一个BOS bucket。需要先下拉选择BOS bucket,然后展示对应bucket下文件列表清单。 点击“上传文件”按钮,支持单个/多个(最多10个)文件上传至BOS,支持文件下载。 文件上传相关限制: 1)支持多个文件上传,最多十个文件; 2)支持单文件最大5G; 3)同文件夹下同名文件

    查看更多>>

  • 密级管理 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    密级管理 数据密级设置 EDAP平台支持L0-L4五级数据密级,分别表示绝密、机密、秘密、敏感、公开,用户可根据国家、行业或企业内部要求,对敏感数据进行分级管理,默认数据密级为L0。 EasyDAP首页选择 数据治理>元数据 ,进入元数据管理界面。 单击数据表名称,进入表详情页。单击标签页 元数据信息 查看详细元数据信息。 查看字段定义,单击密级列 编辑 按钮,下拉选择字段密级。单击确认,完成数据

    查看更多>>

databricks数据湖  更多内容
  • 产品优势 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    产品优势 全场景 围绕数据全生命周期,封装数据从汇聚、开发、管理到服务的一整套体系。 数据集成、数据治理、数据开发、数据分析、数据服务应用一站完成。 低门槛 封装复杂的大数据相关技术和组件,提供简易的操作界面。 0代码数据集成、批&流可视化开发Studio、拖拽式作业编排 、一键多源联邦分析。 开放兼容 无缝对接主流大数据存储计算平台,适配兼容性高。 兼容企业原有IT系统、技术栈,降低数

    查看更多>>

  • 应用场景 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    应用场景 数据集成、交换场景 通过EasyDAP实现异构数据源的数据集成、交换。 数据治理场景 通过EasyDAP从元数据角度对企业数据进行统一数据目录管理、同时保证数据质量、数据安全、提供数据萃取服务。 数仓建设场景 通过EasyDAP进行数据集成、ETL 入仓PALO,高效构建企业级数据仓库。 推荐搭配使用:EasyDAP +BMR+ PALO 数据中台建设场景 通过EasyDAP快速实现数据

    查看更多>>

  • 数据开发 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    数据开发 新建项目 进入“数据加工-我的项目”菜单,创建项目“产品体验测试”,并为项目绑定计算资源。 数据开发 进入项目“产品体验测试”,创建一个脚本作业,脚本类型HiveSQL、SparkSQL均可。将1.1中的示例数据写入表test_stu,并点击执行。 作业运维 执行通过的作业,点击“发布”后将进入运维阶段,在“任务运维”中,可以对该作业进行调度配置、查询运行实例等。

    查看更多>>

  • 作业开发 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    作业开发 工作台管理 ImportWorbenchItem 接口说明 根据category批量导入工作台草稿,仅支持若干文件夹与json文件压缩的zip 原型 PUT /v1/project/${projectName}/workbench/${category}?import 请求参数 名称 类型 位置 必须 描述 projectName String URL 是 项目空间名称 category

    查看更多>>

  • 可视化作业 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    可视化作业 新建文件夹/作业 可视化作业支持按照文件夹进行分组管理,新建作业前可以选择新增文件夹。 选择侧边导航或者快速访问中 数据加工>开发(顶部导航)>实时开发>可视化作业 后进入作业组。 新建文件夹。单击 新建 按钮选择 新建文件夹 ,填写相关配置项即可新建成功。 新建作业。单击 新建 按钮选择 新建作业 ,文件夹支持自行选择存放,填写完毕点击 确定 新建成功。 可视化作业编辑 可视化作业支

    查看更多>>

  • 任务运维 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    任务运维 作业组管理 DeployJobgroup 接口说明 上线已发布的最高版本作业组 原型 POST /v1/project/<projectName>/jobgroup/<jobgroupName>?deploy 请求参数 名称 类型 位置 必须 描述 projectName String URL 是 项目空间名称 jobgroupName String URL 是

    查看更多>>

  • Spark作业 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    Spark作业 新增文件夹/作业 Spark作业支持按照文件夹进行分组管理,新建作业前可以选择新增文件夹。 选择侧边导航或者快速访问中 数据加工>开发(顶部导航)>实时开发(侧边导航)>Spark作业 后进入作业组。 新建文件夹。单击新建按钮选择 新建文件夹 ,填写相关配置项即可新建成功。 新建作业。单击新建按钮选择 新建作业 ,文件夹支持自行选择存放,填写完毕点击确定新建成功。新建Scala作业

    查看更多>>

  • 数据质量 - 百度数据湖管理与分析平台EDAP | 百度智能云文档

    数据质量 数据汇聚到平台后,需要对数据的完整性、唯一性、有效性、准确性、一致性、及时性进行探查,清洗脏数据,以确保数据的存储和共享的质量。 创建质量规则 根据字段标准规范,为数据表test_score添加如下质量规则: 字段 规范 质量规则 id 唯一性 字段唯一值 email 邮箱格式 邮箱校验 不允许为空 字段空值 score 值域范围在0-100之间 字段最小值、字段最大值 备注:以上质量规

    查看更多>>