pandas数据清洗  内容精选
pandas数据清洗  更多内容
  • 数据源权限 - 百度千帆·数据智能平台DataBuilder | 百度智能云文档

    数据源权限 数据源权限管理提供数据源权限管控,对接外部数据源权限,授权时长灵活可控。 支持授予源链接的访问、管理权限。 批量授权 支持管理员为用户或用户组批量授予数据源链接的访问、管理权限,授权项: 字段 字段说明 用户或用户组 选择系统添加的用户或用户组进行授权。 权限 访问:可连接已选数据源。 管理:可编辑、删除已选数据源链接。 有效期 支持永久授权和临时授权。 授予原因 输入授权原因。

    查看更多>>

  • 数据增强功能全新重构:解决数据准备难题,20条数据即可开启高效模型训练 千帆社区

    数据增强功能全新重构:解决数据准备难题,20条数据即可开启高效模型训练 大模型开发 / 产品动态 文心大模型 LLM 2025.08.18 8224 看过 数字化转型中,企业对大模型的业务适配需求日益迫切,但数据准备成为核心卡点。 大模型训练需要高质量且充足的数据支持,但垂类场景常面临高质量标注数据稀缺、成本高昂的问题,隐私合规也限制了数据来源。此外,数据类别不平衡也会影响模型效果。

    查看更多>>

  • 取消数据流动任务 - 并行文件存储PFS | 百度智能云文档

    取消数据流动任务 描述 取消数据流动任务,任务取消后无法恢复。 请求 请求结构 Shell 复制 1 POST /?

    查看更多>>

  • 权限体系 - 百度千帆·数据智能平台DataBuilder | 百度智能云文档

    数据 ✘ ✘ 读取 ✘ ✘ 编辑 ✘ ✘ 创建 ✘ ✘ 管理 ✘ ✘ 数据模式 无权限 ✔️ ✘ 读取 ✘ ✘ 编辑 ✘ ✘ 创建 ✘ ✘ 管理 ✘ ✘ 数据表 无权限 ✔️ ✘ 读取 ✘ ✘ 修改 ✘ ✘ 管理 ✘ ✘ 数据卷 无权限 ✔️ ✘ 读取 ✘ ✘ 修改 ✘ ✘ 管理 ✘ ✘ 数据集 无权限 ✔️ ✘ 读取 ✘ ✘ 写入 ✘ ✘ 新建版本 ✘ ✘ 管理 ✘ ✘ 模型 无权限 ✔️

    查看更多>>

  • 数据倾斜处理 - Baidu Palo/Doris 使用文档

    数据倾斜处理 数据倾斜处理 概述 PALO 是一个 MPP 数据库,依赖数据 shuffle 进行并行的计算加速。但是实际生产场景经常会遇到因为数据倾斜导致查询并行的单线程的执行瓶颈。下节介绍如何发现这类问题,并提供一些通用的解决方法。

    查看更多>>

  • 存储路径权限 - 百度千帆·数据智能平台DataBuilder | 百度智能云文档

    批量授权 支持管理员为用户或用户组批量授予存储路径的访问、管理权限,授权项: 字段 字段说明 用户或用户组 选择系统添加的用户或用户组进行授权 权限 读:可读取已选数据数据 写:可增加、删除和修改数据湖 新建:可在该数据湖建表 管理:可编辑、删除已选数据源链接 有效期 支持永久授权和临时授权 授予原因 输入授权的原因 查看权限 支持按照存储路径维度查看用户权限。

    查看更多>>

  • 数据权限 - 百度千帆·数据智能平台DataBuilder | 百度智能云文档

    数据权限 元数据权限管理是数据治理的一个重要组成部分,对数据元数据(即描述数据数据)的访问和操作权限的控制,防止未授权访问。实施有效的元数据权限管理,组织可以更好地控制数据资产,提高数据治理的效率和效果。 库表授权 支持管理员为用户或用户组授予库表权限。

    查看更多>>

  • 权限审批 - 百度千帆·数据智能平台DataBuilder | 百度智能云文档

    权限审批 权限审批 权限审批模块,提供一个统一的界面,展示所有待审核的单据,包括数据源申请、元数据申请、存储路径申请。允许授权用户高效地处理数据源、元数据、存储路径等资源的申请请求。 提交审核 在「数据安全-数据申请」模块中,进行数据源申请、元数据申请、存储路径申请操作都会生成一个审核单据,支持申请访问、管理等不同粒度的权限。

    查看更多>>