文件大小:小文件通常是指文件大小在几KB到几MB之间的文件,小文件传输速率约2600个/秒;大文件通常是指文件大小在几百MB到几GB,甚至更大,大文件传输速率主要与带宽有关。 数据传输速率示例: 大文件场景:假设用户购买了50TB的极速型,此时PFS实例的吞吐能力为50TB*230MBps/TB ≈ 11GBps。
文本分类数据标注说明 文本标注 上传未标注文本后,进入到标注页面,您可以逐一查看每一篇未标注的文本,如下图: 设定分类对应的标签 创建标签后,即可以进行对文本的标注,在文本的上方标签字段处,会显示对应的分类标签,完成标注
小Tips:“如何利用好重复样本” 如果您的数据存在样本种类不均衡的现象,您可以通过将重复样本数量小的那一类,使其样本数量增加到与数据量大的那一类样本数量相近,以提高模型训练的效果,这种方法也称为“上采样”。 平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。
删除工作流 接口描述 删除工作流 权限说明 用户删除 工作空间 下特定工作流的详情需具有管理工作流(WORKFLOW)的权限:管理MANAGE 注意事项 用户没有权限会导致删除失败 工作流不存在会导致删除失败 当前工作流有处于运行状态的运行记录,则不允许删除 当前工作流已经启动定调度任务,则不允许删除 请求结构 Pla
小Tips:“如何利用好重复样本” 如果您的数据存在样本种类不均衡的现象,您可以通过将重复样本数量小的那一类,使其样本数量增加到与数据量大的那一类样本数量相近,以提高模型训练的效果,这种方法也称为“上采样”。 平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。
如何发布表格数据预测API 训练完毕后可以在左侧导航栏中找到【发布模型】,依次进行以下操作即可发布公有云API: 选择模型 选择部署方式「公有云部署」 选择版本 自定义服务名称、接口地址后缀 申请发布 申请发布后,通常的审核周期为T+1,即当天申请第二天可以审核完成。如果需要加急、或者遇到莫名被拒的情况,请在百度云控制台内 提交工单 反馈。
质量报告 质量报告是数据质量监控结果的可视化汇总,根据每条规则当日最新运行状态和告警等级进行统计,整合了规则执行、异常统计、规则校验明细等信息,可直观呈现数据质量全貌。质量报告支持刷新和下载PDF到本地。 表质量通过率 当日运行成功的质量规则数中未告警的质量规则占比,同时支持查看各维度通过率。 异常规则数 异常规则数即当日最新告警等级为提示、严重、警告的规则数。
暂停工作流实例 接口描述 将处于运行状态的工作流实例的工作流暂停。 权限说明 暂停某个工作流 WORKFLOW 的工作流实例,需要用户具有一下任一权限 运行工作流的权限: 运行 EXECUTE 编辑工作流的权限: 编辑 MODIFY 管理工作流的权限:管理 MANAGE 注意事项 工作流实例或者工作空间不存在,则终止工
删除工作流实例 接口描述 删除指定的工作流实例 权限说明 删除工作流 WORKFLOW 特定工作流实例,需要用户具有以下任一权限 运行工作流的权限: 运行 EXECUTE 编辑工作流的权限: 编辑 MODIFY 管理工作流的权限:管理 MANAGE 注意事项 工作流实例或者工作空间不存在,则删除工作流实例失败 用户没有
停止工作流实例 接口描述 直接终止当前正在运行的指定工作空间下的工作流实例 权限说明 终止某个工作流 WORKFLOW 的工作流实例,需要用户具有一下任一权限 运行工作流的权限: 运行 EXECUTE 编辑工作流的权限: 编辑 MODIFY 管理工作流的权限:管理 MANAGE 注意事项 工作流实例或者工作空间不存在,