获取数据集版本导入详情 接口描述 本接口用于获取数据集版本的导入任务详情。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
发起数据集版本导入任务 接口描述 本接口用于对特定数据集版本发起数据导入任务。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
查看数据集列表 平台支持统一纳管自训练模型的数据集,可与数据标注/数据清洗/数据增强等能力相结合,构建面向生成式大模型场景的数据集,如下图所示: 您可根据实际需求对数据集进行名称变更、新增版本、导入数据和删除等操作。 创建数据集 在指定数据集名称、数据用途、数据格式等基本信息后,您可发起数据上传并指定目标存储位置,由此完成数据集创建。
流式数据处理 整体概述 工作流升级了流式数据在画布流程中的传递规则,增强了对自定义组件嵌套使用时的流式数据传递支持,并优化了 API 节点和函数计算(CFC)节点返回的复杂流式内容的处理能力。 因此,新增流式数据处理节点,可支持处理前序节点输出的流式数据,帮助更便捷处理API节点或函数计算CFC节点返回的流式内容。该节点可用于流式返回的文本内容拼接,或者直接提取第一帧或最后一帧的数据。
流式数据处理 整体概述 工作流升级了流式数据在画布流程中的传递规则,增强了对自定义组件嵌套使用时的流式数据传递支持,并优化了 API 节点和函数计算(CFC)节点返回的复杂流式内容的处理能力。 因此,新增流式数据处理节点,可支持处理前序节点输出的流式数据,帮助更便捷处理API节点或函数计算CFC节点返回的流式内容。该节点可用于流式返回的文本内容拼接,或者直接提取第一帧或最后一帧的数据。
Body请求示例: Plain Text 复制 1 { 2 "text": "<UTF-8编码数据>" 3 } Body中放置请求参数,参数详情如下: 请求参数 参数 是否必选 类型 可选值范围 说明 text 是 string - 文本数据,UTF-8编码。
gt;" 3 } Body中放置请求参数,参数详情如下: 请求参数 参数 是否必选 类型 可选值范围 说明 text 是 string - 文本数据,UTF-8编码。
此时,您可以继续在此数据集下,增加「未标注」数据,并对新增的「未标注」数据进行智能标注。 Tips :您在再次启动智能标注前,建议先完成至少一次「优化智能标注」的过程。此时,智能标注的数据将比「优化智能标注」前质量更高。 五、文本智能标注原理说明 训练模型过程中,通常需要经历数据集准备(标注)、任务网络配置开发、模型的训练和部署等重要过程。
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
EasyDL结构化数据介绍 简介 Hi,您好,欢迎使用百度EasyDL结构化数据 目前EasyDL结构化数据支持训练以下模型: 表格数据预测 通过机器学习技术从表格化数据中发现潜在规律,从而创建机器学习模型,并基于机器学习模型处理新的数据,为业务应用生成预测结果 时序预测 通过机器学习技术从历史数据中发现潜在规律,从而对未来的变化趋势进行预测。