导入是一个异步命令。以上导入命令执行成功,仅代表导入任务提交成功,具体任务的执行情况,您可以通过 show load; 命令查看。当结果中, State 的状态为 FINIHSED ,则表示导入成功,数据可见。 不支持访问非 DORIS 所在地区的 BOS。如北京地区的 DORIS 集群无法访问保定地区的 BOS。 bos_endpoint 指定了 BOS 的 endpoint。
前期数据准备 数据模型的准备 设置中文别名 数据库中存放的字段可能是英文的,在数据模型的编辑页面,直接使用原始数据表即直接使用英文字段,若不对其进行处理,在使用智能问数功能时,大模型无法将您的中文自然语言与英文字段进行对应,也就无法给出令人满意的答案。所以我们需要在数据模型的编辑页面将字段名称设置为可读性较高的中文别名。
什么是数据洞察 1. 如何理解数据洞察与处理 在大语言模型的精调领域,数据准备占据着至关重要的作用。贴合业务精调目标的高质量SFT数据集,可有效提升大语言模型的训练效率及效果表现。 SFT数据集评价标准 什么是一份好的SFT数据集?以下列举了一些经过验证的实践经验: 精调数据最好来自于业务场景的真实调用数据,样本分布情况相近,从而让大模型更好的参考学习。
除这些预留字段外,Prompt+Response数据集还额外支持您在数据中扩展自定义业务字段,为数据集样本附加多维度元信息,例如实际业务指标、终端用户反馈和分类标签,可在数据准备过程中指导您更好地进行数据洞察与处理。
分享链接导入 输入链接地址导入:压缩包(请确保将全部数据文件保存至同一压缩包)。 平台已有数据集 仅支持选择未发布的数据集版本。 以上所有步骤完成后,即可导入数据至数据集。
日期时间格式化设置 如果当前维度字段类型为日期、日期时间、时间戳时,可以通过对当前维度字段进行日期时间数据聚合的设置,如图将数据进行聚合或者时间格式的调整: 可以通过选择需要转换的日期类型将数据进行聚合或者日期格式的调整: 日期类型说明 年:根据筛选数据时间的「年份」进行数据的聚合 年-季度:根据筛选数据时间按照当前「年份的季度」进行聚合 年-月:根据筛选数据时间按照当前「年份的月份」进行聚合 年-
数据血缘操作指导 介绍Sugar BI产品中如何应用数据血缘功能。
数据门户操作指导 介绍Sugar BI产品中如何应用数据门户功能。
数据填报操作指导 介绍Sugar BI产品中如何应用数据填报功能。
删除数据增强任务 接口描述 本接口用于删除数据增强任务。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配请查看 角色与权限控制列表 、 账号创建与权限分配 。