数据筛选 filters : { // 数据筛选器 connect : AND , // 筛选条件连接方式 AND/且、OR/或 exprs : [ // 包含的过滤条件,可以是条件或者组合 { filter : { // 条件 type : d , // 筛选字段类型 d/维度、m/度量 id : SG013D40CAE7C5C32C , // 筛选字段id searchParams
克隆实例恢复数据典型实践 概览 在数据库的使用过程中,如果遇到误操作导致的数据删除、数据篡改等问题,可以通过RDS克隆实例功能实现数据修复。 需求场景 克隆实例的数据恢复方式分为如下两种: 按时间点恢复:将数据恢复到指定时间点的数据快照(精确到秒),适合误操作后的数据恢复场景,恢复过程包含全量恢复和增量恢复。
您可在平台上传SFT数据集时,添加辅助性质的自定义业务字段—— 该客服对话案例中,在 prompt / response 基本字段之外,我们为每条样本附带添加了 cls (每个样本对应的场景类别:“售前”、“售中”、“售后”),以及 intent (每个样本对应的“意图”) 两个自定义业务字段,有助于在数据洞察环节为我们提供更多的样本信息。
数据填报编辑 数据填报的编辑页面 数据填报的编辑页面主要分为三个区域: 顶部工具栏:在这里您可以添加新的表单项,并对数据填报进行保存、预览等操作,也可以通过左边的按钮进行撤销、重做和复制。 右侧控制面板:在没有选中表单项的时候,这里可以对数据填报本身的配置进行调整;选中某个表单项的时候,这里可以对这个表单项的宽度、样式、数据等进行配置。控制面板也可以默认收起或调整宽度。
数据增强 什么是数据增强 平台支持对 模型输入的文本数据集 进行数据增强。 当在实践中无法收集到数目庞大的高质量数据时,可以通过数据增强策略,对数据本身进行一定程度的扰动和扩充,从而产生 新 数据。在训练时会通过学习大量的 新 数据,提高模型的泛化能力。 注意文本数据增强功能仅支持增强已发布或未发布的非空数据集 。
面向post-pretrain场景的数据清洗 登录到 本平台 ,在左侧功能列数据处理中选择 数据清洗 ,进入数据清洗的主任务界面,整体流程如下: 1.选择数据集 在数据处理-数据清洗页面中,选择“创建任务”。 处理前数据集:存放被清洗的泛文本源数据。 处理后数据集:存放清洗后的数据。
3 添加计算字段 若需要在提问中对已有维度和度量之外的字段进行提问,则需要在数据模型中根据新字段的计算逻辑点击「新增计算维度」或者「新增计算度量」添加相应计算字段,否则可能会导致大模型因无法直接识别和分析未知的维度或度量,而返回不够准确的结果。
每个 Bucket 最多可添加并绑定 20 个不同的自定义域名。
配置数据校验 本文介绍如何使用数据传输服务 DTS 配置数据校验任务,帮助您在不停服的情况下对源端和目标端的差异数据进行校验和检查,以便及时发现数据不一致的问题。 前提条件 仅支持对源端和目标端在同地域的迁移任务发起数据校验。 数据传输任务进度为 复制变更 。 说明 建议在任务延迟为 0 秒时进行数据校验,否则可能会出现数据不一致误报情况。