每一组数据值映射由「原始值」和「映射值」组成,其中: 原始值对应的是数据库中不友好的代号等需要被映射的值 映射值对应的就是最终需要显示给用户的值 这里可以手动输入或者导入本地的 Excel 文件: 也可以使用数据模型来绑定数据值映射的本身数据: 当然,新建的数据值映射也可以再次编辑进行更改,或者删除。 SQL 模型中使用数据值映射 通过配置数据值映射就可以做到将数据中需要映射的值进行转换。
数据模型中使用数据值映射 在数据模型的编辑页面中,在对应的维度字段上鼠标「右键」,即可如下图来绑定值映射,之后在图表中展示时,都会自动展示映射后的数据。
制作数据填报 创建数据填报并进入编辑 在空间工作台中左侧导航的「数据填报」可以进入到数据填报的管理页面,点击新建数据填报页面,设置好数据填报的名称以及新建的数据表名称(注意数据表名称只能是小写字母或下划线开头,可以包含数字): 之后会进入到新建的报表页面,并自动进入页面「编辑」状态。
前期数据准备 数据模型的准备 设置中文别名 数据库中存放的字段可能是英文的,在数据模型的编辑页面,直接使用原始数据表即直接使用英文字段,若不对其进行处理,在使用智能问数功能时,大模型无法将您的中文自然语言与英文字段进行对应,也就无法给出令人满意的答案。所以我们需要在数据模型的编辑页面将字段名称设置为可读性较高的中文别名。
Insert 语句前生成 Truncate (仅在 导出内容 为 数据 时可选):在每个插入数据的 SQL 语句之前自动生成相应表的 TRUNCATE 语句,保证每次导入数据之前,清空表中所有数据,避免数据重复插入的问题。
什么是数据洞察 1. 如何理解数据洞察与处理 在大语言模型的精调领域,数据准备占据着至关重要的作用。贴合业务精调目标的高质量SFT数据集,可有效提升大语言模型的训练效率及效果表现。 SFT数据集评价标准 什么是一份好的SFT数据集?以下列举了一些经过验证的实践经验: 精调数据最好来自于业务场景的真实调用数据,样本分布情况相近,从而让大模型更好的参考学习。
除这些预留字段外,Prompt+Response数据集还额外支持您在数据中扩展自定义业务字段,为数据集样本附加多维度元信息,例如实际业务指标、终端用户反馈和分类标签,可在数据准备过程中指导您更好地进行数据洞察与处理。
分享链接导入 输入链接地址导入:压缩包(请确保将全部数据文件保存至同一压缩包)。 平台已有数据集 仅支持选择未发布的数据集版本。 以上所有步骤完成后,即可导入数据至数据集。
日期时间格式化设置 如果当前维度字段类型为日期、日期时间、时间戳时,可以通过对当前维度字段进行日期时间数据聚合的设置,如图将数据进行聚合或者时间格式的调整: 可以通过选择需要转换的日期类型将数据进行聚合或者日期格式的调整: 日期类型说明 年:根据筛选数据时间的「年份」进行数据的聚合 年-季度:根据筛选数据时间按照当前「年份的季度」进行聚合 年-月:根据筛选数据时间按照当前「年份的月份」进行聚合 年-
数据填报操作指导 介绍Sugar BI产品中如何应用数据填报功能。