登录/注册 个人中心 消息中心 退出登录 1 花费76.42利用预置数据集对【对话引擎方案】复现(包括SFT,发布,及预测) 大模型开发 / 技术交流 大模型实训营 2023.11.25 4860 看过 使用的是数据集管理中的预置数据集: FinCUGE_FinESE。 它是金融事件主体抽取数据集,该数据集包含11752条数据,验证集包含1464条数据。 该数据集的目的是从新闻预料中。
写入数据源的写权限要求 三种数据写入位置所需要的数据库相关的写权限请对照下表 数据写入位置 更新数据权限 插入数据权限 清空表权限 删除数据权限 新建表权限 新建字段权限 写回至原表 需要 - - - - 当字段写入位置 为 新建字段 时需要 新建表 - 需要 数据写入位置 为 覆盖 时需要 数据写入位置 为 追加 ,导出频率为 定时导出 ,则在使用重跑时需要 需要 - 选择已有表 - 需要 数据写入位置
数据绑定 如展示各个「省份」的「销售额」情况: 还可以用散点的「大小」来表示数据的大小,如将「利润」拖入到散点大小中: 还可以设置散点的系列,并在高级设置中设置每个系列的形状: Tooltip 附加数据绑定 在散点图中除了可以展示颜色映射数据、散点大小映射数据和系列数据,还可以在 Tooltip 悬浮窗中展示一些附加数据: 经纬度数据 在定位散点时是需要使用到地点的经纬度数据的,默认情况下,Sugar
数据表:单选,可选择已创建的数据表 或 示例数据表。 X轴:单选,适用于离散的类目数据,不太适用于时间序列的数据。 Y轴:多选,可选择number类型的数据。 示例数据 新建静态数据,选择CSV格式,复制下面这段内容到CSV文本输入框中: 城市,温度,空气质量 北京,33,25 上海,35,38 广州,26,25
当流水线处于“运行“状态时 “输入数据“:表示数据源的原始数据; “输出数据“:表示整条流水线执行完毕的最终输出数据(不含红色错误节点和灰色不生效节点)。
数据绑定 下面介绍使用 SQL 方式绑定数据时的配置: SQL 查出来的结果应该是如下格式的,一列数据是省市名称,一列数据是对应的取值: 取值 名称 80 上海 117 河南 112 香港 在控制面板中选取对应的字段: 在区域色彩层中除了可以展示颜色映射数据,还可以在 Tooltip 悬浮窗中展示一些附加数据,通过在「数据」->「添加在 Tooltip 中显示的附加数据项」配置中进行设置: 高级设置
数据格式要求 必须存在一列数据类型为 日期 的字段 除 日期 字段外,其他的每个字段表示一个指标(如 PV、UV 等) 注意: SQL语句查询出来的数据必须是多天的,并且包含了对应日期的数据 (如要计算 日环比 ,SQL 查询结果就必须包含了目标日期的前一天数据, 周同比 也是类似需要 SQL 查询的数据中有对应的上周同天的数据) 一般情况下 SQL 的建模类似如下: 数据展示配置 需要以下配置,如下图
群机器人:将定时推送和数据预警的消息按照用户的配置发送到指定 IM 群中,包括如流、企业微信、钉钉、飞书和自定义群通知,帮助企业用户监控数据。 支持百度 DAMP 数据源:支持百度数据资产管理平台 DAMP 作为数据源,进行数据可视化,便利企业级用户。 数据模型支持对接 mongoDB 数据源。 开放图表级别的图片 API。
请确认模型可以查出有效数据,否则会导致训练错误,单个数据模型中的数据列数如超过 100 列,需拆分为多个模型进行训练。 同义词配置 在问答的过程中,我们默认使用数据字段的「物理字段名称」以及「数据模型中的显示名称」来匹配数据字段,如果您需要通过更多的说法来对数据字段进行匹配,可以对数据字段配置同义词,配置的位置在数据模型的编辑页面中: 对每个数据字段可配置至多 10 个同义词。
搜索时重新拉取数据 使用场景:单选组件在绑定数据时,是有数据行数的限制的(默认 1 万行),当您的数据比较多,超过几万甚至几十上百万时(例如电商场景的商家名称、商品名称等),这时单选组件就没办法一次性展示所有的数据选项,因此我们推荐使用「搜索时重新拉取数据」功能,在单选下拉组件中进行「搜索」操作时,系统自动的根据您输入的搜索词,进行再次的匹配和拉取新的列表数据,这样就能很好的解决海量数据的动态加载问题